Bereitstellung von Messdaten

Vorschau

Die Bereitstellung von Messdaten erfolgt als CSV Datei. Damit eine Diagnose durchgeführt werden kann, wird die Datei in das Verzeichnis /e1/data/ abgelegt und erhält den Namen data.csv. Die Auswertung erfolgt automatisiert, im Anschluss wird die Datei gelöscht.

Die Struktur der Daten muss dem trainierten Modell gleichen, Abfolge und Aufbau sind in unserem Beispiel wie folgt zu wählen:

ID Zucker Transmission Rückstand Farbzahl
A 10,14588988 35,36494209 0,028630143 2
B 9,899019544 37,17853259 0,032116932 2
C 10,87947918 31,87674807 0,024558689 2
D 10,87730136 36,08385243 0,000453877 2

In der ersten Spalte befindet sich die Bezeichnung (ID) der zu diagnostizierenden Probe. Es handelt sich dabei um eine beliebige Abfolge von alphanumerischen Zeichen. Der Einfachheit halber wurden hier die Buchstaben A,B,C usw. gewählt. In den weiteren Spalten folgen die Messdaten, welche exakt die selbe Reihenfolge wie die des erstellten Modells haben. Wie bereits erwähnt werden die Messdaten als CSV Datei übergeben und haben dann folgende Struktur:

ID,Zucker,Transmission,Rückstand,Farbzahl
A,10.81567104,34.7438851,0.098281246,2
B,10.67116472,32.38431942,0.019032113,2
C,9.62558015,38.37176432,0.021491521,2

Sollten weitere Merkmale zur Interpretation mit aufgenommen werden, ist ein neues Modell zu trainieren und auch alle relevanten Konfigurationsdateien anzupassen. Sollte ein Fehler in den Daten vorliegen wird die Diagnose abgebrochen. Sollte eine Archivierung von Messdaten notwendig sein, so ist ein Unterverzeichnis in /e1/data/ anzulegen und eine Kopie der Datei zu erstellen. Die Ablage der Datei sollte über ein Skript außerhalb des Servers erfolgen, eine Anpassung der Datei /e1/worker.sh ist auch denkbar, führt jedoch gegebenenfalls zu Problemen bei automatisierten Updates.

Zurück zu: Machine Learning Diagnostik > 020 Diagnose von Messdaten