Optimierung des Modells

Vorschau

Die Erstellung eines geeigneten Modells ist keine triviale Aufgabe, oft scheitert die Qualität jedoch an einfachen Dingen. Im Folgenden soll auf einfache Prinzipien des Trainings eingegangen werden, um ein Modell der Diagnostik von quantitativen analytischen Daten zu optimieren.

Qualität der Trainingsdaten

Wie bereits im Kapitel Konfiguration des Modells angemerkt ist die Anzahl und Qualität der Trainingsdatensätze ein wesentlicher Faktor für die Güte des erstellten Modells. Generell gilt, je mehr Daten desto besser. Bei der Auswahl der Daten ist darauf zu achten, dass die Messwerte nicht zu „optimal“ sind. Wenn wir bei unserem Beispiel der Getränke bleiben, z.B. dem Zuckergehalt der Cola, ist auf eine möglichst zufällige Verteilung von Messdaten zu achten.

Nehmen wir an Cola hat einen Zuckergehalt, dessen Spezifikation 8.5 bis 9.5 Prozent umfasst. Es wäre also nicht sinnvoll das Training des Modells mit Daten ausschließlich von 9.0 bis 9.1 zu trainieren, vielmehr brauchen wir eine natürliche Streuung um den Zielwert von z.B. 9.0 herum.

Die Anzahl der charakteristischen Merkmale für ein Muster sind ebenfalls entscheidend für ein erfolgreiches Training. Nehmen wir an Cola würde ausschließlich über den Zuckergehalt erkannt, in diesem Fall macht ein Training zur Mustererkennung keinen Sinn. Vielmehr wäre hierbei die Entscheidung auf Basis von Grenzwerten sinnvoller. Es ist also entscheidend möglichst viele Kenndaten zur Interpretation zu Rate zu ziehen. ANNA bietet in diesem Fall sowohl Mustererkennung, als auch Entscheidungen nach Spezifikation an, dazu aber später mehr.

Neben der Anzahl und zufälligen Verteilung von Messdaten, ist auch eine Gleichverteilung der Kategorien notwendig. So ist es nicht zielführend 100 Trainingssätze für das Getränk Cola bereitzustellen, jedoch nur 10 für eine Limo. Im optimalen Fall liegen alle Kategorien in gleicher Anzahl vor.

Die Auswahl geeigneter Daten ist folglich keine leichte Aufgabe und sollte mit größter Sorgfalt erfolgen.

Größe des Netzwerks

Die Größe eines Netzwerks ist der zu lösenden Aufgabe entsprechend zu dimensionieren. Wer würde seinen Hund schon mit Differentialrechnung trainieren wollen und Ergebnisse erwarten? Welcher Mensch würde seine Erfüllung mit dem Unterscheiden von Hunde- und Katzenbildern finden?

Auch wenn dieses Beispiel sehr plakativ wirkt, ist es doch bezeichnend wie künstliche neuronale Netze auf ein Training reagieren. Bei einem Netzwerk, mit sehr vielen Ebenen und Knoten und wenigen Trainingssätzen, wird die Qualität erwartungsgemäß gering sein. Die Diagnose wird ungeahnte Kreativität zeigen und Entscheidungen wenig nachvollziehbar erscheinen lassen. Bei kleinen Netzwerken und vielen Trainingssätzen werden Ergebnisse wie auswendig gelernt wirken.

Die Wahl der richtigen Größe ist Erfahrungssache und sollte ausprobiert werden, dabei werden Ebenen und Knoten schrittweise erhöht. Die Knoten sollten mindestens 60% der Merkmale umfassen. Wenn also 10 verschiedene Merkmale trainiert werden sind mindestens 6 Knoten zu empfehlen.

Zurück zu: Machine Learning Diagnostik > 020 Training des neuronalen Netzwerks