Lernansätze beim Machine Learning

Vorschau

Die Lernverfahren zur Erstellung von Machine-Learning-Modellen können entlang von zwei Dimensionen eingeordnet werden:

Lernmodus

  • Überwachtes Lernen (Supervised Learning)
  • Unüberwachtes Lernen (Unsupervised Learning)
  • Teilüberwachtes Lernen (Semi-supervised Learning)
  • Bestärktes Lernen (Reinforcement Learning)
  • Aktives Lernen (Active Learning)

Typ des zu lösenden Problems

  • Regression (Vorhersage von kontinuierlichen Werten)
  • Klassifikation (Einordnung von Daten)
  • Clustering (Gruppierung von Daten)

Für das Thema Labordiagnostik ist insbesondere das überwachte Lernen zur Klassifikation von Daten interessant. Aber bevor darauf genauer eingegangen wird, sollen die einzelnen Lernmodi und Typen kurz erläutert werden.

Supervised Learning

Beim Supervised Learning wird einem System vorgegeben, was es lernen soll, z.B. einen bestimmten Gegenstand oder Sachverhalt zu erkennen. Das kann die Identifikation einer Katze in einem Bild sein, einer Krebszelle in Mikroskopieaufnahmen oder eine bestimmte Regelmäßigkeit in einer Datenreihe. Charakteristisch bei diesem Lernmodus ist, dass die präsentierten Beispiele annotiert (gelabelt) sind, als Trainingspaare durch die Eingabe mit korrespondierender Ausgabe dargestellt sind. Konkret heißt das, dass für jede Eingabe die richtige Antwort vorliegt. Für eine Blutanalyse ist folglich die vom Arzt erstelle Diagnose bekannt. Ausgehend von diesen annotierten Beispielen soll nun ein Modell gelernt werden, dass automatisch für jede neue präsentierte Eingabe die möglichst korrekte Ausgabe liefert. Dabei wird zurückgemeldet, ob die Aufgabe richtig oder falsch bearbeitet wurde. Darüber hinaus wird quantifiziert, wie weit man danebenliegt, und dies dem System zurückgemeldet, damit es sich korrigieren und anpassen kann. Dieser Anpassungsprozess läuft solange, bis die Beispiele in akzeptabler Weise korrekt bearbeitet werden oder bis keine Veränderung mehr zu erwarten ist. Diese schrittweise Anpassung ist das eigentliche Lernen. In Abhängigkeit von den betrachteten Typen der Ein-/Ausgabepaare ergeben sich drei Aufgabentypen:

Regression

Bei Regressionsaufgaben werden kontinuierliche Were vorhergesagt, im Gegensatz zu den diskreten Werten der Klassifikationsaufgaben, die die zu erkennenden Klassen repräsentieren.

Klassifikation

Hier besteht die Aufgabe darin, die Klassenzugehörigkeiten von Beispielen vorherzusagen, also die Abbildung von Merkmalen in einen diskreten Wertebereich, der die Klassen bzw. Labels repräsentiert. Die besagten Klassen sind schon bei der Trainingsphase bekannt.

Zeitreihen

Bei Zeitreihen werden künftige Werte vorhergesagt, und zwar auf Basis von vergangenen Werten. Dabei wird die Historie der Zeitreihe analysiert und bestimmte Strukturen zur Trendvorhersage genutzt.

Unsupervised Learning

Beim Unsupervised Learning geht es darum, die vorhandenen Daten zu explorieren und die inhärent strukturellen Eigenschaften bzw. Ähnlichkeiten zu identifizieren. Dabei sind Beispiele nicht vorannotiert. Das System muss aus großen Mengen unstrukturierter Daten vorhandene Muster erkennen, um diese in homogene Gruppen bzw. Klassen einzuordnen. Dabei soll die Ähnlichkeit innerhalb der gefunden Gruppen maximiert und zwischen den Gruppen minimiert werden. Diese Technik zum Auffinden von Ähnlichkeitsgruppen in Daten nennt man Clustering.

Semi-supervised Learning

Das Semi-supervised Learning is eine Mischform aus dem Supervised und Unsupervised Learning. Es zeichnet sich durch eine gemischte Verwendung von gelabelten und nicht annotierten Daten aus.

Reinforcement Learning

Beim Reinforcement-Learning werden die richtigen Aktionen belohnt und die Falschen bestraft. Sehr beliebt ist das Reinforcement-Learning bei Spielen, wobei Spielzüge mit einem Score ausgewertet werden. Über eine Vielzahl von Zügen lernt das System dann ein präzises Modell zu erstellen. Ein besonders prominentes Beispiel ist AlphaGo, bei dem Google mit einem trainierten Modell gegen den amtierenden Weltmeister angetreten ist.

Zurück zu: Machine Learning Diagnostik > 020 Grundlagen