Prinzip des Machine Learning

Vorschau

Im Gegensatz zur klassischen Vorgehensweise in der Programmierung, bei der die Verarbeitung durch Menschen komplett programmiert werden muss, beruht Machine Learning darauf, dass das Wissen des Menschen computergerecht aufbereitet in den Computer übertragen wird und dass der Computer eigene Schlussfolgerungen aus diesem Wissen ziehen kann. Dieses Prinzip nennt man in der künstlichen Intelligenz (KI) wissensbasierte Verarbeitung. Man spricht auch von einem symbolischen Ansatz. Während bei der klassischen Systementwicklung der Programmierer der „Flaschenhals“ ist, weil viel Entwicklungsbedarf und eine aufwendige Adaption an neue Gegebenheiten entstehen können, zeichnen sich wissensbasierte Systeme durch eine gute Erklärungsfähigkeit aus. Dabei kommt es auf eine klare Trennung an, zwischen der Repräsentation des Wissens, das für die betrachtete Anwendungsdomäne spezifisch ist, und der „Maschinerie“ zur Verarbeitung dieses Wissens im Hinblick auf die Problemlösung. An dieser Stelle soll kurz auf zwei prominente Ansätze, nämlich Systeme zu regelbasiertem und zu erfahrungsbasiertem Problemlösen eingegangen werden.

Regelbasierte Systeme

Bei regelbasierten Systemen steht die konkrete Repräsentation von generischem Wissen und dessen Verarbeitung im Vordergrund. Zudem charakterisieren sie sich durch eine klare Trennung zwischen Repräsentation und Verarbeitung von Wissen. Ein regelbasiertes System besteht aus aus einer Wissensbasis und einer Inferenzmaschine. Während die Wissensbasis die Datenbasis bzw. Faktenbasis und die Regelbasis beinhaltet, steuert die Inferenzmaschine durch Anwendung von Regeln die Ableitung neuer Fakten für die Wissensbasis. Regeln bestehen aus Prämissen (Wenn gefunden wird) und aus Konklusionen (Dann tue das).

Ein möglicher „Flaschenhals“ ist hierbei die Definition der Regeln, die ein tiefes Domänenwissen erfordert, und andererseits die Entwicklung von Metaregeln für den Fall, dass mehrere Regeln anwendbar sind oder sich gar widersprechen. Die in den 1980er-Jahren populär gewordenen Expertensysteme sind prominente Beispiele für diesen rein wissensbasierten KI-Ansatz, die durchaus kommerzielle Erfolge aufweisen können. Dennoch wurden die Beschränkungen auch schnell deutlich: Der manuelle Aufbau und die Pflege der Wissensbasen stellen einen limitierenden und kostentreibenden Faktor dar.

Fallbasierte Systeme

Bei fallbasierten Systemen verwendet man Case-based Reasoning (fallbasiertes Schließen), ein Problemlösungsparadigma, das auf der Wiederverwendung von Erfahrungen zur Lösung neuer Probleme basiert. Dieses Wissen bezieht sich auf konkrete Beispiele bzw. Fälle, die die gemachten Erfahrungen widerspiegeln. Die Methodik baut auf Analogien auf und beruht auf der Annahme, dass ähnliche Probleme ähnliche Lösungen haben. Denken Sie an medizinische Anwendungen, wie Anomalien in Röntgenbildern zu erkennen. Das Case-based Reasoning (CBR) folgt dem Paradigma:

  • Retrieve: Es wird nachgeschaut ob ein Problem schon mit einer vorhandenen Lösung gelöst werden kann
  • Reuse: Die Lösungsansätze und Algorithmen, die zu einer Lösung geführt haben, werden wiederverwendet
  • Revise: Gefundene Lösungen werden angepasst und verbessert
  • Retain: Die beste Lösung wird gespeichert

Ein weit verbreiteter Ansatz ist das Maschinelle Lernen (ML), ein Gebiet der Künstlichen Intelligenz, das in den letzten Jahren nicht zuletzt durch die Erfolge des Deep Learning sehr populär geworden ist. Die Grundidee des ML ist es aus Beispielen Regelmäßigkeiten, Muster oder Modelle zu extrahieren (lernen), mit deren Hilfe man neue Daten klassifizieren oder künftige Werte vorhersagen kann. KI-Systeme, die auf ML basieren, werden empirisch mithilfe von Beispielen bzw. Daten trainiert. Man spricht auch von einem subsymbolischen Ansatz. Nach Beendigung dieser Lernphase entstehen Modelle, die die bisher gesehenen Beispiele durch Erkennung von Mustern, Beziehungen und Regelmäßigkeiten in den vorliegenden Daten verallgemeinern, sodass unbekannte Daten korrekt verarbeitet werden können. Dadurch werden neue Problemlösungen eigenständig gefunden.

Es existieren viele ML-Verfahren, in diesem Kurs legen wir unser Augenmerk auf das Deep Learning, eine Spezialform des maschinellen Lernens, die wiederum ein Teilgebiet der Künstlichen Intelligenz ist. Deep Learning basiert auf sogenannten künstlichen neuronalen Netzen, die im folgenden ausführlich vorgestellt werden. Das Adjektiv „Deep“ ergibt sich daraus, dass der zugrundeliegende Lernprozess mithilfe von tiefen (mehrschichtigen) neuronalen Netzen erfolgt.

Deep Learning

Die Vorgehensweise bei allen Machine- und Deep-Learning-Projekten ist im Prinzip gleich und soll im Folgenden kurz dargestellt werden.

  • Als erstes werden Daten zum Training des neuronalen Netzwerks benötig, um ein Modell (trainiertes Netzwerk) zu erstellen. Die Daten müssen dabei die zu erlernenden Muster in ausreichender Güte repräsentieren.
  • Nicht verwertbare Formate müssen umgewandelt werden, z.B. CSV oder JSON.
  • Bei nicht ausreichenden Daten müssen Alternativen geprüft werden, z.B. eine Anreicherung mit synthetischen Daten.
  • Der Datenverarbeitungsprozess schließt mit einer finalen Analyse der Daten, etwa auf Integrität.
  • Im Anschluss erfolgt das Training des neuronalen Netzes.
  • Dann wird überprüft, ob das Modell hinreichend verwertbar ist, wenn nicht wird das Training wiederholt.
  • Hat man ein akzeptables Modell generiert, wird es angewandt und für künftige ähnliche Situationen herangezogen.
Zurück zu: Machine Learning Diagnostik > 020 Einleitung