Beim Machine Learning geht es darum, dass Computer Muster erkennen und Regeln erlernen. Statt nur auf die Eingabe eines menschlichen Nutzers reagieren zu können, sollen Maschinen so in der Lage sein, selbstständig Entscheidungen zu treffen – basierend auf den Regeln, die sie gelernt haben. So können Algorithmen beispielsweise lernen, Spam korrekt zu erkennen, oder einen Bildinhalt verstehen. Für das Anlernen verwenden Entwickler und Wissenschaftler verschiedene Methoden. Wahrscheinlich am häufigsten im Einsatz ist Supervised Learning, also das überwachte Lernen.
Beim Supervised Machine Learning stellen Entwickler den Algorithmen ein vorbereitetes Set an Daten als Trainingsquelle zur Verfügung. Das Ergebnis ist somit bereits bekannt. Die Aufgabe der Algorithmen liegt nur darin, das Muster zu erkennen: Warum gehört diese Information in Kategorie A und nicht in Kategorie B?
Überwachtes Lernen wird also für solche Algorithmen eingesetzt, die natürliche Daten (Fotos, Handschriften, Sprache usw.) kategorisieren sollen. Zudem sind auch sogenannte Regressionsprobleme ein typisches Anwendungsfeld für Supervised Learning. Hierbei sollen die Algorithmen Vorhersagen treffen können, beispielsweise über Preisentwicklungen oder Kundenwachstum.
Eine Mischform stellt Semi-supervised Learning dar. Bei dieser Lernmethode wird nur ein Teil des Datensatzes mit Labeln versehen. Der Rest bleibt unkategorisiert und soll von den Algorithmen selbstständig zugeordnet werden. Ein Beispiel hierfür findet man bei der Gesichtserkennung von Facebook. Es reicht aus, ein paar Bilder mit den Namen von Freunden zu versehen. Die restlichen findet der Algorithmus dann von allein.