Reinforcement Learning: Bestärkendes Lernen einfach erklärt

Wörtlich übersetzt bedeutet Reinforcement Learning „be- bzw. verstärkendes Lernen“. Dieser Begriff beschreibt eine Methode im Bereich Machine Learning. Neben Supervised Learning und Unsupervised Learning stellt Reinforcement Learning die dritte Möglichkeit dar, Algorithmen so anzulernen, dass sie selbstständig Entscheidungen treffen können. Der Fokus liegt dabei auf der Entwicklung von intelligenten Lösungen für komplexe Steuerungsprobleme.

Bei dieser Möglichkeit des Machine Learnings werden im Gegensatz zum Supervised und Unsupervised Learning keine Daten zur Konditionierung benötigt. Bei den beiden genannten Methoden werden Programme zunächst mit Daten gespeist. Dieser Schritt entfällt beim Reinforcement Learning gänzlich. Stattdessen werden die Daten in einem Trial-and-Error-Verfahren während des Trainings generiert und gleichzeitig mit einem Label versehen. Dabei durchläuft das Programm etliche Trainingsdurchläufe innerhalb einer Simulationsumgebung, um ein entsprechend exaktes Ergebnis abzuliefern. Statt also beim Training das System mit den richtigen Ergebnissen zu konfrontieren (wie beim Supervised Learning), werden nur Impulse gesetzt, die das System unterstützen.

Das gewünschte Ergebnis dieses Trainings ist es, dass die künstliche Intelligenz ohne menschliches Vorwissen in der Lage ist, sehr komplexe Steuerungsprobleme autonom zu lösen. Im Vergleich zum konventionellen Engineering ist dies schneller, effizienter und liefert im idealen Fall auch das beste zu erwartende Ergebnis.

Die Erforschung von Reinforcement Learning findet dabei vielfach anhand von Spielen statt. Computerspiele bilden die perfekte Grundlage, um bestärkendes Lernen zu erforschen und zu verstehen. In Computerspielen sind generell eine Simulationsumgebung, verschiedene Möglichkeiten der Steuerung und auch eine Beeinflussung der Umgebung vorgegeben. Darüber hinaus bieten Spiele meist ein komplexes Problem, oder innerhalb der Spielabschnitte folgen komplexe Aufgaben, die es zu lösen gilt. In den meisten Spielen existieren zusätzlich Punktesysteme, die dem Belohnungssystem des Reinforcement Learnings sehr nahekommen.

Führende Forscher aus dem Bereich der künstlichen Intelligenz halten verstärkendes Lernen für eine sehr vielversprechende Methode zur Erreichung von Artificial General Intelligence. So wird es möglich sein, dass eine Maschine, ähnlich wie ein Mensch, irgendwann eigene rationale Entscheidungen treffen kann und somit jede beliebige Aufgabe erfolgreich absolvieren kann. Die Maschine beobachtet, lernt und kann anhand dessen Probleme eigenständig lösen.

Source link

Kommentar verfassen Kommentieren abbrechen