Wie wird ein Mensch zum Mensch? Wie eignet sich ein neugeborenes Baby – das nichts weiß – all das Wissen an, um später einmal zu sprechen, sich zu bewegen, zu rechnen, Raketen zu bauen oder Kunstwerke zu erschaffen?
Ganz einfach: Es probiert aus, schaut sich das Ergebnis an, entscheidet, ob sich etwas verbessert hat und passt sein Verhalten dementsprechend an, um es beim nächsten Mal besser zu machen.
Okay, so einfach ist das garnicht. Und nur durch Ausprobieren lernt der Mensch auch nicht. Das wäre ja eine Beleidigung aller Lehrer, Dozenten und Ausbilder.
Aber das Grundprinzip stimmt.
Und weil das stimmt, weil also Menschen sich so Intelligenz aneignen, haben KI-Experten dieses Prinzip übernommen – und nennen es „Reinforcement Learning“, zu Deutsch „bestärktes Lernen“. Mit dem Ziel, Computer, Maschinen oder Roboter intelligent zu machen. Künstlich intelligent. Das ultimative Ziel: die Allgemeine Künstliche Intelligenz (AKI). Sozusagen der heilige Gral der KI-Forschung.
Denn während herkömmliche KI-Systeme es sehr gut schaffen, mit Hilfe von viel Daten bestimmte Probleme zu lösen, scheitern sie, sobald sie auf etwas Unbekanntes stoßen. Solche KI-System könnte man als Fachidioten bezeichnen. Allgemeine Künstliche Intelligenz hingegen sollte in der Lage sein, für unterschiedliche Aufgabenstellungen eigenständig Lösungen zu finden und anzuwenden. Ohne vorher Daten zu analysieren. Weil es die Daten zum Beispiel erstmal nicht gibt.
Ich sage ganz bewusst „sollte in der Lage sein“. Denn noch ist es nicht soweit. Fragt man Experten, wann es denn soweit sein wird mit der AKI, kommen Antworten wie: „In ein paar Tagen“, „Wird noch eine Weile dauern“, „Nie“ oder „Um Himmels Willen, das wird das Ende der Menschheit sein“.
Es sieht auf jeden Fall so aus, als ob Reinforcement Learning eine wichtige Rolle spielen wird. Beziehungsweise das bereits tut. Wie genau das funktioniert, soll hier nicht erklärt werden, Informationen dazu gibt es genug im Internet.
Das Prinzip habe ich ja erklärt. Es gibt ein Ziel, das erreicht werden soll. Oder ein Problem, das gelöst werden soll. Und es gibt ein paar Regeln, die eingehalten werden müssen. Oder ein paar Aktionen, die möglich sind, um das Ziel zu erreichen – mehr nicht. Alles andere muss sich ein Computer selbst erarbeiten. Indem er einfach Aktionen ausprobiert und anschließend überprüft, ob er dadurch dem Ziel näher gekommen ist. So lernt er nach und nach.
Klingt banal, führt aber zu bemerkenswerten Ergebnissen. So setzte Google zum Beispiel die Methode ein, um die Steuerung der Klimaanlage in den Rechenzentren zu optimieren. Das Ergebnis: Die zur Kühlung der Server notwendige Energie sank um rund 40 Prozent.
Alpha Go, eine Entwicklung der Google-Tochterfirma DeepMind, besiegte dank Reinforcement Learning die besten Go-Spieler der Welt – was Experten für unmöglich hielten.
Reinforcement Learning ist die Schlüsselmethode um Autos autonom fahren zu lassen. Und so weiter, und so weiter. Wie gesagt, alles stets, ohne dass ein Computer vorher Daten bekommt, die ihm den Weg zur Lösung des Problems geben. Diese Daten muss sich ein Computer bei Reinforcement Learning selbst erarbeiten. Und das funktioniert tatsächlich.
Also hat Consultant recht? Bald werden dadurch Roboter zu Menschen? Nun, solange Menschen die Menschwerdung nicht verstanden haben – allen voran, wie genau das menschliche Gehirn funktioniert (darum geht es ja im Grunde) – sind solche Prophezeiungen nichts anderes als eben … Prophezeiungen. Wir werden sehen ...
Odan Jaeger/Freeimages