7. September 2023
Artikel von Anna Giron, Charley Wu

Lernen Menschen und Algorithmen auf die gleiche Weise?

Wenn Kinder erwachsen werden, ändert sich die Art und Weise, wie sie lernen, erheblich. Kinder handeln oft ohne erkennbare Absicht, Erwachsene zielgerichteter. Laut einer einflussreichen Theorie verhalten sich Optimierungsalgorithmen, die häufig bei maschinellem Lernen eingesetzt werden, ähnlich. Die nachfolgende empirische Untersuchung zeigt verblüffende Parallelen, aber auch gravierende Unterschiede zwischen menschlichem und maschinellem Lernen.

Kinder lernen erstaunlich gut und beherrschen neue Sprachen oder neue Fähigkeiten schneller als Erwachsene. Andererseits verbringen sie auch gerne einmal eine halbe Stunde damit, sich die Schuhe zu binden oder brechen mitten im Satz ab, um einem vorbeifliegenden Schmetterling nachzujagen.

1950 machte der berühmte Informatiker Alan Turing einen (für damalige Verhältnisse) revolutionären Vorschlag: „Warum entwickeln wir nicht ein Programm, das die Denkmuster eines Kindes simuliert, statt die eines Erwachsenen?“ Zweifellos dachte Turing dabei nicht an eine künstliche Intelligenz, die sich von Schmetterlingen ablenken lässt, sondern an eine, die so effizient und effektiv lernt wie Kinder.

Aber was ist so einzigartig am Lernprozess von Kindern? Und wie ändert sich die Art und Weise, wie wir lernen, wenn wir älter werden?

Wie Kinder lernen und wie Erwachsene lernen

Die menschliche Entwicklung – der Prozess des Heranwachsens vom Kind zum Erwachsenen – ist im Universum einzigartig. Sie ist der einzig bekannte Vorgang, bei der sich Intelligenz auf menschlichem Niveau herausbildet. Seit Jahrzehnten erforschen Wissenschaftler*innen sowohl im Bereich der menschlichen als auch der künstlichen Intelligenz, inwiefern die Entwicklung beeinflusst, wie wir uns Wissen aneignen und uns unserer Umwelt anpassen.

Eine richtungsweisende Theorie dazu stammt von der Wissenschaftlerin Alison Gopnik von der University of California, Berkeley, aus dem Jahr 2017. Sie vergleicht das Älterwerden mit einem Stück Metall, das erhitzt und geschmiedet wird. Wenn es heiß ist, lässt sich Metall leicht formen – so wie Kinder sich flexibel an neue Situationen anpassen und neue Fähigkeiten erwerben können. Im Laufe der Zeit jedoch kühlt das Metall ab, wird starr und spröde und verändert seine Form nicht mehr.

Diese Metapher ist Informatiker*innen und Forscher*innen im Bereich maschinelles Lernen bekannt, da sie eine zentrale Komponente der meisten KI-Systeme beschreibt. Stochastische Optimierung beruht auf denselben Prinzipien und spielte eine entscheidende Rolle in der Entwicklung von Deep-Learning-Methoden.

Neuronale Netze und andere KI-Systeme wissen zunächst nichts über die Welt und machen viele Fehler. Um die Leistung zu verbessern, müssen die Parameter des Modells schrittweise angepasst werden. Den Raum aus allen möglichen Parameterkombinationen kann man sich wie eine hügelige Landschaft vorstellen, in der es gilt, den niedrigsten Hügel (den kleinstmöglichen Fehler) zu finden. Anfangs passt der Algorithmus die Parameter sehr großzügig an. Er hüpft beim Erkunden der Optimierungslandschaft hektisch auf und ab wie ein Tennisball und berücksichtigt wahrscheinlich auch schlechtere Lösungen. Mit der Zeit kühlt sich der Algorithmus jedoch ab. Dabei wird er immer ehrgeiziger und wählt nur noch Lösungen aus, die zu Verbesserungen führen – wie eine Bowlingkugel, deren Laufbahn relativ vorhersagbar ist. Der Übergang vom Tennisball zur Bowlingkugel entspricht dem Abkühlen des Optimierungsalgorithmus.

Die Metapher auf dem Prüfstand

Obwohl stochastische Optimierung in der Entwicklungspsychologie schon seit vielen Jahren als Analogie dient, gibt es bislang kaum wissenschaftliche Befunde, die diese Theorie stützen. Auch herrscht Uneinigkeit über die Interpretation der Analogie. Die naheliegendste wäre, das Älterwerden als allmählichen Rückgang zufälligen Verhaltens zu begreifen. Aber verhalten sich Kinder einfach weniger zielgerichtet als Erwachsene? Und warum können sie dadurch so effizient lernen?

Wir beschlossen, der Sache auf den Grund zu gehen und die Analogie zwischen menschlicher Entwicklung und stochastischer Optimierung wissenschaftlich zu untersuchen. Dazu ließen wir 281 Probanden zwischen 5 und 55 Jahren ein sehr intuitives Spiel spielen, bei dem sie auf einem Raster Belohnungen suchen und Punkte sammeln mussten.

Abbildung 1. Experiment. Die Teilnehmer*innen klicken auf dem Raster Kacheln an und erhalten Punkte. Zu Beginn ist nur eine zufällig ausgewählte Kachel aufgedeckt und die Teilnehmer*innen haben insgesamt 25 Klicks. Hinter den angrenzenden Kacheln verbergen sich tendenziell ähnliche Belohnungen. Diese räumliche Belohnungsstruktur ermöglicht den Teilnehmer*innen eine effizientere Suche. Stellen Sie sich vor, Sie sind im Urlaub in einer neuen Stadt und wissen noch nicht, welche Stadtteile besonders sehenswert sind. Sobald Sie sich jedoch besser auskennen, können Sie vorhersagen, dass die schönen Ecken wahrscheinlich in der Nähe der Orte sind, an denen es Ihnen bereits gefallen hat.

Die drei Dimensionen des Lernens

Anschließend analysierten wir die Verhaltensmuster und erstellten für die Entscheidungen der Teilnehmer*innen entsprechende Berechnungsmodelle. Ähnliche Modelle verwendet man beispielsweise beim Training selbstfahrender Autos oder bei Spielen wie Go. In diesem Fall sollten sie uns allerdings Erkenntnisse über verschiedene psychologische Aspekte des Lernens liefern. Wir konzentrierten uns insbesondere auf drei Dimensionen des Lernens: Wie wir uns basierend auf früheren Erfahrungen an neue Situationen anpassen (Generalisierung), wie neugierig wir auf neue Situationen sind (Exploration) und wie zufällig wir Entscheidungen treffen.

 

Abbildung 2. Entwicklungsverlauf der menschlichen Teilnehmer (farbige Punkte) verglichen mit dem leistungsstärksten Optimierungsalgorithmus (krakelige blaue Linie).

Kinder verhalten sich nicht einfach zufällig

Entgegen der gängigsten Interpretation bedeutet Erwachsenwerden nicht nur, dass zielloses Verhalten abnimmt. Vielmehr ähnelt die Entwicklung offenbar einem Optimierungsprozess, der sich in allen von uns betrachteten Dimensionen des Lernens zeigt. Im Kindesalter beobachteten wir sprunghafte Veränderungen, weil verschiedene Lernstrategien erkundet und ausprobiert werden. Mit zunehmendem Alter stabilisieren sich die Parameter jedoch und pendeln sich bei effizienteren Kombinationen ein.

Erstmalig konnten wir den Entwicklungsverlauf des Menschen (wie sich die drei Dimensionen des Lernens im Laufe des Lebens verändern) im direkten Vergleich mit verschiedenen Optimierungsalgorithmen betrachten. Anhand derselben, oben beschriebenen, Aufgabe passten die Algorithmen die Parameter des Lernens über mehrere Iterationen hinweg an. Wie die Ergebnisse in Abbildung 2 zeigen, kam dabei der Algorithmus mit der besten Leistung, d. h. der höchsten Belohnung, dem menschlichen Entwicklungsprozess am nächsten.

Die bemerkenswerte Effizienz menschlichen Lernens

Die menschlichen von den algorithmischen Entwicklungsverläufen unterschieden sich darin, auf welche Lösung sie sich einpendelten. Letztendlich war jedoch kein Optimierungsalgorithmus zuverlässig besser als ein erwachsener Mensch, was für eine bemerkenswerte Effizienz der menschlichen Entwicklung spricht.

Die Unterschiede zwischen den menschlichen und den algorithmischen Entwicklungsverläufen sind auch deshalb sehr spannend, weil sie uns Einblicke in den Kosten-Nutzen-Aufwand menschlichen Lernens geben. Wie ein*e Langstreckenläufer*in oder ein energieeffizientes Küchengerät optimieren wir nicht einfach nur auf maximale Leistung, sondern achten auch auf die Kosten. Manche Lernstrategien erfordern einen höheren Rechenaufwand, und die Unterschiede zwischen den menschlichen und den algorithmischen Daten geben Aufschluss über die Art dieses Aufwands.

Ein Einblick in Entwicklungsstörungen und die Psychiatrie

Diese Forschungsarbeit birgt außerdem wichtige Implikationen dafür, inwiefern das Umfeld, in dem Kinder aufwachsen, möglicherweise zu Entwicklungsstörungen und psychiatrischen Erkrankungen beiträgt. Eine Diskrepanz zwischen der Umgebung, für die Kinder ihr Verhalten optimieren, und der Erwachsenenwelt, in der sie später leben, kann Verhaltensstörungen begünstigen. Kinder, die in Armut oder in einem Flüchtlingslager aufwachsen, optimieren beispielsweise für ein Umfeld, das von Mangel und Instabilität geprägt ist. Daraus können sich Konsequenzen für das Erwachsenenalter ergeben, zum Beispiel wenn Kinder nicht die Möglichkeit hatten, auf langfristige Ziele hinzuarbeiten oder nicht lernen konnten, sich über längere Zeiträume zu konzentrieren.

Fazit

Unsere Arbeit zeigt: Maschinelles Lernen dient nicht nur als Analogie – man kann damit auch Theorien zur menschlichen Entwicklung überprüfen und dabei Erkenntnisse über mögliche Ursachen für Entwicklungsstörungen und psychiatrische Erkrankungen gewinnen.

 

Originalpublikation:

Anna P. Giron, Simon Ciranka, Eric Schulz, Wouter van den Bos, Azzurra Ruggeri, Björn Meder & Charley M. Wu, Developmental Changes in Exploration Resemble Stochastic Optimization, Nat Hum Behav (2023)

Titelillustration: Franz-Georg Stämmele
Übersetzung ins Deutsche: Fortuna Communication