Computational Principles of Intelligence

Die Max Planck Forschungsgruppe "Computational Principles of Intelligence" ist ein interdisziplinäres Team, das die formalen Grundlagen menschlichen Denkens und Handelns erforscht. Obwohl die derzeitigen Fortschritte in der künstlichen Intelligenz beachtlich sind, vom Schlagen des Weltmeisters im Strategiespiel "Go" bis zu selbstfahrenden Autos, gibt es dennoch keine Algorithmen die wie Menschen universell Probleme lösen können. So können z.B. schon Kinder anhand von wenigen Beispielen lernen wie man einfache Spiele spielt und suchen intelligent und neugierig Informationen auf, die sie in einem gewünschten Spiel besser machen. Welche Prinzipien unterliegen diesem und anderem adaptivem Verhalten?

Forschung

Unser Ziel ist es, die Regeln menschlichen Verhaltens mathematisch zu beschreiben, diese Regeln zu benutzen um intelligentere Algorithmen zu kreieren und herauszufinden, was den Kern menschlicher Intelligenz ausmacht. Dafür bedienen wir uns diverser Methoden aus den Kognitions- und Neurowissenschaften, der Informatik und Mathematik, sowie der Allgemeinen und Entwicklungspsychologie. Unsere Experimente sind häufig komplexe, videospielaehnlihe Aufgaben, in denen wir formale Modelle in ihrer Beschreibungsgüte von menschlichem Verhalten testen. Insbesondere liegt unser Fokus hierbei auf den folgenden drei Forschungsthemen: 1. Generalisierung und effizientes Lernen, 2. Exploration und Neugier und 3. Heuristiken und adaptive Abkürzungen.

1. Generalisierung und effizientes Lernen

Im Vergleich zu den meisten Computealgorithmen zeichnen Menschen sich vor allem durch effizientes Lernen aus. So können wir z.B. bereits nach wenigen Tagen in einer neuen Umgebung effizient unseren Weg zu verschiedenen Restaurants und Einkaufsläden finden. Wir beschreiben dieses Verhalten mathematisch als eine Form von "Programlernen", wobei man ein Computerprogram durch Beobachtungen lernt und dieses dann auf neue Situationen übertragen kann. Dieser Ansatz hat z.B. zu einer Beschreibung von menschlicher Mustererkennung und Generalisierung geführt. Derzeit testen wir aus, wie Kinder Programme wie z.B. die Bewegung von verschiedenen Videospielfiguren lernen und in Zukunft wollen wir die neuronalen Grundlagen des Programmlernens erforschen.

2. Exploration und Neugier

Ein anderes Interesse unserer Forschungsgruppe ist es, menschliche Neugier und Explorationsverhalten besser zu verstehen. Während einfache Lernalgorithmen häufig passiv mit Daten gefüttert werden, können Menschen sich aktiv aussuchen über welches Konzept oder Objekt sie gerne mehr erfahren würden. Wir modellieren menschliches Explorationsverhalten als ein aktives Aufsuchen von Unsicherheit. Das bedeutet, dass Menschen häufig über jene Dinge mehr erfahren wollen über die sie im Moment am wenigsten wissen. Dies ist nicht nur intuitiv, sondern führt auch mathematisch zu erfolgreicher Exploration. In unseren vergangenen Studien konnten wir zeigen, dass Kinder solches Verhalten mehr zeigen als Erwachsene, dass unser Modell Einkaufsverhalten in einem Datensatz von 1.5. Millionen Restaurantbestellungen vorhersagen konnte und dass räumliche und konzeptionelle Exploration durch ähnliche Lernmechanismen gesteuert werden. Derzeit erforschen wir, inwiefern das Explorationsverhalten von Menschen mit Depressionen eingeschränkt ist und wie menschliche Neugier als eine Art von "Self-Empowerment", das heißt der Versuch Dinge zu finden, die einem befähigen noch mehr zu explorieren, beschrieben werden kann. In Zukunft wollen wir ein komplettes Modell menschlicher Neugier in dem Online-Spiel Minecraft testen.

3. Heuristiken und adaptive Abkürzungen

Menschen sind unglaublich gut darin, mit begrenzten Ressourcen gute Lösungen für komplexe Probleme zu finden. Unsere Forschung zeigt, dass diese Art von Lernen als eine Approximierung verstanden werden kann, bei der Menschen Lösungen durch kleinere, stichprobenähnliche Simulationen approximieren, sowie strategisch bereits gelernte Lösungen auf derzeitige Problemen adaptieren. In Zukunft wollen wir ein Modell testen, dass wie Menschen hierarchische Regeln lernen kann, insbesondere in einem Belohnungslernenkontext.

Zur Redakteursansicht