Computational Principles of Intelligence

Die Max-Planck-Forschungsgruppe "Computational Principles of Intelligence" ist ein interdisziplinäres Team, das die formalen Grundlagen menschlichen Denkens und Handelns erforscht. Obwohl die derzeitigen Fortschritte in der künstlichen Intelligenz beachtlich sind, vom Schlagen des Weltmeisters im Strategiespiel "Go" bis zu selbstfahrenden Autos, gibt es dennoch keine Algorithmen, die wie wir Menschen universell Probleme lösen können. So können z.B. schon Kinder anhand von wenigen Beispielen lernen, wie man einfache Spiele spielt und suchen intelligent und neugierig nach Informationen, in einem Spiel besser zu werden. Welche Prinzipien unterliegen diesen und anderen adaptiven Verhaltensweisen?

Forschung

Unser Ziel ist es, die Regeln menschlichen Verhaltens mathematisch zu beschreiben, diese Regeln zu verwenden, um intelligentere Algorithmen zu kreieren und herauszufinden, was den Kern menschlicher Intelligenz ausmacht. Dafür bedienen wir uns diverser Methoden aus den Kognitions- und Neurowissenschaften, der Informatik und Mathematik, sowie der Allgemeinen und Entwicklungspsychologie. Unsere Experimente sind häufig komplexe, videospielähnliche Aufgaben, in denen wir formale Modelle in ihrer Beschreibungsgüte von menschlichem Verhalten testen. Insbesondere liegt unser Fokus hierbei auf den folgenden drei Forschungsthemen: 1. Generalisierung und effizientes Lernen, 2. Exploration und Neugier und 3. Heuristiken und adaptive Abkürzungen.

1. Generalisierung und effizientes Lernen

Im Vergleich zu den meisten Computeralgorithmen zeichnen Menschen sich vor allem durch effizientes Lernen aus. So können wir z.B. bereits nach wenigen Tagen in einer neuen Umgebung effizient unseren Weg zu verschiedenen Restaurants und Geschäften finden. Wir beschreiben dieses Verhalten mathematisch als eine Form von "Programmlernen", wobei man ein Computerprogramm durch Beobachtungen lernt und dieses dann auf neue Situationen übertragen kann. Dieser Ansatz hat z.B. zu einer Beschreibung von menschlicher Mustererkennung und Generalisierung geführt. Derzeit testen wir aus, wie Kinder Programme, wie z.B. die Bewegung von verschiedenen Videospielfiguren, lernen. In Zukunft wollen wir die neuronalen Grundlagen des Programmlernens erforschen.

2. Exploration und Neugier

Ein anderes Interesse unserer Forschungsgruppe ist es, menschliche Neugier und Explorationsverhalten besser zu verstehen. Während einfache Lernalgorithmen häufig passiv mit Daten gefüttert werden, können Menschen sich aktiv aussuchen, über welches Konzept oder Objekt sie gerne mehr erfahren würden. Wir modellieren menschliches Explorationsverhalten als ein aktives Aufsuchen von Unsicherheit. Das bedeutet, dass Menschen häufig über jene Dinge mehr erfahren wollen, über die sie im Moment am wenigsten wissen. Dies ist nicht nur intuitiv, sondern führt auch mathematisch zu erfolgreicher Exploration. In unseren vergangenen Studien konnten wir zeigen, dass Kinder solches Verhalten stärker zeigen als Erwachsene, dass unser Modell Einkaufsverhalten in einem Datensatz von 1.5. Millionen Restaurantbestellungen vorhersagen konnte und dass räumliche und konzeptionelle Exploration durch ähnliche Lernmechanismen gesteuert werden. Derzeit erforschen wir, inwiefern das Explorationsverhalten von Menschen mit Depressionen eingeschränkt ist und wie menschliche Neugier als eine Art von "Self-Empowerment". Damit meinen wir den Versuch, Dinge zu finden, die den Anreiz geben, weiterzusuchen. In Zukunft wollen wir ein komplettes Modell menschlicher Neugier in dem Online-Spiel Minecraft testen.

3. Heuristiken und adaptive Abkürzungen

Menschen sind unglaublich gut darin, mit begrenzten Ressourcen gute Lösungen für komplexe Probleme zu finden. Unsere Forschung zeigt, dass diese Art von Lernen als eine Annäherung verstanden werden kann, bei der Menschen Lösungen durch kleinere, stichprobenähnliche Simulationen approximieren, sowie strategisch bereits gelernte Lösungen auf derzeitige Problemen adaptieren. In Zukunft wollen wir ein Modell testen, das wie wir Menschen hierarchische Regeln lernen kann, insbesondere in einem Belohnungslernenkontext.

Zur Redakteursansicht