Vom Gehirn inspirierte Künstliche Intelligenz (KI) löst zentrale Aufgaben visueller Aufmerksamkeit
Die Leistung des menschlichen Gehirns, aus der Fülle von Informationen, die es ununterbrochen aufnimmt, die relevanten zu filtern, wird als Aufmerksamkeit bezeichnet. Wissenschaftler*innen des Forschungszentrums BIFOLD an der Technischen Universität Berlin haben nun in enger Zusammenarbeit mit Forscher*innen des „Kording Lab“ an der University of Pennsylvania (USA) ein vom Gehirn inspiriertes KI-Modell der visuellen Aufmerksamkeit vorgestellt. Besonders bemerkenswert ist, dass das Modell zahlreiche etablierte Verhaltens- und Wahrnehmungsphänomene der Psychologie und Neurophysiologie reproduziert, ohne dass sie explizit programmiert wurden. Dieses erweitert nicht nur das Verständnis der menschlichen visuellen Wahrnehmung, sondern bietet auch eine neue Perspektive und ein neues Rahmenwerk für KI-Forschende. Die gemeinsame Arbeit wurde nun in der Fachzeitschrift Nature Communications veröffentlicht.
Die Wissenschaftler*innen stellen einen neurowissenschaftlich inspirierten Ansatz vor, der gleich mehrere Formen der Aufmerksamkeit in einem einzigen Modell vereint: räumlich, objektbasiert und „feature-basiert“, also auf Eigenschaften bezogen. Die Arbeit adressiert damit eines der zentralen ungelösten Probleme der kognitiven Neurowissenschaft, das sogenannte Binding Problem: Menschliche Sinnesorgane nehmen ununterbrochen Informationen auf, weit mehr, als das Gehirn prozessieren kann. Dennoch können Menschen sich mühelos auf die Verbindung der wichtigsten Informationen konzentrieren: eine rote Ampel während der Fahrt, das Kind am Straßenrand oder ein Gespräch in einem sehr lauten Raum. Diese Fähigkeit wird als Aufmerksamkeit bezeichnet. Sie ermöglicht es dem Gehirn, aus einer Fülle von Informationen die relevanten Informationen auszuwählen oder auch verschiedene visuelle Merkmale zu einzelnen Objekten zu verbinden und so das Verhalten zu steuern. Doch wie das Gehirn die relevanten Informationen verarbeitet, ist noch nicht völlig geklärt.
KI reproduziert psycho-physikalische Effekte beim Menschen
„Das entwickelte Modell ist in der Lage, die charakteristischen Verhaltensweisen der menschlichen Aufmerksamkeit erfolgreich auszuführen: Orientierung, Filterung und visuelle Suche in komplexen visuellen Szenen“, erklärt Saeed Salehi, Wissenschaftler aus dem Team von BIFOLD Co-Direktor Prof. Dr. Klaus-Robert Müller. Das System meistert sowohl Erkennungs- und Unterteilungs-Aufgaben als auch klassische Aufmerksamkeitsleistungen wie Orientierung auf relevante Reize, Filterung störender Informationen und zielgerichtete Suche. In umfangreichen Experimenten demonstriert das Team, dass das Modell nicht nur Objekterkennung in komplexen Szenen verbessert, sondern auch psycho-physikalische Effekte wie die sogenannte Wahrnehmungsbelastung und die Aufmerksamkeitsblindheit repliziert. Die internen Einheiten des Modells entwickeln neuronale Eigenschaften, die mit der Primatenphysiologie übereinstimmen. „Aufmerksamkeit, Objektwahrnehmung und Verbindung von Reizen gehören zu den wichtigsten Fähigkeiten des Gehirns. Diese in die Praxis für KI-Architekturen einzubringen, birgt großes Potenzial“, so Klaus-Robert Müller.
Neuronale Netze sollen dem Gehirn ähnlicher werden
„Neuronale Netze verarbeiten Informationen im Allgemeinen nur in eine Richtung, das Gehirn hingegen ist bidirektional. Neuronale Netze haben nur eine Aufgabe: Informationen zu extrahieren. Das Gehirn hingegen leistet eine Vielzahl von Aufgaben, sowohl bottom-up als auch top-down. Unser Ziel ist es, neuronale Netze gehirnähnlicher zu gestalten und dadurch neue Gehirn- und KI-Modelle zu entwickeln“, erklärt Konrad Kording, Penn Integrated Knowledge Professor, University of Pennsylvania sowie Co-Director des „CIFAR Learning in Machines & Brains Program“.
Diagnose visueller Aufmerksamkeitsstörungen und Entwicklung adaptiver KI
Die praktischen Folgen der vorgestellten Arbeit könnten weitreichend sein, sowohl für die Neurowissenschaften als auch für die KI-Forschung: Durch die Verknüpfung von Erkenntnissen aus Psychologie, Neurowissenschaften und Computermodellierung erweitert die Studie das Verständnis der Funktionsweise von Aufmerksamkeit und Objektwahrnehmung im Gehirn. Sie stellt einen Schritt dar hin zu besseren Modellen der menschlichen Kognition und eröffnet Anwendungsmöglichkeiten, die von der Diagnose visueller Aufmerksamkeitsstörungen bis hin zur Entwicklung neuartiger adaptiver KI-Architekturen reichen.
Im Kern der Publikation steht eine neuartige Modellarchitektur für die visuelle Verarbeitung. Das Modell kombiniert einen sogenannten Feedforward-Pfad zur Merkmalsextraktion mit einem top-down gesteuerten Aufmerksamkeit-Pfad, der durch sogenannte bidirektionale, rekurrente Steuerungs-Mechanismen moduliert wird. Damit kann das Modell lernen, mehrere visuelle Aufgaben gleichzeitig zu lösen. Es ist so konzipiert, dass es bottom-up, top-down, rekurrente und laterale Informationsverarbeitung und -kommunikation ermöglicht und sowohl niedrigstufige Reize (etwa Bilder) als auch hochstufige Eingaben (zum Beispiel Aufgaben und Hinweise) parallel verarbeiten kann.
Publikation: Nature Communications 17, 4072 (2026) „Modeling attention and binding in the brain through bidirectional recurrent gating“, Saeed Salehi, Jordan Lei, Ari S. Benjamin, Klaus-Robert Müller & Konrad P. Kording https://www.nature.com/articles/s41467-026-72146-9
Weitere Informationen erteilt Ihnen gern:
Prof. Dr. Klaus-Robert Müller
Berlin Institute for the Foundations of Learning and Data (BIFOLD)
und Fachgebiet „Maschinelles Lernen“
Fakultät IV – Elektrotechnik und Informatik
Technische Universität Berlin
E-Mail: klaus-robert.mueller@tu-berlin.de
Merkmale dieser Pressemitteilung:
Journalisten
Informationstechnik
überregional
Forschungsergebnisse
Deutsch

Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.
Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).
Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.
Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).
Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).