Gemeinsame Presseinformation des Forschungszentrum Jülich und der Technischen Universität Berlin
Autonomer Roboter spielt mit NanoLEGO
Wissenschaftler*innen entwickeln eine autonome Künstliche Intelligenz, die gezielt einzelne Moleküle greifen und verschieben kann
Moleküle sind die Bausteine des Alltags. Die meisten Materialien setzen sich aus ihnen zusammen, vergleichbar mit einem Legomodell, das aus einer Vielzahl von unterschiedlichen Steinen besteht. Doch während man beim Lego einzelne Steine ganz einfach versetzen oder wegnehmen kann, ist das in der Nanowelt nicht so ohne weiteres möglich. Atome und Moleküle verhalten sich völlig anders als makroskopische Gegenstände und jeder Baustein braucht seine eigene „Bedienungsanleitung“. Wissenschaftler*innen des Forschungszentrum Jülich und der Technischen Universität Berlin haben jetzt eine Künstliche Intelligenz entwickelt, die selbstständig lernt, wie sie einzelne Moleküle mittels eines Rastertunnelmikroskops greifen und bewegen kann. Die Ergebnisse, die nicht nur für die Forschung, sondern auch für neuartige Fertigungstechnologien wie den molekularen 3D-Druck relevant sind, wurden jetzt in Science Advances publiziert.
Rapid Prototyping, die schnelle und kostengünstige Produktion von Prototypen oder Modellen, besser bekannt als 3D-Druck, hat sich längst als wichtiges Werkzeug für die Industrie etabliert. „Könnte man dieses Konzept auf die Nanoskala übertragen und einzelne Moleküle wie Legosteine gezielt zusammensetzen oder auch wieder trennen, böten sich nahezu unendliche Möglichkeiten, wenn man bedenkt dass es ca. 10⁶⁰ denkbare Molekülarten gibt“, weiß Dr. Christian Wagner, Leiter der ERC-Arbeitsgruppe Molekülmanipulation am Forschungszentrum Jülich.
Das Problem: Mit dem Rastertunnelmikroskop gibt es zwar ein Werkzeug, mit dem sich einzelne Moleküle gut hin und her schieben lassen, für die gezielte räumliche Anordnung benötigt man jedoch immer ein spezielles, geeignetes „Rezept“ zur Führung der Mikroskopspitze. Dieses lässt sich weder berechnen noch intuitiv erschließen – dafür ist die Mechanik auf der Nanoskala viel zu variabel und zu kompliziert. Denn die Mikroskopspitze ist kein beweglicher Greifer, sondern ein einfacher starrer Kegel. Die Moleküle haften daran nur leicht an – und lassen sich ausschließlich durch ausgeklügelte Bewegungsmuster an Ort und Stelle bringen.
Moleküle gezielt bewegen
„Bislang war so ein gezieltes Bewegen von Molekülen höchstens per Hand, durch ‚Trial and Error‘, möglich. Mithilfe einer selbstlernenden, autonomen Software-Steuerung ist es uns nun zum ersten Mal gelungen, eine Lösung für diese Vielfalt und Variabilität auf der Nanoskala zu finden und diesen Prozess zu automatisieren“, freut sich Prof. Dr. Stefan Tautz, Leiter des Jülicher Instituts für Quantum Nanoscience.
Der Schlüssel liegt in dem sogenannten Reinforcement Learning, einer speziellen Variante des Maschinellen Lernens. „Wir geben dem Software-Agenten keinen Lösungsweg vor, sondern belohnen Erfolg und bestrafen Misserfolg“, erklärt Prof. Dr. Klaus-Robert Müller, Leiter des Fachgebiets Maschinelles Lernen der Technischen Universität Berlin. Der Algorithmus versucht immer wieder, die gestellte Aufgabe zu lösen und lernt aus seinen Erfahrungen. In der breiten Öffentlichkeit bekannt geworden ist Reinforcement Learning vor ein paar Jahren durch AlphaGo Zero: Die Künstliche Intelligenz entwickelte eigenständig Gewinn-Strategien des hochkomplexen Go-Spiels, ohne menschliche Spieler*innen zu studieren – und war schon nach wenigen Tagen in der Lage, professionelle Go-Spieler*innen zu besiegen.
Softwareagent muss besonders schnell lernen
„In unserem Fall bekam der Agent die Aufgabe, einzelne Moleküle aus einer Schicht zu entfernen, in der sie über ein komplexes Netzwerk an chemischen Bindungen festgehalten werden. Konkret handelte es sich dabei um Perylen-Moleküle, wie sie etwa für Farben und organische Leuchtdioden verwendet werden“, erklärt Christian Wagner. Die besondere Herausforderung: Die aufgewendete Kraft für die Bewegung darf niemals die Stärke der Bindung überschreiten, mit der die Spitze des Rastertunnelmikroskops das Molekül anzieht, da diese Verbindung sonst bricht. „Die Spitze muss dafür ein spezielles Bewegungsmuster ausführen, das wir früher, im wahrsten Sinne des Wortes, per Hand herausfinden mussten“, so Christian Wagner. Während der Softwareagent anfangs völlig zufällige Bewegungsaktionen ausführt, die die Bindung zwischen Spitze und Molekül abreißen lassen, entwickelt er mit der Zeit Regeln, welche Bewegung in welcher Situation am erfolgversprechendsten ist und wird daher mit jedem Durchlauf besser.
Erstmalig Künstliche Intelligenz und Nanotechnologie zusammengebracht
Der Einsatz des Reinforcement Learning im nanoskopischen Bereich hält jedoch zusätzliche Herausforderungen parat. Die Metallatome, aus denen die Spitze des Rastertunnelmikroskops besteht, können sich leicht verschieben, was die Bindungsstärke zum Molekül jedes Mal ändert. „Jeder neue Versuch macht die Gefahr einer Veränderung und damit den Abriss der Bindung zwischen Spitze und Molekül größer. Somit ist der Software-Agent gezwungen, besonders schnell zu lernen, da seine Erfahrungen jederzeit hinfällig werden könnten“, so Stefan Tautz. „Es ist ein bisschen, als würden sich beim autonomen Fahren ständig das Straßennetz, die Verkehrsregeln, der Aufbau sowie die Bedienungsregeln des Fahrzeugs ändern.“ Die Forscher*innen haben diese Schwierigkeit überwunden, indem die Software parallel zu den ersten Versuchen auch ein einfaches Modell der Umgebung lernt, in der die Manipulation stattfindet. Der Agent trainiert dann gleichzeitig sowohl in der Realität als auch in seinem eigenen Modell, was den Lernprozess stark beschleunigt.
„Das ist das erste Mal überhaupt, dass es gelungen ist, Künstliche Intelligenz und Nanotechnologie zusammenzubringen“, betont Klaus-Robert Müller. „Bis jetzt handelt es sich zwar ausschließlich um ein ‚Proof of Principle‘“, erklärt Stefan Tautz. „Doch wir sind zuversichtlich, dass unsere Arbeit Wegbereiter für die robotergestützte, automatische Konstruktion funktioneller, supramolekularer Strukturen sein wird, beispielsweise von molekularen Transistoren, Speicherzellen oder Qubits – in einer Geschwindigkeit, Präzision und Ausdauer, die unsere derzeitigen Möglichkeiten weit übertreffen.“
Publikation
Autonomous robotic nanofabrication with reinforcement learning, Philipp Leinen, Malte Esders, Kristof T. Schütt, Christian Wagner, Klaus-Robert Müller, F. Stefan Tautz,
Science Advances, DOI: 10.1126/sciadv.abb6987
https://advances.sciencemag.org/lookup/doi/10.1126/sciadv.abb6987
Weitere Informationen erteilt Ihnen gern:
Prof. Dr. Klaus Robert Müller
TU Berlin
Fachgebiet Maschinelles Lernen
Tel.: 030 314-78621
E-Mail: klaus-robert.mueller@tu-berlin.de
Merkmale dieser Pressemitteilung:
Journalisten, Wissenschaftler
Elektrotechnik, Informationstechnik, Maschinenbau, Mathematik
überregional
Forschungsergebnisse, Kooperationen
Deutsch
Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.
Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).
Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.
Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).
Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).