idw - Informationsdienst
Wissenschaft
Am Darmstädter Labor des Deutschen Forschungsinstituts für Künstliche Intelligenz (DFKI) wird erforscht, wie Roboter in Zukunft selbstständig aus Erfahrungen lernen können. Auf der Conference on Robot Learning (CoRL), die vom 6. bis 9. November 2024 in München stattfindet, stellen die Forschenden in Kooperation mit der Technischen Universität Darmstadt zwei wichtige neue Projekte vor: Mit TacEx präsentieren sie eine Simulationsumgebung für taktile Sensoren. Diese ermöglicht das Training der Feinmotorik. Im zweiten Projekt analysieren die Forschenden die Anforderungen an Datensätze, um Diffusion Policies für das effiziente Training der Fortbewegung von humanoiden Robotern einzusetzen.
TacEx – Simulationsumgebung ermöglicht Roboter mit Fingerspitzengefühl
Nach einer Getränkedose greifen, einen Kugelschreiber in die Hand nehmen, einen Hund streicheln - alltägliche Handlungen, über die sich die meisten Menschen kaum Gedanken machen. Für Roboter sind diese Aufgaben jedoch komplex. Sie haben zwar Sensoren, jedoch keinen richtigen Tastsinn wie Menschen, und können noch nicht gut in Situationen reagieren, für die sie nicht trainiert wurden. Ihnen fehlt es sozusagen an Fingerspitzengefühl: „Ein Roboter weiß nicht automatisch, wie er eine Getränkedose greift, ohne sie zu zerquetschen, da er nicht weiß, wie viel Kraft er dafür aufwenden muss. Das macht den flexiblen Einsatz der Maschinen in unvorhersehbaren Umgebungen, in denen sie auch mit Menschen in Kontakt kommen, schwierig und gefährlich“, so Prof. Dr. Jan Peters, Leiter der Forschungsgruppe „Systemische KI für Lernende Roboter“ (SAIROL) am DFKI.
Auf der CoRL stellen die Forschenden aus Darmstadt jetzt mit TacEx eine innovative Lösung für dieses Problem vor. Es handelt sich dabei um einen zuverlässigen und genauen modularen Simulator für taktile Sensoren von GelSight. Simulationen sind vielversprechend für das Training von Robotern. Die Maschinen lernen dabei durch simulierte Situationen, in denen sie verschiedene Aufgaben lösen, für ihren Einsatz in der realen Welt. Das innovative Framework aus Darmstadt ermöglicht den Einsatz von GelSight Mini Sensoren für Reinforcement Learning. Im Rahmen der Simulation erfüllen die Roboter verschiedene Manipulationsaufgaben und können dadurch ihre Feinmotorik trainieren.
Schritt für Schritt: Das Potenzial von Diffusion Policies (DPs) für effizientere Körperkontrolle von humanoiden Robotern
Neben der Feinmotorik muss bei Robotern auch die Fortbewegung trainiert werden. Humanoide Roboter zum Beispiel sind vielversprechend für den Einsatz in vielen Bereichen, aber ihre Fortbewegung ist komplex, da sie nur wenige Berührungspunkte mit dem Boden haben. Aufgrund ihrer Ähnlichkeit mit dem Menschen gibt es jedoch eine große Menge an Daten, anhand derer Roboter trainiert werden können. Unter anderem können Videos von Menschen bei der Ausführung von Aufgaben als Datengrundlage dienen.
Die Herausforderung besteht darin, aus der Fülle dieser Daten mögliche Regeln für das Verhalten der Roboter zu generieren, um diese zu trainieren. Im Bereich der Manipulation werden dazu erfolgreich Diffusion Policies (DP) eingesetzt. „Bei der Fortbewegung von Robotern wird jedoch noch verstärkt auf Reinforcement Learning gesetzt. Dadurch entstehen oft seltsame Fortbewegungsweisen“, so Dr. Boris Belousov, stellvertretender Leiter des Forschungsbereichs SAIROL. Die Darmstädter Forscherinnen und Forscher haben jetzt untersucht, ob DPs auch beim Training der Fortbewegung von humanoiden Robotern helfen können. Dabei stellten sie fest, dass Roboter mit Hilfe von DPs zwar ein stabiles Gangbild entwickeln können, für ein erfolgreiches Training der Fortbewegung jedoch eine größere und vielfältigere Datenbasis notwendig ist, als sie für DPs im Bereich der Manipulation benötigt wird. Dieser Ausgangspunkt ermöglicht neue Ansätze für das Fortbewegungslernen von humanoiden Robotern.
Das DFKI auf der CoRL: Auf dem Weg zu autonomen Robotern
„Eine intelligente Maschine, die aus Erfahrungen lernt und sich automatisch an ihre Umgebung anpasst – das ist das Ziel, an dem die Teilnehmenden der CoRL arbeiten. Ich freue mich, dass wir in diesem innovativen Umfeld unsere Erkenntnisse in zwei zentralen Bereichen des Robot Learnings – der Feinmotorik und der Fortbewegung humanoider Roboter – präsentieren und damit einen Beitrag zur Robotik von morgen leisten können“, so Peters.
Die 8. Conference on Robot Learning (CoRL) findet vom 6.-9. November in München statt. Seit ihrer Gründung im Jahr 2017 widmet sich die CoRL der Förderung von Spitzenforschung und Innovation in den Bereichen Robotik und maschinellem Lernen.
DFKI-Forschungsbereichleiter Prof. Dr. Jan Peters ist an der Organisation des Workhops LocoLearn (https://www.locolearn.robot-learning.net) und des Workshops Morphology-Aware Policy and Design Learning (https://sites.google.com/view/corl-mapodel-workshop/home) beteiligt. Außerdem hält er eine Keynote im Rahmen des Workshops on Learning Robotic Assembly of Industrial and Everyday Objects (https://roboassembly.github.io).
Pressekontakt:
Christian Heyer
Leiter Communications & Media
DFKI Kaiserslautern | DFKI Labor Darmstadt | DFKI Außenstelle Trier
communications-da@dfki.de
boris.belousov@dfki.de - Dr. Boris Belousov, stellvertretender Leiter der Forschungsgruppe SAIROL
http://Der Code, die Videos und weitere Ergebnisse zu TacEx werden online veröffentlicht: https://sites.google.com/view/tacex
Die Forschungsgruppe SAIROL auf der CoRL (v.l.n.r.): Duc Huy Nguyen, Aditya Bhatt, Dr. Boris Belouso ...
SAIROL
DFKI
Merkmale dieser Pressemitteilung:
Journalisten
Elektrotechnik, Informationstechnik
überregional
Forschungsergebnisse, Wissenschaftliche Tagungen
Deutsch
Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.
Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).
Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.
Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).
Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).