idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instanz:
Teilen: 
28.03.2023 11:00

Wenn Maschinen selbstständig lernen

Gunnar Bartsch Presse- und Öffentlichkeitsarbeit
Julius-Maximilians-Universität Würzburg

    Carlo d’Eramo ist neu an der Universität Würzburg. Der Informatikprofessor arbeitet auf dem Gebiet der Künstlichen Intelligenz. Er ist Experte für eine spezielle Form des maschinellen Lernens, das Reinforcement Learning.

    Ein intelligentes Kameraüberwachungssystem soll auf einem Bahnhof selbstständig herrenlose Gepäckstücke oder andere verdächtige Objekte aufspüren. Dazu muss es wissen, wie Koffer und Taschen aussehen. Um das zu erreichen, muss der Mensch das System mit Trainingsdaten füttern – in diesem Fall mit möglichst vielen Bildern von unterschiedlichen Gepäckstücken.

    Ganz anders funktioniert eine Form des maschinellen Lernens, die Reinforcement Learning („Verstärkendes Lernen“) heißt. „Dateninput von Menschen ist dabei nicht nötig“, sagt Informatikprofessor Carlo D‘Eramo. Stattdessen sammeln die Algorithmen ihre eigenen Erfahrungen, indem sie in vielen Simulationsdurchläufen Aufgaben nach dem Prinzip „Versuch und Irrtum“ lösen. Richtige Entscheidungen werden belohnt, etwa mit Punkten, die den Algorithmen gutgeschrieben werden. Diese positive Verstärkung bewirkt, dass bevorzugt gewünschte Aktionen ausgeführt werden – das System lernt.

    „Man kann sich diese Art des Maschinenlernens vorstellen wie ein Baby, das nach und nach seine Umgebung erkundet. Es macht dabei gute und schlechte Erfahrungen, und die merkt es sich“, erklärt der Professor. „Schlechte“ Handlungen wird das Baby künftig vermeiden, „gute“ wird es wiederholen.

    Multitasking und Transferlernen als Ziele

    Carlo D’Eramos Gruppe arbeitet daran, die Methoden des Reinforcement Learning weiter zu verbessern. Unter anderem geht es darum, den selbstlernenden Systemen Multitasking und Transferlernen beizubringen.

    Beim Thema Transferlernen zieht der Forscher wieder einen Vergleich zum Menschen: Fußballspieler wissen, dass sie zu einem Team gehören, das in einem genau definierten Umfeld gegen ein anderes Team spielt. Sie können die Laufwege der anderen einschätzen und verfügen über Ballgefühl. Diese und andere Erfahrungen sind nützlich, wenn Fußballer andere Ballsportarten lernen: Sie übertragen ihr Wissen aus dem Fußball auf den anderen Bereich. Genau diese Art von Wissenstransfer möchte Carlo D’Eramo für das Maschinenlernen nutzbar machen.

    BMBF-Projekt in der Robotik

    Seiner Arbeitsgruppe hat der Informatiker den Namen LiteRL gegeben. RL ist die Abkürzung für Reinforcement Learning, Lite steht für „light“ (leicht) – damit will D’Eramo ausdrücken, dass er auf möglichst einfache lernende Modelle setzt, die aber komplexe Aufgaben bewältigen können.

    „Wir forschen in Theorie und Praxis. Ob unsere theoretisch erarbeiteten Methoden effektiv sind, überprüfen wir in Simulationen und realen Anwendungen, zum Beispiel in den Bereichen Finanzen, Spiele und Robotik“, erklärt der Professor.

    Im Bereich Robotik zum Beispiel erhält Carlo D’Eramo rund 750.000 Euro vom Bundesministerium für Bildung und Forschung (BMBF) für ein Projekt, das vor kurzem erst gestartet ist. Ziel ist es, einem vierbeinigen Roboter mittels RL das unfallfreie Laufen auf verschiedenen Oberflächen beizubringen.

    „Einen Roboter mit vier Beinen auf ebenem, festem Untergrund laufen zu lassen, ist einfach“, sagt der Forscher. Schwerer werde es, wenn der Boden rutschig oder uneben ist oder wenn Hindernisse im Weg sind. Genau dieses Problem soll im BMBF-Projekt gelöst werden. Das Fördergeld wird auch für die Finanzierung von drei Promovierenden verwendet.

    Werdegang des neuen Professors

    Carlo D’Eramo wurde 1989 in Pescara in Italien geboren. Er hat Informatik an der staatlichen Technischen Universität Politecnico in Mailand und an der Universität von Illinois in Chicago (USA) studiert. Er hat jeweils einen Masterabschluss aus Chicago und Mailand.

    Schon als Student orientierte sich der Informatiker zur Künstlichen Intelligenz hin – weil sie genau die Fächer vereint, die ihn sehr begeistern: Informatik, Mathematik und Logik.

    Nach der Promotion 2019 in Mailand ging er als Postdoc an die Technische Universität Darmstadt in die Gruppe für Intelligente Autonome Systeme. Dort leitete er ab 2022 seine eigene Forschungsgruppe, die auch am Hessischen Forschungszentrum für Künstliche Intelligenz (hessian.AI) verortet ist.

    Im November 2022 folgte Carlo D’Eramo dem Ruf auf die Professur für Reinforcement Learning and Computational Decision-Making an der Universität Würzburg. Die Professor wurde neu geschaffen, und zwar im Rahmen des Centers for Artificial Intelligence and Data Science (CAIDAS). Seine Gruppe am hessian.AI wird der Professor weiterhin leiten, bis seine zwei Promovierenden dort ihren Abschluss haben.


    Wissenschaftliche Ansprechpartner:

    Prof. Dr. Carlo D‘Eramo, Professur für Reinforcement Learning and Computational Decision-Making, Universität Würzburg, T +49 931 31-83457, carlo.deramo@uni-wuerzburg.de


    Bilder

    Professor Carlo D’Eramo ist Fachmann für Reinforcement Learning. Professor Carlo D’Eramo ist Fachmann für Reinforcement Learning.
    Professor Carlo D’Eramo ist Fachmann für Reinforcement Learning. Professor Carlo D’Eramo ist Fachman ...
    Robert Emmerich
    Universität Würzburg


    Merkmale dieser Pressemitteilung:
    Journalisten, Wissenschaftler
    Informationstechnik, Mathematik
    überregional
    Personalia
    Deutsch


     

    Professor Carlo D’Eramo ist Fachmann für Reinforcement Learning. Professor Carlo D’Eramo ist Fachmann für Reinforcement Learning.


    Zum Download

    x

    Hilfe

    Die Suche / Erweiterte Suche im idw-Archiv
    Verknüpfungen

    Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.

    Klammern

    Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).

    Wortgruppen

    Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.

    Auswahlkriterien

    Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).

    Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).