idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Grafik: idw-Logo

idw - Informationsdienst
Wissenschaft

Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instance:
Share on: 
03/28/2023 11:00

Wenn Maschinen selbstständig lernen

Gunnar Bartsch Presse- und Öffentlichkeitsarbeit
Julius-Maximilians-Universität Würzburg

    Carlo d’Eramo ist neu an der Universität Würzburg. Der Informatikprofessor arbeitet auf dem Gebiet der Künstlichen Intelligenz. Er ist Experte für eine spezielle Form des maschinellen Lernens, das Reinforcement Learning.

    Ein intelligentes Kameraüberwachungssystem soll auf einem Bahnhof selbstständig herrenlose Gepäckstücke oder andere verdächtige Objekte aufspüren. Dazu muss es wissen, wie Koffer und Taschen aussehen. Um das zu erreichen, muss der Mensch das System mit Trainingsdaten füttern – in diesem Fall mit möglichst vielen Bildern von unterschiedlichen Gepäckstücken.

    Ganz anders funktioniert eine Form des maschinellen Lernens, die Reinforcement Learning („Verstärkendes Lernen“) heißt. „Dateninput von Menschen ist dabei nicht nötig“, sagt Informatikprofessor Carlo D‘Eramo. Stattdessen sammeln die Algorithmen ihre eigenen Erfahrungen, indem sie in vielen Simulationsdurchläufen Aufgaben nach dem Prinzip „Versuch und Irrtum“ lösen. Richtige Entscheidungen werden belohnt, etwa mit Punkten, die den Algorithmen gutgeschrieben werden. Diese positive Verstärkung bewirkt, dass bevorzugt gewünschte Aktionen ausgeführt werden – das System lernt.

    „Man kann sich diese Art des Maschinenlernens vorstellen wie ein Baby, das nach und nach seine Umgebung erkundet. Es macht dabei gute und schlechte Erfahrungen, und die merkt es sich“, erklärt der Professor. „Schlechte“ Handlungen wird das Baby künftig vermeiden, „gute“ wird es wiederholen.

    Multitasking und Transferlernen als Ziele

    Carlo D’Eramos Gruppe arbeitet daran, die Methoden des Reinforcement Learning weiter zu verbessern. Unter anderem geht es darum, den selbstlernenden Systemen Multitasking und Transferlernen beizubringen.

    Beim Thema Transferlernen zieht der Forscher wieder einen Vergleich zum Menschen: Fußballspieler wissen, dass sie zu einem Team gehören, das in einem genau definierten Umfeld gegen ein anderes Team spielt. Sie können die Laufwege der anderen einschätzen und verfügen über Ballgefühl. Diese und andere Erfahrungen sind nützlich, wenn Fußballer andere Ballsportarten lernen: Sie übertragen ihr Wissen aus dem Fußball auf den anderen Bereich. Genau diese Art von Wissenstransfer möchte Carlo D’Eramo für das Maschinenlernen nutzbar machen.

    BMBF-Projekt in der Robotik

    Seiner Arbeitsgruppe hat der Informatiker den Namen LiteRL gegeben. RL ist die Abkürzung für Reinforcement Learning, Lite steht für „light“ (leicht) – damit will D’Eramo ausdrücken, dass er auf möglichst einfache lernende Modelle setzt, die aber komplexe Aufgaben bewältigen können.

    „Wir forschen in Theorie und Praxis. Ob unsere theoretisch erarbeiteten Methoden effektiv sind, überprüfen wir in Simulationen und realen Anwendungen, zum Beispiel in den Bereichen Finanzen, Spiele und Robotik“, erklärt der Professor.

    Im Bereich Robotik zum Beispiel erhält Carlo D’Eramo rund 750.000 Euro vom Bundesministerium für Bildung und Forschung (BMBF) für ein Projekt, das vor kurzem erst gestartet ist. Ziel ist es, einem vierbeinigen Roboter mittels RL das unfallfreie Laufen auf verschiedenen Oberflächen beizubringen.

    „Einen Roboter mit vier Beinen auf ebenem, festem Untergrund laufen zu lassen, ist einfach“, sagt der Forscher. Schwerer werde es, wenn der Boden rutschig oder uneben ist oder wenn Hindernisse im Weg sind. Genau dieses Problem soll im BMBF-Projekt gelöst werden. Das Fördergeld wird auch für die Finanzierung von drei Promovierenden verwendet.

    Werdegang des neuen Professors

    Carlo D’Eramo wurde 1989 in Pescara in Italien geboren. Er hat Informatik an der staatlichen Technischen Universität Politecnico in Mailand und an der Universität von Illinois in Chicago (USA) studiert. Er hat jeweils einen Masterabschluss aus Chicago und Mailand.

    Schon als Student orientierte sich der Informatiker zur Künstlichen Intelligenz hin – weil sie genau die Fächer vereint, die ihn sehr begeistern: Informatik, Mathematik und Logik.

    Nach der Promotion 2019 in Mailand ging er als Postdoc an die Technische Universität Darmstadt in die Gruppe für Intelligente Autonome Systeme. Dort leitete er ab 2022 seine eigene Forschungsgruppe, die auch am Hessischen Forschungszentrum für Künstliche Intelligenz (hessian.AI) verortet ist.

    Im November 2022 folgte Carlo D’Eramo dem Ruf auf die Professur für Reinforcement Learning and Computational Decision-Making an der Universität Würzburg. Die Professor wurde neu geschaffen, und zwar im Rahmen des Centers for Artificial Intelligence and Data Science (CAIDAS). Seine Gruppe am hessian.AI wird der Professor weiterhin leiten, bis seine zwei Promovierenden dort ihren Abschluss haben.


    Contact for scientific information:

    Prof. Dr. Carlo D‘Eramo, Professur für Reinforcement Learning and Computational Decision-Making, Universität Würzburg, T +49 931 31-83457, carlo.deramo@uni-wuerzburg.de


    Images

    Professor Carlo D’Eramo ist Fachmann für Reinforcement Learning. Professor Carlo D’Eramo ist Fachmann für Reinforcement Learning.
    Professor Carlo D’Eramo ist Fachmann für Reinforcement Learning. Professor Carlo D’Eramo ist Fachman ...
    Robert Emmerich
    Universität Würzburg


    Criteria of this press release:
    Journalists, Scientists and scholars
    Information technology, Mathematics
    transregional, national
    Personnel announcements
    German


     

    Help

    Search / advanced search of the idw archives
    Combination of search terms

    You can combine search terms with and, or and/or not, e.g. Philo not logy.

    Brackets

    You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).

    Phrases

    Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.

    Selection criteria

    You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).

    If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).