Forscherinnen und Forscher der HAW Hamburg entwickeln ein neues Verfahren, das Maschinen hilft, Entscheidungen mit mehr Vorsicht und Präzision zu treffen.
Hamburg, 28. November 2025 – Maschinen, die selbstständig lernen und Entscheidungen treffen, steuern heute schon Roboter und Produktionsanlagen. Doch solche Systeme können Fehler machen, wenn sie mit Unsicherheiten konfrontiert sind. Forscherinnen und Forscher an der HAW Hamburg haben jetzt ein neues Verfahren entwickelt, das künstliche Intelligenz (KI) genau darin verbessert: Maschinen können mit „C-DSAC“ („Cramér-based Distributional Soft Actor-Critic“) nicht nur lernen, sondern dabei auch Unsicherheiten erkennen und so stabilere und sicherere Entscheidungen treffen.
Entwickelt hat das Verfahren Vanya Aziz im Rahmen des Forschungsprojekts LD-SODA (Lernbasierte Datenanalyse - Stochastik, Optimierung, Dynamik und Approximation), gefördert von der Landesforschungsförderung Hamburg der Hamburger Behörde für Wissenschaft, Forschung und Gleichstellung (BWFG). Seine mit „Summa cum Laude“ abgeschlossene kooperative Promotion an der HAW Hamburg sowie der Universität Málaga ist nun erschienen.
Anders als herkömmliche Methoden, die nur den erwarteten Erfolg einer Handlung bewerten, analysiert C-DSAC ein ganzes Spektrum möglicher Ergebnisse und deren Wahrscheinlichkeiten. Das macht die KI vorsichtiger und klüger, weil sie Risiken und Unsicherheiten besser einschätzt. „Mit C-DSAC können wir Maschinen beibringen, nicht nur auf den erwarteten Erfolg, sondern auch auf die Unsicherheit der Ergebnisse zu achten. Dadurch wird das maschinelle Lernen stabiler und robuster – ein entscheidender Schritt für den Einsatz in anspruchsvollen technischen Systemen“, erklärt Dr. Vanya Aziz.
Reinforcement Learning, die Technologie hinter C-DSAC, funktioniert ähnlich wie menschliches Lernen durch Erfahrung: Eine Maschine probiert Handlungen aus, wird für gute Ergebnisse belohnt und lernt so, bessere Entscheidungen zu treffen. Das neue Verfahren bietet den Vorteil, dass es nicht nur auf Erwartungswerte setzt, sondern mit Wahrscheinlichkeitsverteilungen arbeitet, die vorhandene Unsicherheiten abbilden. Das führt zu stabileren Lernprozessen, weniger Fehlentscheidungen und insgesamt leistungsfähigeren KI-Systemen.
In umfangreichen Tests mit Standardrobotik-Simulationen konnte C-DSAC in vier von fünf Fällen bessere Ergebnisse erreichen als etablierte Verfahren. „Die Entwicklung von C-DSAC zeigt, wie innovative Methoden das Potenzial des maschinellen Lernens erweitern können. Dr. Aziz‘ Arbeit ist ein wichtiger Schritt zu KI-Systemen, die auch in der Praxis verlässlich mit Unsicherheiten umgehen können – vom Roboter bis zur medizinischen Diagnostik“, sagt Prof. Dr. Ivo Nowak, Betreuer der Dissertation und Co-Leiter des Promotionsprogramms Computational Engineering and Applied Data Science (CEADS) an der HAW Hamburg.
Wissenschaftlerinnen und Wissenschaftler des Promotionsprogramms setzen an den Forschungsarbeiten von Vanya Aziz an – auf Basis von C-DSAC entstehen hier neue Ansätze, die das selbstständige Lernen von Maschinen in technischen Systemen weiter voranbringen. Praktisch bedeutet das: In der Fertigung koordinieren Roboter dank C-DSAC ihre Arbeit präziser und energieeffizienter. In der Haushaltsrobotik kann ein mobiler Serviceroboter mit der Technik etwa eigenständig Türen öffnen und dabei komplexe Aufgaben in einfachere Schritte unterteilen. Zudem optimiert die KI in der industriellen Computertomographie die Strahlendosen und Aufnahmewinkel, um die Bildqualität bei geringerer Belastung zu erhalten – allesamt Anwendungsbeispiele, die CEADS weiter voranbringt. „Das Beispiel C-DSAC zeigt: In unserem Promotionsprogramm Computational Engineering and Applied Data Science setzen wir auf interdisziplinäre Zusammenarbeit, um KI-Lösungen nicht nur technologisch voranzutreiben, sondern sie auch gezielt in reale Anwendungen zu bringen“, so Prof. Dr. Marina Tropmann-Frick, Professorin für Data Science und Co-Leiterin von CEADS.
Prof. Dr. Ivo Nowak
Promotionsprogramm „Computational Engineering and Applied Data Science“
T +49 40 428 75-8789
ivo.nowak@haw-hamburg.de
Aziz, V. Novel Distributional Reinforcement and Ensemble Learning Algorithms, PhD thesis, https://riuma.uma.es/xmlui/handle/10630/39287, 2025
Criteria of this press release:
Journalists, all interested persons
Information technology
transregional, national
Research results, Scientific Publications
German

You can combine search terms with and, or and/or not, e.g. Philo not logy.
You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).
Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.
You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).
If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).