idw - Informationsdienst
Wissenschaft
Großer Erfolg für zwei KI-Wissenschaftler aus dem Cyber Valley Ökosystem: Michael Niemeyer, Doktorand am Max-Planck-Institut für Intelligente Systeme, und Prof. Dr. Andreas Geiger von der Universität Tübingen wurden für ihre Arbeit „GIRAFFE: Representing Scenes as Compositional Generative Neural Feature Fields“ bei der diesjährigen Conference on Computer Vision und Pattern Recognition (CVPR) mit dem „Best Paper Award“ geehrt.
Bei dem Paper der beiden Tübinger Wissenschaftler handelt es sich um Grundlagenforschung auf dem Gebiet des maschinellen Sehens. Niemeyer und Geiger beschreiben darin eine von ihnen entwickelte Methode, mit der es Computern nun erstmals möglich ist, verschiedene dreidimensionale Objekte auf zweidimensionalen Bildern (z. B. Fotos) selbständig zu identifizieren.
„Unser Ziel ist, dass Computer selbst erlernen, wie Bilder – wir sprechen hier von Szenen – aufgebaut sind“, sagt Niemeyer, Hauptautor der Arbeit und Promotionsstudent an der International Max Planck Research School for Intelligent Systems (IMPRS-IS), der Cyber Valley Graduiertenschule. „Der Computer soll also erkennen, welche dreidimensionalen Objekte sich auf einem Foto befinden, das heißt wie eine Szene strukturiert ist.“ Während die meisten gängigen Ansätze auf zweidimensionalen Datensätzen beruhen und die abgebildeten Szenen nicht dreidimensional erfassen, erkennt das neue Modell von Niemeyer und Geiger, GIRAFFE, die abgebildeten Objekte dreidimensional und ermöglicht so alle möglichen unterschiedlichen Blickwinkel auf die selbe Szene.
Konkret bedeutet das: Ein einfaches Foto, auf dem beispielsweise ein Auto vor einem Haus parkend abgebildet ist, kann als Basis dienen, um das Auto nicht nur von vorne, sondern auch aus weiteren Blickwinkeln vor dem Haus zu betrachten. Darüber hinaus kann die Position des Autos im Bild beliebig verschoben werden und dadurch jeweils unterschiedliche Teile des Hauses verdecken bzw. den Blick darauf freigeben. „Das meinen wir mit ‚compositional‘ – unser Computermodell erfasst die Struktur der abgebildeten Szene. Es erkennt das Auto im Vordergrund als ein Objekt und das Haus im Hintergrund als ein weiteres“, sagt Niemeyer.
Darüber hinaus bietet GIRAFFE mehr Kontrolle bei der Bildgenerierung. So kann beispielsweise die Form eines abgebildeten Objekts beliebig verändert werden. Dies könnte künftig unter anderem bei der Erzeugung virtueller Umgebungen für eine deutlich realistischere Darstellung sorgen. „Unser Paper ist eine Grundlagenarbeit“, betont Niemeyer. „Andere Forschende könnten auf dieser Basis sicherere KI-Anwendungen konstruieren, da diese nun, dank eines besseren Verständnisses ihrer Umgebung, bessere Entscheidungen treffen können.“ Ein denkbares Anwendungsfeld wäre hier beispielsweise das autonome Fahren, bei dem die Computersysteme der Autos künftig besser erfassen könnten, welche Objekte sich in ihrer Umgebung befinden – und so präzisere Rückschlüsse auf die Eigenschaften und Verhaltensweisen dieser Objekte ziehen können. Zudem ermöglicht Niemeyer und Geigers Modell eine verbesserte künstliche Erzeugung von Daten, da es nur zweidimensionale Fotos als Ausgangsbasis benötigt. Demnach könnten KI-Systeme künftig in einer künstlich erzeugten Umgebung trainiert werden.
Die CVPR ist eine der prestigeträchtigsten internationalen Forschungskonferenzen überhaupt und gilt als die wichtigste Fachkonferenz insbesondere im Bereich des maschinellen Sehens. Lediglich etwa ein Viertel der rund 7.000 eingereichten Fachartikel werden zur Konferenz zugelassen. Mit insgesamt 27 akzeptierten Beiträgen und vier Best-Paper-Nominierungen sind Cyber Valley Forschende in diesem Jahr auf der CVPR besonders stark in der Weltspitze der KI-Grundlagenforschung vertreten.
„Meine Forschungsgruppe hat bereits mehrere Arbeiten veröffentlicht, die sich mit dem Erlernen von geeigneten 3D-Repräsentationen mit neuronalen Netzen befassen und die in der Computer-Vision-Community vielfach beachtet wurden“, sagt Geiger. „Darauf baute auch das nun ausgezeichnete Paper auf.“ Trotzdem haben Geiger und Niemeyer nicht mit dieser besonderen Auszeichnung bei der CVPR 2021 gerechnet. „Dass unser Paper zur Konferenz zugelassen wurde, war schon ein Erfolg an sich“, sagt Niemeyer. „Wir sind wirklich sehr überrascht, dass unsere wissenschaftliche Arbeit nun unter all den Einreichungen als die beste ausgezeichnet wurde. Umso mehr freuen wir uns über diese herausragende Anerkennung!“
Ansprechpartner für Medien:
Lennart Schmid
Communications Manager
c/o Universität Tübingen, AI Research Building
Maria-von-Linden-Str. 6, 72076 Tübingen
Telefon: +49 7071 29 70794
Mobil: +49 160 91289359
E-Mail: lennart.schmid@cyber-valley.de
http://www.cvlibs.net/publications/Niemeyer2021CVPR.pdf
https://autonomousvision.github.io/giraffe/
Criteria of this press release:
Journalists, Scientists and scholars, Students
Information technology
transregional, national
Research projects, Research results
German
You can combine search terms with and, or and/or not, e.g. Philo not logy.
You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).
Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.
You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).
If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).