idw - Informationsdienst
Wissenschaft
Autonome mobile Systeme sind im Alltag und in der Industrie immer mehr auf dem Vormarsch. In einem DFG-geförderten Projekt von Prof. Dr. Heinrich Niemann und Dipl.-Inf. Ulrike Ahlrichs am Lehrstuhl für Mustererkennung der Universität Erlangen-Nürnberg lernen solche Systeme, eine Kamera zu steuern und die visuellen Daten optimal für ihre Aufgabe einzusetzen.
Für die Erfüllung von einfachen Routineaufgaben wie dem Transport von Post oder Büchern ist eine schnelle und robuste Verarbeitung in einem geschlossenen Kreislauf aus Sensorik und Aktorik unverzichtbar. Damit visuelle Information - etwa zur Lage oder zur Form von Objekten - sinnvoll verarbeitet werden kann, muß zusätzlich das Wissen über Objekte und über Aktionen, die die Einstellung der Kamera verändern, einheitlich repräsentiert und nutzbar sein. Aktionen mit der Kamera sind zum Beispiel notwendig, wenn anfangs nicht die Objekte im Bild sind, auf die sich die Aufgabe bezieht. Außerdem können optimale Voraussetzungen für eine Weiterverarbeitung der Daten geschaffen werden, indem die Einstellung der Kamera der Aufgabe angepaßt wird.
Die Information über Objekte und die Zusammensetzung der Szene sowie über Kameraaktionen wird in einer Wissensbasis in Form eines semantischen Netzes repräsentiert. Konventionelle Wissensbasen enthalten im allgemeinen nur Wissen über die Objekte und die Szene. Die Erweiterung der Wissensbasis zur einheitlichen Repräsentation von Kameraaktionen war Gegenstand von Arbeiten, die am Lehrstuhl für Mustererkennung im Teilprojekt D1 des Sonderforschungsbereichs (SFB) 182 durchgeführt wurden. Als Anwendungsbeispiel diente die Exploration einer Büroszene, das heißt das Suchen und Erkennen von Objekten wie Lochern, Heftern oder Abrollern. Zur Nutzung des im semantischen Netz repräsentierten Wissens wurde ein Kontrollalgorithmus verwendet, der auf einem Graph-Suchalgorithmus basiert. Eingabedaten des semantischen Netzes ergeben sich aus einer Kombination von Intensitäts- und Tiefenbild. Letzteres enthält Information über den Abstand der Objekte von der Kamera. Die Tiefenbilder wurden mit Hilfe von Stereoverfahren berechnet, die jedoch nicht echtzeitfähig oder zu ungenau sind.
Selektive Reihenfolge
Im DFG-Projekt wird deshalb ein 3D-Echtzeitsensor eingesetzt, um diese Daten zu gewinnen. Dabei wird experimentell überprüft, ob die von dem Sensor gelieferten Tiefenkarten für das Szenario der Büroszenenexploration geeignet sind.
Hauptziel des Projekts ist es aber, die Kontrolle - anders als im SFB-Teilprojekt - an das gewählte Anwendungsgebiet anzupassen. Die Grundstruktur der Kontrolle bleibt erhalten; die Berechnungsreihenfolge für die Konzepte, aus denen das semantische Netz aufgebaut ist, wird jedoch für die Anwendung adaptiert. Dadurch erreicht man eine zielgerichtete, selektive Folge von Konzeptberechnungen, so daß sich die Effizienz des Systems erhöht. Darüber hinaus kann in dieser Folge berücksichtigt werden, daß nach der Bewegung der Kamera, das heißt nach Ende einer Kameraaktion, ein Bild aufzunehmen ist. Dies modelliert die zu Anfang geforderte Rückkopplung aus Sensorik und Aktorik.
Damit der Ansatz auf andere Anwendungsgebiete übertragbar bleibt, erlernt das System selbst die Berechnungsreihenfolge, während es eine Aufgabe löst. Im Lernprozeß werden Verfahren aus dem Bereich des Reinforcement Learning eingesetzt. Das System erfährt durch "Belohnungen" und "Bestrafungen", welche der verwendeten Berechnungsreihenfolgen die günstigste ist. Die Tragfähigkeit der Verfahren wird anhand eines Systems belegt, das der Variante des Teilprojekts D1 überlegen ist: es ist in der Lage, mehrere Büros zu explorieren, bis die gesuchten Objekte gefunden sind. Die DFG fördert das Projekt über eine Laufzeit von zwei Jahren seit April 1999.
Kontakt:
Prof. Dr.-Ing. Heinrich Niemann, Dipl. Inf. Ulrike Ahlrichs
Lehrstuhl für Mustererkennung (Informatik 5), Martensstrasse 3, 91058 Erlangen
Tel.: 09131/85 -27775, Fax: 09131/303811,
E-mail: niemann@informatik.uni-erlangen.de
Internet: http://www5.informatik.uni-erlangen.de
http://www.uni-erlangen.de/docs/FAUWWW/Aktuelles/Aktuelleshome.html
Merkmale dieser Pressemitteilung:
Informationstechnik, Maschinenbau, Medien- und Kommunikationswissenschaften
überregional
Forschungsergebnisse, Forschungsprojekte
Deutsch
Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.
Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).
Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.
Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).
Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).