idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instance:
Share on: 
09/21/2010 11:24

Bonner Algorithmen zur automatischen Bilderkennung weltweit führend

Frank Luerweg Abteilung Presse und Kommunikation
Rheinische Friedrich-Wilhelms-Universität Bonn

    Computern beizubringen, den Inhalt von Fotos zu erkennen, ist eine anspruchsvolle Aufgabe. Besonders gute Lehrer in dieser Kunst sind Mathematiker der Universität Bonn: Sie haben jetzt den ersten Platz im internationalen „PASCAL segmentation and labeling challenge“ belegt – zusammen mit Forschern aus Barcelona, aber noch vor den Universitäten Berkeley, Stanford oder dem MIT.

    Computer schlagen heute die weltbesten menschlichen Spieler im Schach. Wenn es jedoch um die Interpretation von Bildinhalten geht, sind sie selbst Kleinkindern weit unterlegen. Denn in dieser Disziplin sind wir spitze: Wir erkennen auf Anhieb, dass das Ding auf dem Tisch ein Becher ist und keine Vase. Wir können die Zeitungsschlagzeile lesen, obwohl das Papier gerade an dieser Stelle gefaltet und deshalb nur die obere Hälfte sichtbar ist. Wir wissen: Das ist ein Geldstück, auch wenn wir die Währung noch nie gesehen haben.

    „Seit frühester Kindheit werden wir mit visuellem Input gefüttert“, erklärt Professor Dr. Cristian Sminchisescu. „Das hilft uns natürlich, neue Inhalte zu interpretieren und einzuordnen.“ Der gebürtige Rumäne leitet am Bonner Institut für Numerische Simulation die Arbeitsgruppe „Computer Vision and Machine Learning“. Der Name ist Programm: Seine Mitarbeiter und er entwickeln lernfähige Algorithmen zur automatisierten Erkennung von Bildinhalten. Und das ziemlich erfolgreich: Gerade hat die Gruppe im so genannten PASCAL-Wettbewerb den ersten Platz im Teilgebiet „Bildsegmentierung“ belegt. Dieser gilt international als einer der anspruchsvollsten wissenschaftlichen Wettkämpfe zu diesem Thema.

    Computer im Trainingslager

    Bei der Bildsegmentierung geht es nicht nur darum, die Bildinhalte korrekt zu benennen. Der Algorithmus soll auch die Konturen der abgebildeten Gegenstände oder Personen finden. Also etwa: Das ist ein Stuhl, hier ist ein Kind, das darauf sitzt, und der Rest ist Hintergrund. Die Organisatoren des „Pascal Visual Object Challenge“ hatten den Teilnehmern dazu einen Satz von 2.000 Trainingsbildern zur Verfügung gestellt. Darin waren sowohl die abgebildeten Objekte als auch ihre Grenzen korrekt gekennzeichnet.

    Sminchisescu und seine Mitarbeiter Dr. Fuxin Li und João Carreira haben ihren Rechner mit diesen Trainingsbildern gefüttert. „Unser Algorithmus konnte so lernen, die Inhalte korrekt zu identifizieren“, erklärt Li. Danach gaben die Ausrichter des Wettbewerbs einen neuen Satz Fotos frei, an dem die Algorithmen ihr Können beweisen mussten. Mit einer Trefferquote von 40 Prozent kam der Bonner Lösungsansatz auf Platz 1 – vor Berkeley (36 Prozent), Chicago (32 Prozent), Oxford-Brooks (31 Prozent) und Stanford (29 Prozent).

    Jedes zweijährige Kleinkind kann das zwar besser. Es hat aber in seinem kurzen Leben bereits Milliarden von Bildeindrücken gesammelt – nicht lediglich 2.000. Zudem werden die Algorithmen immer besser: „Wir haben den Wettbewerb bereits im letzten Jahr für uns entscheiden können – damals aber noch mit einer Erfolgsquote von 36 Prozent“, sagt Cristian Sminchisescu.

    Ordnung im Fotochaos

    Doch wozu sollen Rechner überhaupt sehen lernen? Ein Anwendungsbeispiel sind intelligente Bilddatenbanken. Schon heute gibt es erste Programme für den Heimgebrauch, die auf Fotos automatisch die abgebildeten Personen erkennen. Sie können aus dem digitalen Fotochaos ruck-zuck diejenigen Bilder herausfiltern, die Oma und Opa mit ihrer süßen Enkelin zeigen. Perfekt funktioniert das allerdings noch nicht – und das, obwohl Gesichtserkennung ein vergleichsweise einfaches Problem ist.

    Doch auch der Bonner Algorithmus kann sich irren. Mit ein paar Mausklicken holt Sminchisescu ein besonders gravierendes Beispiel auf den Bildschirm: Das Foto eines gedeckten Frühstückstischs. Der Computer hatte darin ein Motorrad erkannt.

    Kontakt:
    Professor Dr. Cristian Sminchisescu
    Institut für Numerische Simulation der Universität Bonn
    Telefon: 0228/73-3522
    E-Mail: cristian.sminchisescu@ins.uni-bonn.de


    Images

    Criteria of this press release:
    Information technology
    transregional, national
    Contests / awards, Research results
    German


     

    Help

    Search / advanced search of the idw archives
    Combination of search terms

    You can combine search terms with and, or and/or not, e.g. Philo not logy.

    Brackets

    You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).

    Phrases

    Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.

    Selection criteria

    You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).

    If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).