idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
idw-Abo

idw-News App:

AppStore

Google Play Store



Instance:
Share on: 
07/01/2009 11:40

Suchmaschine für Fernsehbeiträge

Stefanie Heyduck Presse und Öffentlichkeitsarbeit
Fraunhofer-Gesellschaft

    Inhaltlich hat der Journalist die Aussagen von Ulla Schmidt zur Gesundheitsreform im Kopf. Doch um sie zitieren zu können, braucht er den genauen Wortlaut. Ein neues Spracherkennungssystem hilft, in Fernsehbeiträgen zu recherchieren.

    Wann wurde die Finanzkrise in der Tagesschau zum ersten Mal erwähnt? Was sagte doch gleich Merkel zur Präsidentschaftswahl? Bisher müssen Journalisten, Archivare und Medienbeobachter lange suchen, bis sie eine bestimmte Stelle in Sendungsmitschnitten finden - oder viel Geld in ein Spracherkennungssystem investieren. Denn die Systeme, die diese Suche übernehmen können, müssen in regelmäßigen Abständen von Fachleuten aktualisiert werden und sind daher mit hohen laufenden Kosten verbunden. Basis dieser Systeme ist eine Art Lexikon, das alle erkennbaren Wörter enthält. Neue Themen und Köpfe bringen jedoch neue Wörter mit sich, seien es "Finanzkrise" oder Namen wie "Obama". Um diese Begriffe finden zu können, müssen sie zuvor in das Lexikon übertragen werden.

    Forscher am Fraunhofer-Institut für Intelligente Analyse- und Informa-tionssysteme IAIS in Sankt Augustin haben ein Spracherkennungssystem entwickelt, das ohne kostenintensive Aktualisierung auskommt. "Unser System basiert auf einem Silbenlexikon statt auf einem Wort-lexikon. Klassische Spracherkenner können nur eine begrenzte Zahl von Worten erkennen - die Zahl der existierenden Wörter ist jedoch unüberschaubar groß. Im Unterschied dazu ist die Anzahl verschiedener Silben handhabbar. Mit etwa 10 000 gespeicherten Silben können wir jedes Wort zusammensetzen", sagt Daniel Schneider, Forscher am IAIS. Das Programm erschließt sich auch neue Worte selbst, indem es sie aus den gespeicherten Silben zusammensetzt: Fi-nanz-kri-se. Es muss nicht aktualisiert werden und verursacht keine laufenden Kosten.

    Für die Suche werden die Fernsehsendungen zunächst segmentiert: Ändert sich beispielsweise der Sprecher oder kommt ein Filmbeitrag - variiert also der Inhalt der Audiospur -, speichert das Programm die folgenden Szenen als neues Segment ab. Der Anwender kann von Sprecher zu Sprecher navigieren, etwa nur die Beiträge eines Interviewpartners anschauen. In einem weiteren Schritt analysieren Sprachalgorithmen die einzelnen Worte. Für den Anwender präsentiert sich das Programm wie eine herkömmliche Suchmaschine. Er gibt den Suchbegriff ein, wenige Millisekunden später hat das Programm 10 000 Stunden aufgearbeitetes Datenmaterial durchsucht. Die Ergebnisse werden wie bei Internet-Suchmaschinen im Satzzusammenhang angezeigt. Ein Klick, und die entsprechende Stelle des Filmmaterials wird abgespielt. Das System findet über 85 Prozent der gesprochenen Begriffe, 99 von 100 gefundenen Beiträgen sind korrekt. Ein Lizenzmodell des Programms gibt es bereits.


    More information:

    http://www.fraunhofer.de/presse/presseinformationen/2009/juli/suchmaschine-ferns...


    Images

    Criteria of this press release:
    Information technology, Media and communication sciences
    transregional, national
    Research results, Transfer of Science or Research
    German


     

    Help

    Search / advanced search of the idw archives
    Combination of search terms

    You can combine search terms with and, or and/or not, e.g. Philo not logy.

    Brackets

    You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).

    Phrases

    Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.

    Selection criteria

    You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).

    If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).