idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instanz:
Teilen: 
18.03.2013 10:37

Das Kreuz mit der Handschrift

Ingrid Rieck Presse und Kommunikation
Universität Rostock

    Mathematiker der Uni Rostock wollen Unleserliches leserlich machen

    Das Kreuz mit der Handschrift. Der Traum: Ein Computerprogramm, das auch die unlesbarste Handschrift entziffern kann. An diesem Ziel forschen Mathematiker der Universität Rostock um Dr. Roger Labahn gemeinsam mit dem Schweriner Unternehmen Planet is GmbH. „Die Leistung ist heute nicht mehr das Lesen maschinengeschriebener Texte, das kann jeder Scanner, sondern die Entzifferung von Handschriften“. Und diesem Ziel wollen die Rostocker Mathematiker möglichst ganz nah kommen.

    Bei so genannten „Schönschreibern“ haben die Schrifterkennungsprogramme, die es heute bereits gibt, noch erhebliche Probleme. „Nicht jede Handschrift kann aussehen wie ein Kulturdenkmal. Es ist auch eine liebenswerte Spur der Persönlichkeit“, konstatiert Dr. Labahn. Während es für einen Menschen meist keine große Schwierigkeit darstellt, die persönlichen Schnörkel verschiedener Schreiber zu entziffern, beherrschen Maschinen diese Kunst noch nicht wirklich befriedigend. Die große Herausforderung für die Rostocker Forscher: Das auf zwei Säulen stehende Verbundprojekt zur Erkennung von Handschriften, an dem auf der einen Seite die mittelständische Firma, auf der anderen Seite die Universität knobelt, soll eine Lösung bringen. Planet entwickelt das Softwaremodule TextRecoPlus, mit der dann schließlich das wirkliche Lesen ganzer Adressen von Briefen möglich werden soll. Und die Firma stellt der Uni für das Verbundprojekt Daten und Software zur Verfügung. „Wir sind überzeugt, dass die Mathematiker in Rostock brauchbare Lösungen entwickeln werden“, sagt Planet-Mitarbeiter Jesper Kleinjohann. Bislang kapituliert die Software noch oft, wenn sie mit schwer leserlicher Schrift konfrontiert wird, besonders wenn einzelne Buchstaben auf unübliche Weise miteinander verbunden sind oder ineinander übergehen.

    Die hohe Kunst der Schrifterkennungsprogramme bleibt vorerst die Entzifferung gebundener Schrift. „Wenn man nicht weiß, was die Handschrift bedeuten soll, dann ist es schwer, sie zu lesen“, sagt Dr. Labahn. Die Rostocker Forscher arbeiten deshalb mit so genannten Hierarchischen und Rekurrenten Künstlichen Neuronalen Netzen. „Das sind mathematische Strukturen, die dem menschlichen Hirn nachempfunden sind und es vermögen, aus großen Datenmengen zu erlernen, neue Bilder zu lesen“, erklärt Dr. Labahn. Das Problem besteht jedoch darin, aus einem Bild mit Handschrift die Bedeutung zu rekonstruieren. Es gibt zu viele mögliche Antworten auf die Frage, wo ein Buchstabe aufhört und der andere anfängt. Die Zahl der Kombinationsmöglichkeiten ist eben groß, auch wenn man nur sinnvolle Wörter als Lösung zulässt. Deshalb werden an der Universität Rostock Algorithmen entwickelt und in akademischen Testszenarien implementiert und getestet. „Die Ergebnisse werden dann von unserem Praxispartner für die wirklichen Anwendungen erneut getestet und schließlich verwendet“, beschreibt Dr. Labahn das Szenario. Sein Team hat inzwischen Kernalgorithmen entwickelt zum Erkennen von handgeschriebenen Worten. „Wir haben nichts von Grund auf Neues erfunden“, gibt sich Dr. Labahn bescheiden. Doch seinem Team gelang es inzwischen, bisher instabilen Algorithmen Zuverlässigkeit einzuhauchen.

    Bei der Schriftanalyse gehen moderne Zeichenerkennungsprogramme nicht von einer Idealform der Buchstaben aus. Vielmehr ist ein Ansatz eben die Verwendung von Neuronalen Netzen, die im Laufe der Zeit lernen, wie das ihnen vorgelegte Material richtig zu entziffern ist. Wenn man ihnen also oft genug sagt, was alles ein A ist, dann wird die „Vorstellung“ des Programms vom abstrakten A immer differenzierter, ohne dass zusätzliche Informationen von außen eingegeben werden müssen. „Optimierung des Abgleichs von Lesedaten mit dem Wörterbuch“, nennt es Dr. Labahn, wenn dann schließlich aus einem längeren Muster aus mehr oder weniger zutreffend erkannten Buchstaben seine wahrscheinlichste Bedeutung in Form eines Wortes unserer Sprache abgeleitet wird.

    Kontakt
    Universität Rostock
    Institut für Mathematik
    Fon: +49 (0)381 498 6631
    Mail: roger.labahn@uni-rostock.de

    Presse+Kommunikation
    Dr. Ulrich Vetter
    Fon: +49 (0)381 498 1013
    Mail: ulrich.vetter@uni-rostock.de
    Web: www.uni-rostock.de


    Bilder

    Mit Arabisch betrachten die Mitarbeiter der Arbeitsgruppe (v.l.n.r.: Tobias Strauß, Roger Labahn, Gundram Leifert, Tobias Grüning) eine ihnen völlig unbekannte Schriftsprache, nichtsdestotrotz ist die Software in der Lage die Texte in wesentlichen Teilen korrekt zu erkennen.
    Mit Arabisch betrachten die Mitarbeiter der Arbeitsgruppe (v.l.n.r.: Tobias Strauß, Roger Labahn, Gu ...
    (Foto: ITMZ/Julia Tetzke)
    None


    Merkmale dieser Pressemitteilung:
    Journalisten, Wissenschaftler
    Mathematik
    überregional
    Forschungs- / Wissenstransfer
    Deutsch


     

    Mit Arabisch betrachten die Mitarbeiter der Arbeitsgruppe (v.l.n.r.: Tobias Strauß, Roger Labahn, Gundram Leifert, Tobias Grüning) eine ihnen völlig unbekannte Schriftsprache, nichtsdestotrotz ist die Software in der Lage die Texte in wesentlichen Teilen korrekt zu erkennen.


    Zum Download

    x

    Hilfe

    Die Suche / Erweiterte Suche im idw-Archiv
    Verknüpfungen

    Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.

    Klammern

    Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).

    Wortgruppen

    Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.

    Auswahlkriterien

    Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).

    Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).