idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instanz:
Teilen: 
11.10.2022 09:45

Kurrent lesen mit Transkribus

Dr. Christian Flatz Büro für Öffentlichkeitsarbeit
Universität Innsbruck

    Mit Hilfe künstlicher Intelligenz können Computer handgeschriebene Texte entziffern und für alle lesbar machen. Die an der Universität Innsbruck mitentwickelte Transkribus-Plattform macht diese Technologie der Wissenschaft und breiten Öffentlichkeit zugänglich. Eine immer größere Gruppe von Laien nutzt Transkribus zu Erforschung ihrer Familiengeschichte. Vor kurzem trafen sich Anwender*innen aus aller Welt in Innsbruck.

    Handschriften sind so individuell wie Menschen. Dennoch sind Computer heute in der Lage, handschriftliche Texte in unterschiedlichsten Sprachen automatisch zu erkennen. Die von der Universität Innsbruck mitentwickelte Software-Plattform Transkribus macht diese Technologie der Wissenschaftsgemeinde, interessierten Archiven und der breiten Öffentlichkeit zugänglich. Über 90.000 Nutzerinnen und Nutzer aus aller Welt verwenden die Plattform bereits, um handschriftliche Dokumente lesbar und durchsuchbar zu machen. Eine immer größer werdende Gruppe interessiert sich für ihre Familiengeschichte und begibt sich in Kirchenbüchern, Verträgen oder in historischen Dokumenten auf die Suche nach ihren Vorfahren. „Die händische Suche in diesen Dokumenten kann eine sehr mühsame Angelegenheit sein. Durch unsere Technologie wird die Erforschung der Familiengeschichte nun wesentlich erleichtert“, sagt Günter Mühlberger von der Arbeitsgruppe Digitalisierung/Archivierung an der Universität Innsbruck und Verwaltungsratsvorsitzender der europäischen Genossenschaft READ-COOP.

    Große Bestände rasch durchsuchbar

    In Archiven und Bibliotheken lagern historische Dokumente von unschätzbarem Wert. Diese Dokumente nehmen viel Platz ein. So füllen zum Beispiel die Dokumente im Staatsarchiv in Wien 350 Regalkilometer. Der Großteil dieser Dokumente liegt nur handschriftlich vor und ist für viele Benutzer nicht mehr lesbar, da sie in Kurrentschrift verfasst sind. „Hier hilft die Transkribus-Plattform, auf der diese Handschrift automatisiert erkannt und damit für alle lesbar gemacht wird“, sagt Günter Mühlberger. Die Dokumente werden dadurch auch durchsuchbar. Das erleichtert die Recherche in historischen Beständen enorm, weil auf diese Weise Hunderte oder Tausende Dokumente gleichzeitig nach Familiennamen oder anderen Begriffen durchstöbert werden können.

    Kurrent, Arabisch und Chinesisch lesen

    Transkribus arbeitet mit neuronalen Netzen. Diese maschinenlernenden Methoden haben den großen Vorteil, dass sie nicht mehr speziell für eine bestimmte Handschrift programmiert werden müssen. „Die Benutzerinnen und Benutzer bringen der Maschine bei, die Schrift zu lesen“, sagt Günter Mühlberger. „Und eine Maschine ermüdet nicht, das heißt, sie kann auch Tausende, Hundertausende oder Millionen von Seiten automatisiert verarbeiten. Das haben wir beispielsweise für das finnische Nationalarchiv gemacht, bei dem nunmehr über 2 Millionen handschriftliche Dokumente aus dem 19. Jahrhundert für alle durchsuchbar sind.“ Die verwendete Technologie ist völlig unabhängig von der Sprache und der eigentlichen Schriftart. Transkribus erkennt nicht nur Kurrentschrift oder auch moderne Handschriften, sondern auch mittelalterliche Schriften, aber auch Hebräisch, Arabisch oder indische Schriften. „Und derzeit führen wir gerade Experimente für Chinesisch durch, für altes Chinesisch“, freut sich Mühlberger.

    Auch Forschung wird enorm erleichtert

    Auch in der Wissenschaft sind die Anwendungsmöglichkeiten von Transkribus vielfältig. Der Innsbrucker Altphilologe William Barton, der für seine Forschung mit Unterstützung von Transkribus den mit 1,2 Millionen Euro dotierten START-Preis erhalten hat, entschlüsselt beispielsweise verloren geglaubte Tagebuchaufzeichnungen von Karl Benedikt Hase aus dem 19 Jahrhundert, geschrieben in handschriftlichem Altgriechisch. Darin enthaltene wertvolle Informationen sollen anderen Wissenschaften zugänglich gemacht werden: „Die privaten und geheimen Tagebücher des Forschers Karl Benedikt Hase enthalten Aufzeichnungen aus neun Jahren. Die Textmenge ist enorm, es sind etwa 2.500 Seiten“, erzählt William Barton vom Institut für Neulateinische Studien. „Ich habe der Maschine anhand von 100 Seiten ein Modell für Hases Handschrift antrainiert. Jetzt ist sie selbst in der Lage, alle seine Tagebücher zu lesen und den Text zuverlässig zu transkribieren.“ Eine aktuelle Studie der Universität Edinburgh hat zutage gefördert, dass inzwischen über 400 wissenschaftliche Publikationen erschienen sind, die unter Zuhilfenahme von Transkribus entstanden sind.

    Anwender trafen sich in Innsbruck

    Transkribus wurde mit Unterstützung der Europäischen Union entwickelt und wird seit 2019 von der von der Universität Innsbruck mitgegründeten europäischen Genossenschaft READ-Coop betrieben, die mittlerweile mehr als 120 Mitglieder aus 27 Ländern vorweisen kann. Am 29. und 30. September trafen sich an der Universität Innsbruck über 200 Expert*innen für Handschriftenerkennung und Nutzer*innen der Transkribus-Plattform, um die jüngsten Fortschritte der Technologie und deren Anwendungen auf unterschiedlichsten Gebieten zu diskutieren. Gleichzeitig verfolgten Teilnehmer*innen aus aller Welt die Tagung online.


    Wissenschaftliche Ansprechpartner:

    Mag. Dr. Günter Mühlberger
    Digitalisierung/Archivierung (DEA)
    Universität Innsbruck
    Tel.: +43 512 507 8454
    E-Mail: guenter.muehlberger@uibk.ac.at


    Weitere Informationen:

    https://readcoop.eu/transkribus/ - Transkribus
    https://readcoop.eu/ - READ-Coop
    https://readcoop.eu/tuc22/ - Transkribus User Conference 2022


    Bilder

    Über die Online-Plattform können auch Laien sehr einfach historische Handschriften digitalisieren und lesen.
    Über die Online-Plattform können auch Laien sehr einfach historische Handschriften digitalisieren un ...

    Uni Innsbruck

    Die Transkribus-Plattform kann unterschiedlichste Handschriften verarbeiten. Gibt es kein gut passendes Modell, können Nutzer*innen die Maschine selbst trainieren.
    Die Transkribus-Plattform kann unterschiedlichste Handschriften verarbeiten. Gibt es kein gut passen ...

    Uni Innsbruck


    Merkmale dieser Pressemitteilung:
    Journalisten, Wissenschaftler, jedermann
    Geschichte / Archäologie, Kulturwissenschaften
    überregional
    Forschungs- / Wissenstransfer, Wissenschaftliche Tagungen
    Deutsch


     

    Über die Online-Plattform können auch Laien sehr einfach historische Handschriften digitalisieren und lesen.


    Zum Download

    x

    Die Transkribus-Plattform kann unterschiedlichste Handschriften verarbeiten. Gibt es kein gut passendes Modell, können Nutzer*innen die Maschine selbst trainieren.


    Zum Download

    x

    Hilfe

    Die Suche / Erweiterte Suche im idw-Archiv
    Verknüpfungen

    Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.

    Klammern

    Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).

    Wortgruppen

    Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.

    Auswahlkriterien

    Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).

    Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).