Neue Texterkennungssoftware hilft Bibliotheken und Archive
Innovation aus Potsdam wird am 26.05.00 vorgestellt
Seltene und wertvolle Schriften, Buecher und Archivmaterial des 16. bis 19. Jahrhunderts liegen haeufig nur in wenigen, meist unzugaenglichen Exemplaren vor. Forscher und interessierte Laien, die diese Werke nutzen moechten, muessen sehr oft lange Wartezeiten in Kauf nehmen. Auch dann erhalten sie nur fuer einen sehr beschraenkten Zeitraum Zugang zu diesem Material. Bibliothekare und Archivare muessen viele Wuensche der Nutzer enttaeuschen. Das Arbeiten mit Scanbildern oder Mikrofiches ist ebenso muehsam wie mit der Originalschrift, da Bilder nicht recherchefaehig sind. Die Universitaet Potsdam und die aus der Hochschule ausgegruendete WiSenT GmbH haben nunmehr einen entscheidenden Schritt getan, um diesen muehsamen und langwierigen Vorgang zu automatisieren und zu effektivieren. Im Rahmen eines von den Ministerien fuer Wissenschaft und Wirtschaft des Landes Brandenburg gemeinsam gefoerderten Verbundprojektes wurde eine Erkennungssoftware (OCR) fuer altdeutsche Schriften entwickelt. Zur automatischen Erkennung von Frakturschriften werden moderne Methoden der Bildverarbeitung eingesetzt. Mit Hilfe dieser Verfahren ist es moeglich, gescannte Dokumente mit Frakturschrift weitgehend automatisiert in Volltext umzusetzen und gute Erkennungsergebnisse selbst bei mittelmaeßigen und schlechten Vorlagen zu erzielen. Die Vorteile liegen auf der Hand - wertvolle Buecher, Lexika, Zeitschriften und andere Schriftstuecke koennen effizient erfasst und zugaenglich gemacht werden. Historische Schriftstuecke werden auf diese Weise effektiv recherchierbar. Selbst bei schlechten Vorlagen koennen die Kosten der Volltexterfassung deutlich gesenkt werden. Am 26. Mai 2000 werden im Rahmen eines Workshops, der von 10.00 bis 16.00 Uhr im Haus der Wirtschaft in Potsdam stattfindet, die Ergebnisse des Verbundprojektes vorgestellt und aktuelle Probleme der praktischen Nutzung mit potentiellen Anwendern diskutiert. (Das Haus der Wirtschaft befindet sind in 14473 Potsdam, Schlaatzweg 2.)
Hinweis an die Redaktionen:
Fuer Rueckfragen stehen Ihnen Dr. Hartmut Schachtzabel (WiSent GmbH) unter Tel.: 0331/ 977-1476 und Dr. Andreas Bohlen (UP TRANSFER GmbH an der Universitaet Potsdam) unter Tel.: 0331/977-1119 gern zur Verfuegung. Weitere Informationen sind auch ueber http://www.pitt.uni-potsdam.de/OCR-Workshop abrufbar.
Criteria of this press release:
interdisciplinary
regional
Research results
German
You can combine search terms with and, or and/or not, e.g. Philo not logy.
You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).
Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.
You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).
If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).