idw - Informationsdienst
Wissenschaft
Erster Transferbereich in den Geisteswissenschaften
Sprache verändert und entwickelt sich. Daher müssen Wörterbücher ständig aktualisiert und vervollständigt werden. Auf der Suche nach neuen Wörtern, Bedeutungen und Wortkombinationen durchforsten die Wörterbuchredakteure Zeitungen, Zeitschriften und Bücher und notieren alles, was ihnen wichtig erscheint. Diese Tätigkeit nennt man Exzerption. In den kommenden zwei Jahren werden Computerlinguisten der Universität Stuttgart in Zusammenarbeit mit zwei der wichtigsten Wörterbuchverlage Deutschlands, Langenscheidt (München) und Duden - Bibliographisches Institut, F.A. Brockhaus (Mannheim), erproben, wie weitgehend diese Exzerption vom Computer unterstützt werden kann. Die Wissenschaftler des Instituts für Maschinelle Sprachverarbeitung der Uni Stuttgart bringen auf diesem Gebiet umfangreiche Erfahrungen mit: sie haben Computerprogramme entwickelt, die große Textmengen lesen und nach bestimmten grammatischen oder lexikalischen Kriterien sortieren können. Verarbeitet werden dabei meist viele Millionen Wörter, das entspricht mehreren kompletten Jahrgängen einer Tageszeitung auf einmal.
Diese "linguistischen Extraktionswerkzeuge" werden nun innerhalb des Transferbereichs "Automatische Exzerption: Corpusbasierte Materialbeschaffung für die Lexikographie" der Deutschen Forschungsgemeinschaft (DFG) in den Dienst der Wörterbuchredaktionen gestellt. Das neue, von den beiden Verlagen und der DFG finanzierte insgesamt mit rund 500.000 Euro finanzierte Vorhaben dient dem Know-how-Transfer von der Forschung in die Praxis. Es ist der erste Transferbereich der DFG in den Geisteswissenschaften: Techniken aus der Computerlinguistik, die seit Jahren in einem Sonderforschungsbereich der Universitäten Stuttgart und Tübingen erarbeitet wurden, werden jetzt im konkreten Arbeitsumfeld getestet. Ergebnis soll eine Software sein, die dem Wörterbuchredakteur Routinearbeit abnimmt und seine Entscheidung auf eine breite Materialbasis stellt. Zudem eröffnen sich Perspektiven für neue elektronische Wörterbuchprodukte.
Zur Vorstellung des Transferbereichs laden wir herzlich ein zur Pressekonferenz:
Zeit: Donnerstag, 24. Januar 2002 um 11.30 Uhr
Ort: Institut für Maschinelle Sprachverarbeitung / Computerlinguistik, Azenbergstraße 12 (Stadtmitte), Raum 12.21, 2. Stock
Als Gesprächspartner stehen zur Verfügung Prof. Dr. Christian Rohrer und seine Mitarbeiter vom Institut für Maschinelle Sprachverarbeitung der Uni Stuttgart sowie Dr. Vincent Docherty (Leiter Wörterbücher, Langenscheidt, München) und Dr. Matthias Wermke (Leiter Dudenredaktion, Mannheim).
Anschließend geben die Stuttgarter Wissenschaftler bei Demonstrationen am Rechner Einblick in die Methodik.
Bitte bestätigen Sie Ihre Teilnahme an der Pressekonferenz unter Fax 0711/121-2188 oder e-mail: presse@uni-stuttgart.de
Sollten Sie nicht teilnehmen können, können Sie unter der e-mail: heid@ims.uni-stuttgart.de oder Fax 0711/121-1366 Informationsmaterialien bei Dr. Uli Heid am Institut für Maschinelle Sprachverarbeitung anfordern.
Merkmale dieser Pressemitteilung:
Informationstechnik, Medien- und Kommunikationswissenschaften, Sprache / Literatur
überregional
Forschungsprojekte
Deutsch
Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.
Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).
Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.
Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).
Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).