Institut für Deutsche Sprache:
Zentrum für elektronische Texte
Mit Unterstützung des Ministeriums für Wissenschaft, Forschung und Kunst arbeiten drei bedeutende Einrichtungen in Baden-Württemberg bei dem Aufbau eines deutschen Referenzkorpus zusammen, d.h. einer großen Sammlung deutscher Texte, die elektronisch ausgewertet werden.
Das Institut für Deutsche Sprache (IDS), Mannheim, das Institut für Maschinelle Sprachverarbeitung (IMS) der Universität Stuttgart und das Seminar für Sprachwissenschaft (SfS) der Universität Tübingen, wollen gemeinsam eine elektronische Textsammlung verschiedener Textsorten aufbauen und erweitern, die den Entwicklungsstand der deutschen Gegenwartssprache dokumentiert. Das Vorhaben soll bis Ende 2001 abgeschlossen und die Daten zentral im IDS zugänglich sein. Gesammelt werden beispielsweise Zeitungstexte, Fachtexte und literarische Texte ab Mitte der Fünfzigerjahre. Diese Textsammlung soll in- und ausländischen Sprachwissenschaftlern als Materialgrundlage für Forschungsprojekte wie z. B. die Erstellung von Wörterbüchern und Grammatiken, Konzepte zur maschinellen Übersetzung und Beobachtungen über den Sprachgebrauch zur Verfügung stehen.
Mit dieser Datenbasis können Wörterbücher und Grammatiken für die Benutzer wirklichkeitsnah gestaltet werden, da sie den tatsächlichen Sprachgebrauch zur Grundlage haben.
Die Texte für den Korpusaufbau werden von Zeitungen, Fachzeitschriften, Verlagen, Unternehmen, politischen, gemeinnützigen und anderen öffentlichen Institutionen bezogen. Das Vorhaben ist darauf angewiesen, dass möglichst viele Einrichtungen Texte für diesen wissenschaftlichen, nicht-kommerziellen Zweck zur Verfügung stellen.
Schon jetzt kann das Institut für Deutsche Sprache mit dem Online-System COSMAS in über 400 Millionen Textwörtern recherchieren. Davon sind 60 Millionen über die Internetadresse http://ids-mannheim.de unter dem Stichwort "Service" öffentlich verfügbar. Mit der Erweiterung der elektronischen Textsammlung kommt das IDS einer seiner Aufgaben als zentraler außeruniversitärer Einrichtung zur Erforschung und Dokumentation der deutschen Sprache in ihrem gegenwärtigen Gebrauch und in ihrer neueren Geschichte nach; Baden-Württemberg erweist sich mit der Kooperation der drei Institutionen als bedeutender Standort für moderne Sprachforschung.
Criteria of this press release:
Language / literature
transregional, national
Research projects, Science policy
German
You can combine search terms with and, or and/or not, e.g. Philo not logy.
You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).
Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.
You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).
If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).