Institut für Deutsche Sprache:
Zentrum für elektronische Texte
Mit Unterstützung des Ministeriums für Wissenschaft, Forschung und Kunst arbeiten drei bedeutende Einrichtungen in Baden-Württemberg bei dem Aufbau eines deutschen Referenzkorpus zusammen, d.h. einer großen Sammlung deutscher Texte, die elektronisch ausgewertet werden.
Das Institut für Deutsche Sprache (IDS), Mannheim, das Institut für Maschinelle Sprachverarbeitung (IMS) der Universität Stuttgart und das Seminar für Sprachwissenschaft (SfS) der Universität Tübingen, wollen gemeinsam eine elektronische Textsammlung verschiedener Textsorten aufbauen und erweitern, die den Entwicklungsstand der deutschen Gegenwartssprache dokumentiert. Das Vorhaben soll bis Ende 2001 abgeschlossen und die Daten zentral im IDS zugänglich sein. Gesammelt werden beispielsweise Zeitungstexte, Fachtexte und literarische Texte ab Mitte der Fünfzigerjahre. Diese Textsammlung soll in- und ausländischen Sprachwissenschaftlern als Materialgrundlage für Forschungsprojekte wie z. B. die Erstellung von Wörterbüchern und Grammatiken, Konzepte zur maschinellen Übersetzung und Beobachtungen über den Sprachgebrauch zur Verfügung stehen.
Mit dieser Datenbasis können Wörterbücher und Grammatiken für die Benutzer wirklichkeitsnah gestaltet werden, da sie den tatsächlichen Sprachgebrauch zur Grundlage haben.
Die Texte für den Korpusaufbau werden von Zeitungen, Fachzeitschriften, Verlagen, Unternehmen, politischen, gemeinnützigen und anderen öffentlichen Institutionen bezogen. Das Vorhaben ist darauf angewiesen, dass möglichst viele Einrichtungen Texte für diesen wissenschaftlichen, nicht-kommerziellen Zweck zur Verfügung stellen.
Schon jetzt kann das Institut für Deutsche Sprache mit dem Online-System COSMAS in über 400 Millionen Textwörtern recherchieren. Davon sind 60 Millionen über die Internetadresse http://ids-mannheim.de unter dem Stichwort "Service" öffentlich verfügbar. Mit der Erweiterung der elektronischen Textsammlung kommt das IDS einer seiner Aufgaben als zentraler außeruniversitärer Einrichtung zur Erforschung und Dokumentation der deutschen Sprache in ihrem gegenwärtigen Gebrauch und in ihrer neueren Geschichte nach; Baden-Württemberg erweist sich mit der Kooperation der drei Institutionen als bedeutender Standort für moderne Sprachforschung.
Merkmale dieser Pressemitteilung:
Sprache / Literatur
überregional
Forschungsprojekte, Wissenschaftspolitik
Deutsch
Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.
Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).
Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.
Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).
Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).