idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instanz:
Teilen: 
20.03.1997 00:00

Sprachzeugkasten für Wortwerker

Gabriele Rutzen Kommunikation und Marketing
Universität zu Köln

    50/97

    Sprachzeugkasten fuer Wortwerker, Computerunterstuetzte Textanalyse

    Eine gut verstehbare Textoberflaeche sichert den Zugang zur angesprochenen Sache. Je komplexer ein Text ist, desto unuebersichtlicher erscheint er. Mit Hilfe der automatischen Analyse der Textoberflaeche koennen zum Beispiel durch Berechnung von lexikalischen und syntaktischen Gewichten besser verstaendliche sprachliche Botschaften und leichter verstehbare Texte erzeugt werden. Am Seminar fuer Deutsche Sprache und ihre Didaktik hat jetzt eine Arbeitsgruppe unter der Leitung von Professor Dr. Hans Messelken ein System fuer die Computerunterstuetzte Textanalyse (CUT) entwickelt. Es hilft auch bei der Suche nach schwer verstehbaren Zonen in einem vorliegenden Text und erleichtert die Abstimmung zwischen sprachdidaktischen Zielen, philologischen Befunden sowie konsequenter Nutzung von Rechnern und Programmen.

    CUT ist ein Sprachzeugkasten fuer Wortwerker, die Texte entwickeln und verbessern wollen. Es wertet automatisch Texte aus und liefert empirische Befunde zur Redaktion des Ausgangstextes. CUT ermoeglicht Rueckschluesse auf die Verstehbarkeit und den Inhalt von Texten, weil es schwer verstehbare und texttypische Wortformen sowie Satzmuster erkennt und anzeigt. Die spezifischen Merkmale dienen darueber hinaus zur automatischen Informationsfilterung und Informationsbewertung.

    Die Einsatzmoeglichkeiten wurden bisher an mehr als tausend Texten in dreissig Inhaltsfeldern ("Textsorten") ueberprueft; dazu zaehlten u. a. fachsprachliche Texte aus verschiedenen wissenschaftlichen Bereichen, PR-Texte, Gebrauchsanweisungen, politische Reden und Aufsaetze, Schriftsaetze aus der Verwaltungs- und Rechtssprache, aber auch literarische und didaktische Texte (Kinder- und Schulbuecher). Komponenten des CUT-Verfahrens lassen sich leicht in andere Systeme einbinden, wie sie sich im Zusammenhang mit Indexierung und Verschlagwortung grosser Datenbestaende, mit Information-Retrieval fuer das Internet (Informationsfilter) oder in multimedialen Lehr- und Lernsystemen anbieten.

    Das Verfahren stammt aus dem Umfeld der sprachdidaktischen akademischen Lehre und kommunikativer Beratungen von Parteien, Organisationen, Behoerden und Firmen sowie EU-Projekten. Es bietet gute Grundlagen fuer branchenbezogene Spezialdienste von Freiberuflern und Unternehmen und eignet sich fuer zahlreiche Anwendungsformen wie die bedarfsbezogene automatische Wortschatz- und Inhaltserkennung, die Informationsfilterung und -bewertung, die automatische Zusammenfassungen, die Textverstaendlichkeitsanalyse, die Erstellung von benutzerspezifischen Terminologiedatenbanken sowie die rechnerunterstuetzte Redaktion von Texten am Bildschirm.

    CUT ist ein sprachdidaktisches Werkzeug, das lexikographische und textlinguistische Arbeitsgaenge verbindet. Es liefert automatisch lexikalische Analysen vollstaendiger Texte nach unterschiedlichen Sprachschichten, verschiedenen Wortarten und deren Wiederholungen sowie sprachstatistische Daten u. a. zu Verstehbarkeit, Verteilung der Wortarten und ihrer Anteile an Spezialwortschaetzen aus einem semantischen Netz der Umgangssprache. Die konsequente und differenzierte Erfassung des lexikalischen Inventars ermoeglicht die automatische Erstellung von "Abstracts", die in wenigen Saetzen zusammenfassen, was in dem Text zur Sprache kommt. Der Wortschatz des Quelltextes wird indexiert, differenziert, hierarchisiert sowie mit allen Formen und Belegen im Kontext markiert. Lexikalische und syntaktische Gewichte zu einzelnen Woertern, Saetzen und Abschnitten liefern ein praezises, aussagekraeftiges und zuverlaessiges Verstaendlichkeitsprofil. Darueber hinaus lassen sich die fach- bzw. sondersprachlichen Ebenen mit anderen Schichten des Quelltextes vergleichen. Weiterhin bietet das CUT-Verfahren Moeglichkeiten zum rationellen Aufbau, aber auch zur einfachen Nutzung weiterer Grund-, Fach- und Sonderwortschaetze nach beliebigen sprachdidaktischen Zielen.

    Die komplexe Struktur von Sprache und die individuellen Absichten ihrer Benutzer verbieten genau den starren Kanon von Einzelfragen und Festlegungen, wie sie der sachgerechte Einsatz von Rechnern in Ansaetzen der "kuenstlichen Intelligenz" zur Simulation von Bewusstseinsvorgaengen oder Sinnvollzuegen verlangt. Demgegenueber liegt dem CUT-Ansatz die konsequente Trennung von automatisierten rechnerunterstuetzten Ablaeufen und klassischer redaktioneller Arbeit zugrunde. CUT-Befunde sind um Intentions-, Funktions- und Strukturanalysen erweiterbar, mit denen die Anwender ihre fachlichen Erfahrungen und Kenntnisse auf den Quelltext beziehen. Deshalb bietet CUT zwar Befunde zu Textoberflaechen, aber es ersetzt nicht den verstaendigen Umgang mit dem Text. Die sinnvolle Anwendung dieses Verfahrens erfordert Fachleute, die es verstehen, ihre kommunikative Erfahrung und ihr fachliches Wissen bei der Interpretation der Analysen zu aktivieren. Der Einsatz von CUT ist in starkem Ausmass von den aktuellen Fragen bestimmt, die der einzelne Benutzer im Kopf hat. Es ist also ein ziemlich komplexer und flexibler Sprachzeugkasten auf statistischer Grundlage, mit dem sich die Analyse beliebig grosser Textmengen an den aktuellen Bedarf frei anpassen laesst.

    Verantwortlich: Dr. Wolfgang Mathias

    Fuer Rueckfragen steht Ihnen Professor Messelken vormittags unter der Telefonnummer: 02257/271 und nachmittags unter der Telefonnummer 0221/470-4765, der Fax-Nummer: 0221/470-4765 und der Email-Adresse: hans.messelken @uni-koeln.de zur Verfuegung.


    Bilder

    Merkmale dieser Pressemitteilung:
    Es wurden keine Sachgebiete angegeben
    überregional
    Es wurden keine Arten angegeben
    Deutsch


     

    Hilfe

    Die Suche / Erweiterte Suche im idw-Archiv
    Verknüpfungen

    Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.

    Klammern

    Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).

    Wortgruppen

    Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.

    Auswahlkriterien

    Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).

    Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).