Die Schlagwortsuche in Textbeständen ist heute Standard. Das Softwaretool SWAPit ermöglicht es zusätzlich, inhaltliche Zusammenhänge von Dokumenten auf verschiedenen Ebenen zu analysieren. So wird auf der CeBIT gezeigt, wie sich Fußballnachrichten auswerten lassen.
Spielt Ballack eigentlich besser, nachdem er einen lukrativen Werbevertrag unterzeichnet hat? Oder doch schlechter? Hat der Torwartstreit zwischen Kahn und Lehmann die Leistung der beiden gefördert oder halten sie nun tendenziell weniger Bälle? Und welche Auswirkungen hat das auf ihre Vereine? Wenn storyhungrige Reporter dies nicht nur aus dem Bauch heraus, sondern fundiert beurteilen wollen, müssen sie Nachrichten aus Sportzeitschriften mit aktuellen Statistiken, Vereinsmitteilungen und Artikeln der Regenbogenpresse abgleichen. Solche vielschichtigen Analysen lassen sich nun auch halbautomatisch erstellen: Forscher des Fraunhofer-Instituts für Angewandte Informationstechnik FIT in Sankt Augustin bei Bonn haben dafür das Softwaretool SWAPit entwickelt. Mit ihm ist es möglich, mit wenigen Blicken inhaltliche Beziehungen in Textdaten und damit zusammenhängende Zusatzinformationen festzustellen.
"Der Name SWAPit leitet sich vom englischen Verb to swap ab, was soviel wie ?wechseln? bedeutet", sagt Andreas Becks vom FIT. "Das Programm fordert den Nutzer auf, Textinformationen unter wechselnden Blickwinkeln zu betrachten. So kann er auch Zusatzinformationen zu den Dokumenten miteinander vergleichen." Dazu präsentiert das Tool Textsammlungen als eine Art Landkarte, in der ähnliche Texte Cluster bilden. Klickt der Nutzer auf eine solche Anhäufung, so werden ihm auf dem Bildschirm direkt neben der Karte gemeinsame Merkmale angezeigt. "Durch diese zusätzlichen Sichtweisen können Anwender ihre Daten viel umfangreicher auswerten, Statistiken erstellen und vorher verborgene Muster erkennen", betont Becks.
Presserecherche ist nur ein Anwendungsbeispiel für diese integriertes Text- und Data Mining genannte Methode. So lassen sich mit der Software zum Beispiel auch Patente zur Forschungsplanung analysieren, Dokumente über Marktsegmente untersuchen oder Anfragen in Service Centern auswerten. "Wir hatten aber auch schon ein interdisziplinäres, kulturwissenschaftliches Projekt, in dem SWAPit Kommunikationsschwierigkeiten löste", berichtet Becks. "Hier hat es gezeigt, wie unterschiedlich verschiedene Disziplinen den gleichen Begriff definieren." Ihren Prototyp haben die Forscher bereits mit Industriepartnern aus verschiedensten Bereichen getestet. Er ist kompatibel mit Standardtextformaten wie doc, pdf und html, er sei bei einer konkreten Vermarktung aber problemlos auf weitere Formate ausdehnbar, wie Becks versichert. Weitere Details können Interessenten auch vom 9. bis 15. März auf der CeBIT in Hannover erfahren (Halle 9, Stand B36).
Ansprechpartner:
Dr. Andreas Becks
Telefon: 02 41 / 80-2 15 03, Fax: -2 23 21
andreas.becks@fit.fraunhofer.de
Dipl.-Inform. Christian Seeling
Telefon: 02 41 / 80-2 15 33
christian.seeling@fit.fraunhofer.de
http://www.fit.fraunhofer.de/projekte/swapit
Mit dem Programm lassen sich auch Querbezüge zwischen Nationalspielern und der Sportberichterstattun ...
© Fraunhofer FIT
None
Criteria of this press release:
Information technology
transregional, national
Miscellaneous scientific news/publications, Research projects
German
Mit dem Programm lassen sich auch Querbezüge zwischen Nationalspielern und der Sportberichterstattun ...
© Fraunhofer FIT
None
You can combine search terms with and, or and/or not, e.g. Philo not logy.
You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).
Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.
You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).
If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).