idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instanz:
Teilen: 
22.07.2014 14:17

Software verschafft Überblick in großen Dokumenten

Dr. Norbert Aschenbrenner Corporate Communications, Corporate Technology
Siemens AG

    Eine Software soll künftig große Schriftstücke wie z.B. Ausschreibungsunterlagen, die häufig mehr als tausend Seiten umfassen, besser analysieren können. Experten der globalen Siemens-Forschung Corporate Technology entwickelten einerseits eine Suche, die es ermöglicht nach Schlüsselwörtern und Textpassagen in allen Dokumenten z.B. einer Ausschreibung gleichzeitig zu suchen, ohne die Dokumente selbst öffnen zu müssen. Das macht die Suche sehr schnell. Im Millisekundenbereich kann der Nutzer sich die Ergebnisse in den Dokumenten selbst anschauen. Andererseits entwickelten sie eine Komponente, die die Veränderungen der Anforderungen gegenüber früheren Versionen prüft. Wie die Zeitschrift "Pictures of the Future" in ihrer aktuellen Ausgabe berichtet, soll am Ende eine semantischen Software stehen, die Zusammenhänge erkennt und so relevante Informationen findet.

    Ursprünglich entwickelte Corporate Technology die Software im Rahmen einer Machbarkeitsstudie zur Digitalisierung aller Grundbücher in Deutschland. Gesucht war eine Technik, um aus den Grundbüchern der vergangenen 50 Jahre - rund 500 Millionen pdf-Seiten - automatisiert Informationen wie Eigentümer, Grundstückgröße oder Hypothekenbelastungen zu erfassen. Die Software musste in der Lage sein, unter Ausnutzung der Dokumentstruktur die jeweiligen Informationen zu extrahieren. Dabei musste sie auch für Scans schlecht kopierter Schreibmaschinenseiten oder für mehrfach korrigierte Dokumente funktionieren.

    Bei der Weiterentwicklung der Software für industrielle Ausschreibungen arbeiten die CT-Forscher eng mit Kollegen aus den jeweiligen Siemens-Geschäften zusammen. Auf dieser Basis entwickeln die Forscher charakteristische Such-Algorithmen, um im Dokument alle Informationen zu bestimmten Themen, beispielsweise zu Sicherheit oder Emissionsschutz zu finden.

    Weil im Laufe eines Projekts Ausschreibungen wiederholt angepasst werden, identifiziert die Software in einem zweiten Schritt Änderungen gegenüber vorherigen Versionen und zeigt sie dem Nutzer an. In einem dritten Schritt werden Analogien zu früheren, ähnlichen Ausschreibungen gesucht, so dass die Nutzer sehen können, wie bestimmte Anforderungen damals bewertet wurden. Insgesamt spart die automatisierte semantische Auswertung großer Ausschreibungs-Dokumente Zeit, vermeidet Fehler und macht es einfacher, kurzfristige Änderungen zu integrieren und zu analysieren.

    Pressebild: http://www.siemens.com/press/de/pressebilder/innovationnews/2014/in20140703-01.h...


    Weitere Informationen:

    http://www.siemens.de/innovationnews


    Bilder

    Merkmale dieser Pressemitteilung:
    Journalisten
    Informationstechnik
    überregional
    Forschungs- / Wissenstransfer
    Deutsch


     

    Hilfe

    Die Suche / Erweiterte Suche im idw-Archiv
    Verknüpfungen

    Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.

    Klammern

    Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).

    Wortgruppen

    Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.

    Auswahlkriterien

    Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).

    Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).