Wenn die Suchmaschine mitdenkt und riesige Textbestände automatisch analysiert

idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
idw-Abo
Medienpartner:
Wissenschaftsjahr


Teilen: 
21.03.2016 15:18

Wenn die Suchmaschine mitdenkt und riesige Textbestände automatisch analysiert

Friederike Meyer zu Tittingdorf Pressestelle der Universität des Saarlandes
Universität des Saarlandes

    Wer den Aktienkurs eines Unternehmens vorhersagen will, wertet dafür Nachrichtenportale und soziale Medien aus. Für diese Recherche gibt es mittlerweile viele Dienstleister, die ihre Suchmaschinen mit passenden Schlagworten füttern. Sie stoßen jedoch schnell an Grenzen, wenn mehrdeutige Begriffe nur in schwammig formulierten Zusammenhängen erscheinen. Saarbrücker Informatiker haben daher eine Technologie entwickelt, die mit Hilfe von Künstlicher Intelligenz die Suche in großen Textbeständen wesentlich verbessert. Das neue Verfahren unterstützt auch Autoren bei der Recherche und beim Schreiben von Texten, indem es automatisch Hintergrundinfos anzeigt und passende Weblinks vorschlägt.

    Auch im Zeitalter von Diensthandys und firmeninternen Chatrooms werden die meisten Informationen in Unternehmen nicht über das gesprochene Wort, sondern über Mails, Datenbanken und interne Newsportale ausgetauscht. „Laut einer Marktanalyse des Medienunternehmens Gartner nutzen derzeit jedoch nur ein Viertel der Unternehmen weltweit automatisierte Methoden, um ihre Textbestände zu analysieren und besser zu verstehen. In fünf Jahren werden es nach Gartners Schätzungen mehr als die Hälfte sein, da die Datenmengen in Firmen kontinuierlich wachsen und es immer aufwändiger wird, diese sinnvoll zu strukturieren und mit Erfolg zu durchsuchen“, sagt Johannes Hoffart, Forscher am Max-Planck-Institut für Informatik und Gründer der Firma Ambiverse. Sein Team hat daher eine Technologie für die Analyse von großen Textbeständen entwickelt, bei der viel Rechenpower und Künstliche Intelligenz im Hintergrund buchstäblich „mitdenkt“.

    „Wir greifen bei unseren Textanalysen auf frei verfügbares Wissen zurück, zum Beispiel auf Wikipedia oder große Nachrichtenportale im Internet. Dieses können wir mit unternehmensspezifischem Wissen anreichern, etwa aus Produktkatalogen oder dem Schriftverkehr mit Kunden“, erläutert Hoffart. Über komplexe Rechenverfahren werden die Texte dann genauer durchleuchtet und mit Hilfe von linguistischen Werkzeugen analysiert. „Wir können dann Firmen und Branchen einzelnen Kategorien zuordnen und zum Beispiel untersuchen, wie sich die eigene Produkte im Vergleich mit den Angeboten der Konkurrenz im Markt positionieren konnten“, sagt Hoffart. Die Herausforderung sei dabei, dass die Namen von Unternehmen oder Produkten meist nicht nur einmal auf der Welt vergeben werden, sondern in verschiedenen Bedeutungen und in vielfältigen Zusammenhängen erscheinen.

    „Unsere Technologie hilft dabei, automatisiert die richtigen Bezüge herzustellen“, erklärt der Informatiker. Der Name Paris steht zum Beispiel nicht nur für die Stadt des Lichts und die Hauptstadt Frankreichs, sondern bezieht sich auch auf die griechische Mythologie und ein prominentes Partygirl mit deutschen Vorfahren, das millionenfach im Internet auftaucht. „Nur wenn es gelingt, diese verschiedenen Bedeutungen eines Namens oder eines Sachverhalts richtig zuzuordnen, kann man riesige Textbestände sinnvoll durchsuchen“, so Hoffart. Die von seinem Team entwickelte intelligente Suchmaschine lernt dabei laufend dazu und ordnet automatisch neue Textinhalte den passenden Kategorien zu. „Die Rechenverfahren sind daher auch für Firmen interessant, die Onlinemedien und soziale Netzwerke auswerten, um etwa den Bekanntheitsgrad eines Produktes oder den Erfolg einer Marketingkampagne zu messen“, nennt Hoffart als weiteres Beispiel.

    Pressefoto unter: www.uni-saarland.de/pressefotos

    Presse-Kontakt:
    Dr. Johannes Hoffart
    Ambiverse
    Max-Planck-Institut für Informatik
    Tel +49 681 9325-5024
    Fax +49 681 9325-5099
    johannes@ambiverse.com


    Weitere Informationen:

    http://www.ambiverse.com


    Merkmale dieser Pressemitteilung:
    Journalisten, Wirtschaftsvertreter
    Informationstechnik, Medien- und Kommunikationswissenschaften
    überregional
    Forschungs- / Wissenstransfer
    Deutsch


    Mit der neuen Technologie werden mehrdeutige Begriffe klar zugeordnet.


    Zum Download

    x

    Hilfe

    Die Suche / Erweiterte Suche im idw-Archiv
    Verknüpfungen

    Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.

    Klammern

    Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).

    Wortgruppen

    Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.

    Auswahlkriterien

    Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).

    Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).

    Cookies optimieren die Bereitstellung unserer Dienste. Durch das Weitersurfen auf idw-online.de erklären Sie sich mit der Verwendung von Cookies einverstanden. Datenschutzerklärung
    Okay