Wenn die Suchmaschine mitdenkt und riesige Textbestände automatisch analysiert

idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
idw-Abo
Medienpartner:
Wissenschaftsjahr


Share on: 
03/21/2016 15:18

Wenn die Suchmaschine mitdenkt und riesige Textbestände automatisch analysiert

Friederike Meyer zu Tittingdorf Pressestelle der Universität des Saarlandes
Universität des Saarlandes

    Wer den Aktienkurs eines Unternehmens vorhersagen will, wertet dafür Nachrichtenportale und soziale Medien aus. Für diese Recherche gibt es mittlerweile viele Dienstleister, die ihre Suchmaschinen mit passenden Schlagworten füttern. Sie stoßen jedoch schnell an Grenzen, wenn mehrdeutige Begriffe nur in schwammig formulierten Zusammenhängen erscheinen. Saarbrücker Informatiker haben daher eine Technologie entwickelt, die mit Hilfe von Künstlicher Intelligenz die Suche in großen Textbeständen wesentlich verbessert. Das neue Verfahren unterstützt auch Autoren bei der Recherche und beim Schreiben von Texten, indem es automatisch Hintergrundinfos anzeigt und passende Weblinks vorschlägt.

    Auch im Zeitalter von Diensthandys und firmeninternen Chatrooms werden die meisten Informationen in Unternehmen nicht über das gesprochene Wort, sondern über Mails, Datenbanken und interne Newsportale ausgetauscht. „Laut einer Marktanalyse des Medienunternehmens Gartner nutzen derzeit jedoch nur ein Viertel der Unternehmen weltweit automatisierte Methoden, um ihre Textbestände zu analysieren und besser zu verstehen. In fünf Jahren werden es nach Gartners Schätzungen mehr als die Hälfte sein, da die Datenmengen in Firmen kontinuierlich wachsen und es immer aufwändiger wird, diese sinnvoll zu strukturieren und mit Erfolg zu durchsuchen“, sagt Johannes Hoffart, Forscher am Max-Planck-Institut für Informatik und Gründer der Firma Ambiverse. Sein Team hat daher eine Technologie für die Analyse von großen Textbeständen entwickelt, bei der viel Rechenpower und Künstliche Intelligenz im Hintergrund buchstäblich „mitdenkt“.

    „Wir greifen bei unseren Textanalysen auf frei verfügbares Wissen zurück, zum Beispiel auf Wikipedia oder große Nachrichtenportale im Internet. Dieses können wir mit unternehmensspezifischem Wissen anreichern, etwa aus Produktkatalogen oder dem Schriftverkehr mit Kunden“, erläutert Hoffart. Über komplexe Rechenverfahren werden die Texte dann genauer durchleuchtet und mit Hilfe von linguistischen Werkzeugen analysiert. „Wir können dann Firmen und Branchen einzelnen Kategorien zuordnen und zum Beispiel untersuchen, wie sich die eigene Produkte im Vergleich mit den Angeboten der Konkurrenz im Markt positionieren konnten“, sagt Hoffart. Die Herausforderung sei dabei, dass die Namen von Unternehmen oder Produkten meist nicht nur einmal auf der Welt vergeben werden, sondern in verschiedenen Bedeutungen und in vielfältigen Zusammenhängen erscheinen.

    „Unsere Technologie hilft dabei, automatisiert die richtigen Bezüge herzustellen“, erklärt der Informatiker. Der Name Paris steht zum Beispiel nicht nur für die Stadt des Lichts und die Hauptstadt Frankreichs, sondern bezieht sich auch auf die griechische Mythologie und ein prominentes Partygirl mit deutschen Vorfahren, das millionenfach im Internet auftaucht. „Nur wenn es gelingt, diese verschiedenen Bedeutungen eines Namens oder eines Sachverhalts richtig zuzuordnen, kann man riesige Textbestände sinnvoll durchsuchen“, so Hoffart. Die von seinem Team entwickelte intelligente Suchmaschine lernt dabei laufend dazu und ordnet automatisch neue Textinhalte den passenden Kategorien zu. „Die Rechenverfahren sind daher auch für Firmen interessant, die Onlinemedien und soziale Netzwerke auswerten, um etwa den Bekanntheitsgrad eines Produktes oder den Erfolg einer Marketingkampagne zu messen“, nennt Hoffart als weiteres Beispiel.

    Pressefoto unter: www.uni-saarland.de/pressefotos

    Presse-Kontakt:
    Dr. Johannes Hoffart
    Ambiverse
    Max-Planck-Institut für Informatik
    Tel +49 681 9325-5024
    Fax +49 681 9325-5099
    johannes@ambiverse.com


    More information:

    http://www.ambiverse.com


    Criteria of this press release:
    Business and commerce, Journalists
    Information technology, Media and communication sciences
    transregional, national
    Transfer of Science or Research
    German


    Mit der neuen Technologie werden mehrdeutige Begriffe klar zugeordnet.


    For download

    x

    Help

    Search / advanced search of the idw archives
    Combination of search terms

    You can combine search terms with and, or and/or not, e.g. Philo not logy.

    Brackets

    You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).

    Phrases

    Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.

    Selection criteria

    You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).

    If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).

    Cookies optimize the use of our services. By surfing on idw-online.de you agree to the use of cookies. Data Confidentiality Statement
    Okay