idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instance:
Share on: 
02/13/2023 10:59

Das Googlen nach Gesundheitsfragen - Studie deckt schlechte Verständlichkeit auf

Vanessa Offermann Abteilung Hochschulkommunikation
Hochschule Heilbronn

    • Aktuelle Studie hat Lesbarkeit und Themenfelder von Gesundheitsinformationen im Internet untersucht.

    • 14,2 Millionen gesundheitsrelevante, deutschsprachige Webseiten in Deutschland, Österreich und der Schweiz sind analysiert worden.

    • Ergebnis: Gesundheitswebseiten benötigen sprachliche Verbesserungen, um von Leser*innen verstanden zu werden.

    Heilbronn, Februar 2023. Informationen zu Krankheiten, Symptomen und zu Gesundheitsthemen allgemein können heutzutage ganz schnell und unkompliziert über das Internet gefunden werden. Ob Selbstdiagnostik, Hintergründe zu einem bestimmten Medikament oder einer Behandlung: die Anzahl der Webseiten ist groß. Doch wie verständlich sind diese Texte eigentlich? Helfen uns die Informationen überhaupt oder verstehen wir vielleicht so wenig, dass wir abgeschreckt die Suche beenden? Welche Themenfelder werden überhaupt abgedeckt und wer steckt hinter den Angeboten in diesem unübersichtlichen Informationsdschungel zum Thema Gesundheit?

    Der Medizininformatiker Richard Zowalla stellte sich diesen Fragen. Im Rahmen seiner Dissertation erfasste ein sogenannter fokussierter Web-Crawler – ein Computerprogramm, dass das Internet unter Zuhilfenahme von KI-Verfahren automatisch nach bestimmten Informationen durchsucht – über den Zeitraum eines ganzes Jahres (Mai 2019 – Mai 2020) die URLs und Textinhalte von insgesamt 14,2 Millionen gesundheitsrelevanten deutschsprachigen Webseiten. Anschließend wurden die Inhalte mit Verfahren aus dem KI-Bereich ausgewertet und die Ergebnisse dieser Studie in einem internationalen Fachjournal veröffentlicht.

    „Während der Crawler von Webseite zu Webseite springt, speichern wir nur Verlinkungen zwischen gesundheitsrelevanten Internetseiten. Auf diese Weise entsteht ein sogenannter Web-Graph, der ausschließlich gesundheitsrelevante Webseiten und deren Verlinkungen untereinander enthält“, erklärt Zowalla. „Die Wichtigkeit einer Webseite innerhalb dieses Gesundheitsweb-Graphen können wir dann beispielsweise mit Google‘s PageRank bestimmen“, ergänzt Professor Daniel Pfeifer (HHN), der neben Professor Thomas Wetter von der Universität Heidelberg die Promotion von Richard Zowalla betreut. Das Grundprinzip von PageRank ist einfach: Je mehr Links auf eine Seite verweisen, desto höher ist das Gewicht dieser Seite, sie scheint also eine höhere Bedeutsamkeit zu haben.

    Mit Hilfe des Page Rank wurde jeweils für Deutschland, Österreich und die Schweiz eine Top 1000 Liste berechnet, wodurch insgesamt eine Top 3000 Liste des Gesundheitswebs entstand. Die umfassende Untersuchung zeigt, dass öffentliche Institutionen, wie beispielweise das Robert-Koch-Institut und nicht kommerzielle Anbieter von Gesundheitsinformationen wie beispielsweise die Webseite der deutschen Krebshilfe nur knapp die Hälfte der Top 3000 Seiten des Gesundheitswebs in Deutschland, Österreich und der Schweiz ausmachen, während der Großteil an Informationen durch private Anbieter wie Webseiten von Ärzt*innen zur Verfügung gestellt wird. Die hohen Ränge (jeweils die vordersten 20 bis 50 Seiten) der Top 3000 nehmen in allen drei Ländern vor allem die Informationsangebote von öffentlichen Einrichtungen ein. „Interessant ist jedoch, dass dies nicht unbedingt die Informationsangebote sind, die ein kommerzieller Suchmaschinenanbieter als Top Treffer präsentiert, hier stehen oftmals private Anbieter im Vordergrund“, erläutert Zowalla.

    Als Maßstab für die Lesbarkeit eines Textes wurden der FRE-Score bzw. die vierte Wienersachtextformel verwendet. Als schwerer lesbar werden dabei unter anderem längere medizinische Fachbegriffe, lange oder verschachtelte Sätze gewertet. Diese Lesbarkeitsmaße bewerten einen Text entweder als Punktwert (Score) oder in Form von Schuljahren. Erhält ein Text die Bewertung 11 sollten Leser*innen, die die 11. Klasse abgeschlossen haben, diese sprachlich klar erfassen können. Im Falle von Gesundheitsinformationen würde man empfehlen, dass diese Texte bereits von Schüler*innen aus der Mittelstufe verstanden werden können. Das verwendete Vokabular wurde zudem mit Hilfe eines KI-Verfahrens auf dessen Laientauglichkeit untersucht. „Die Studie jedoch, dass im deutschsprachigen Gesundheitsweb das Niveau deutlich darüber liegt und ein Text nur dann vollständig erfasst werden kann, wenn 13 bis 14 Jahre schulische Bildung vorliegen“, erklärt Zowalla. Diese Dauer entspricht einem Hochschulstudium. „Bemerkenswert ist jedoch, dass das verwendete Vokabular größtenteils gut für ein Laienpublikum geeignet ist“, ergänzt Zowalla. Schwer lesbare Texte zu gesundheits- oder krankheitsbezogenen Themen erzeugen somit eine Barriere im Umgang mit Informationen aus dem Internet, auch wenn das verwendete Vokabular aus medizinischer Sicht angemessen erscheint.

    Die Themen des Gesundheitswebs wurden mittels Latent Dirchlet Allocation (LDA) bestimmt. LDA ist ein Verfahren, das verwendet wird, um eine große Menge an unstrukturierten Texten zu kategorisieren und Themen zu identifizieren. Die häufigsten Themenfelder im Gesundheitsweb in Deutschland, Österreich und der Schweiz sind die Themenfelder „Krankheit & Verletzung“ sowie „Forschung & Wissenschaft“. Insbesondere zeigt die Untersuchung, dass das Thema „Pandemie & Impfung“ mit Bezug zur COVID-19 Pandemie bereits im Januar 2020 ein Bestandteil des Gesundheitsweb war. Spannend ist auch, dass sich die Themen zwischen den einzelnen deutschsprachigen Ländern nicht sonderlich voneinander unterscheiden.

    „Im Zeitalter von Fake-News und Desinformation wäre es sicherlich interessant, wenn ein Verfahren vertrauenswürdige Anbieter (wie beispielsweise das Robert Koch Institut) für Gesundheitsinformationen vollautomatisch identifizieren könnte“, sagt Richard Zowalla aus der informatischen Perspektive. Hier besteht weiterhin Handlungs- und Forschungsbedarf, der in zukünftigen Projekten an der Informatik Fakultät der HHN unter Einbindung medizinischer Expert*innen adressiert werden soll.

    --

    Hochschule Heilbronn – Kompetenz in Technik, Wirtschaft und Informatik
    Mit rund 8.000 Studierenden ist die Hochschule Heilbronn (HHN) eine der größten Hochschulen für Angewandte Wissenschaften in Baden-Württemberg. Ihr Kompetenz-Schwerpunkt liegt in den Bereichen Technik, Wirtschaft und Informatik. An ihren vier Standorten in Heilbronn, Heilbronn-Sontheim, Künzelsau und Schwäbisch Hall bietet die HHN mehr als 60 zukunftsorientierte Bachelor- und Masterstudiengänge an, darunter auch berufsbegleitende Angebote. Die HHN bietet daneben noch weitere Studienmodelle an und pflegt enge Kooperationen mit Unternehmen aus der Region. Sie ist dadurch in Lehre, Forschung und Praxis sehr gut vernetzt. Das hauseigene Gründungszentrum unterstützt Studierende sowie Forschende zudem beim Lebensziel Unternehmertum.

    Ansprechperson: Dr. Richard Zowalla, Telefon: 07131-504-6791, E-Mail: richard.zowalla@hs-heilbronn.de, Internet: http://www.hs-heilbronn.de

    Forschungskommunikation Hochschule Heilbronn: Vera Winkler, Telefon: 07131-504-1156, E-Mail: vera.winkler@hs-heilbronn.de, Internet: http://www.hs-heilbronn.de

    Pressekontakt Hochschule Heilbronn: Vanessa Offermann, Telefon: 07131-504-553, E-Mail: vanessa.offermann@hs-heilbronn.de, Internet: http://www.hs-heilbronn.de


    Contact for scientific information:

    Dr. Richard Zowalla, Telefon: 07131-504-6791, E-Mail: richard.zowalla@hs-heilbronn.de, Internet: www.hs-heilbronn.de


    Original publication:

    https://doi.org/10.1371/journal.pone.0281582


    Images

    Criteria of this press release:
    Business and commerce, Journalists, Scientists and scholars, Students, Teachers and pupils, all interested persons
    Information technology, Medicine, Social studies
    transregional, national
    Research results
    German


     

    Help

    Search / advanced search of the idw archives
    Combination of search terms

    You can combine search terms with and, or and/or not, e.g. Philo not logy.

    Brackets

    You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).

    Phrases

    Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.

    Selection criteria

    You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).

    If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).