idw - Informationsdienst
Wissenschaft
• Aktuelle Studie hat Lesbarkeit und Themenfelder von Gesundheitsinformationen im Internet untersucht.
• 14,2 Millionen gesundheitsrelevante, deutschsprachige Webseiten in Deutschland, Österreich und der Schweiz sind analysiert worden.
• Ergebnis: Gesundheitswebseiten benötigen sprachliche Verbesserungen, um von Leser*innen verstanden zu werden.
Heilbronn, Februar 2023. Informationen zu Krankheiten, Symptomen und zu Gesundheitsthemen allgemein können heutzutage ganz schnell und unkompliziert über das Internet gefunden werden. Ob Selbstdiagnostik, Hintergründe zu einem bestimmten Medikament oder einer Behandlung: die Anzahl der Webseiten ist groß. Doch wie verständlich sind diese Texte eigentlich? Helfen uns die Informationen überhaupt oder verstehen wir vielleicht so wenig, dass wir abgeschreckt die Suche beenden? Welche Themenfelder werden überhaupt abgedeckt und wer steckt hinter den Angeboten in diesem unübersichtlichen Informationsdschungel zum Thema Gesundheit?
Der Medizininformatiker Richard Zowalla stellte sich diesen Fragen. Im Rahmen seiner Dissertation erfasste ein sogenannter fokussierter Web-Crawler – ein Computerprogramm, dass das Internet unter Zuhilfenahme von KI-Verfahren automatisch nach bestimmten Informationen durchsucht – über den Zeitraum eines ganzes Jahres (Mai 2019 – Mai 2020) die URLs und Textinhalte von insgesamt 14,2 Millionen gesundheitsrelevanten deutschsprachigen Webseiten. Anschließend wurden die Inhalte mit Verfahren aus dem KI-Bereich ausgewertet und die Ergebnisse dieser Studie in einem internationalen Fachjournal veröffentlicht.
„Während der Crawler von Webseite zu Webseite springt, speichern wir nur Verlinkungen zwischen gesundheitsrelevanten Internetseiten. Auf diese Weise entsteht ein sogenannter Web-Graph, der ausschließlich gesundheitsrelevante Webseiten und deren Verlinkungen untereinander enthält“, erklärt Zowalla. „Die Wichtigkeit einer Webseite innerhalb dieses Gesundheitsweb-Graphen können wir dann beispielsweise mit Google‘s PageRank bestimmen“, ergänzt Professor Daniel Pfeifer (HHN), der neben Professor Thomas Wetter von der Universität Heidelberg die Promotion von Richard Zowalla betreut. Das Grundprinzip von PageRank ist einfach: Je mehr Links auf eine Seite verweisen, desto höher ist das Gewicht dieser Seite, sie scheint also eine höhere Bedeutsamkeit zu haben.
Mit Hilfe des Page Rank wurde jeweils für Deutschland, Österreich und die Schweiz eine Top 1000 Liste berechnet, wodurch insgesamt eine Top 3000 Liste des Gesundheitswebs entstand. Die umfassende Untersuchung zeigt, dass öffentliche Institutionen, wie beispielweise das Robert-Koch-Institut und nicht kommerzielle Anbieter von Gesundheitsinformationen wie beispielsweise die Webseite der deutschen Krebshilfe nur knapp die Hälfte der Top 3000 Seiten des Gesundheitswebs in Deutschland, Österreich und der Schweiz ausmachen, während der Großteil an Informationen durch private Anbieter wie Webseiten von Ärzt*innen zur Verfügung gestellt wird. Die hohen Ränge (jeweils die vordersten 20 bis 50 Seiten) der Top 3000 nehmen in allen drei Ländern vor allem die Informationsangebote von öffentlichen Einrichtungen ein. „Interessant ist jedoch, dass dies nicht unbedingt die Informationsangebote sind, die ein kommerzieller Suchmaschinenanbieter als Top Treffer präsentiert, hier stehen oftmals private Anbieter im Vordergrund“, erläutert Zowalla.
Als Maßstab für die Lesbarkeit eines Textes wurden der FRE-Score bzw. die vierte Wienersachtextformel verwendet. Als schwerer lesbar werden dabei unter anderem längere medizinische Fachbegriffe, lange oder verschachtelte Sätze gewertet. Diese Lesbarkeitsmaße bewerten einen Text entweder als Punktwert (Score) oder in Form von Schuljahren. Erhält ein Text die Bewertung 11 sollten Leser*innen, die die 11. Klasse abgeschlossen haben, diese sprachlich klar erfassen können. Im Falle von Gesundheitsinformationen würde man empfehlen, dass diese Texte bereits von Schüler*innen aus der Mittelstufe verstanden werden können. Das verwendete Vokabular wurde zudem mit Hilfe eines KI-Verfahrens auf dessen Laientauglichkeit untersucht. „Die Studie jedoch, dass im deutschsprachigen Gesundheitsweb das Niveau deutlich darüber liegt und ein Text nur dann vollständig erfasst werden kann, wenn 13 bis 14 Jahre schulische Bildung vorliegen“, erklärt Zowalla. Diese Dauer entspricht einem Hochschulstudium. „Bemerkenswert ist jedoch, dass das verwendete Vokabular größtenteils gut für ein Laienpublikum geeignet ist“, ergänzt Zowalla. Schwer lesbare Texte zu gesundheits- oder krankheitsbezogenen Themen erzeugen somit eine Barriere im Umgang mit Informationen aus dem Internet, auch wenn das verwendete Vokabular aus medizinischer Sicht angemessen erscheint.
Die Themen des Gesundheitswebs wurden mittels Latent Dirchlet Allocation (LDA) bestimmt. LDA ist ein Verfahren, das verwendet wird, um eine große Menge an unstrukturierten Texten zu kategorisieren und Themen zu identifizieren. Die häufigsten Themenfelder im Gesundheitsweb in Deutschland, Österreich und der Schweiz sind die Themenfelder „Krankheit & Verletzung“ sowie „Forschung & Wissenschaft“. Insbesondere zeigt die Untersuchung, dass das Thema „Pandemie & Impfung“ mit Bezug zur COVID-19 Pandemie bereits im Januar 2020 ein Bestandteil des Gesundheitsweb war. Spannend ist auch, dass sich die Themen zwischen den einzelnen deutschsprachigen Ländern nicht sonderlich voneinander unterscheiden.
„Im Zeitalter von Fake-News und Desinformation wäre es sicherlich interessant, wenn ein Verfahren vertrauenswürdige Anbieter (wie beispielsweise das Robert Koch Institut) für Gesundheitsinformationen vollautomatisch identifizieren könnte“, sagt Richard Zowalla aus der informatischen Perspektive. Hier besteht weiterhin Handlungs- und Forschungsbedarf, der in zukünftigen Projekten an der Informatik Fakultät der HHN unter Einbindung medizinischer Expert*innen adressiert werden soll.
--
Hochschule Heilbronn – Kompetenz in Technik, Wirtschaft und Informatik
Mit rund 8.000 Studierenden ist die Hochschule Heilbronn (HHN) eine der größten Hochschulen für Angewandte Wissenschaften in Baden-Württemberg. Ihr Kompetenz-Schwerpunkt liegt in den Bereichen Technik, Wirtschaft und Informatik. An ihren vier Standorten in Heilbronn, Heilbronn-Sontheim, Künzelsau und Schwäbisch Hall bietet die HHN mehr als 60 zukunftsorientierte Bachelor- und Masterstudiengänge an, darunter auch berufsbegleitende Angebote. Die HHN bietet daneben noch weitere Studienmodelle an und pflegt enge Kooperationen mit Unternehmen aus der Region. Sie ist dadurch in Lehre, Forschung und Praxis sehr gut vernetzt. Das hauseigene Gründungszentrum unterstützt Studierende sowie Forschende zudem beim Lebensziel Unternehmertum.
Ansprechperson: Dr. Richard Zowalla, Telefon: 07131-504-6791, E-Mail: richard.zowalla@hs-heilbronn.de, Internet: http://www.hs-heilbronn.de
Forschungskommunikation Hochschule Heilbronn: Vera Winkler, Telefon: 07131-504-1156, E-Mail: vera.winkler@hs-heilbronn.de, Internet: http://www.hs-heilbronn.de
Pressekontakt Hochschule Heilbronn: Vanessa Offermann, Telefon: 07131-504-553, E-Mail: vanessa.offermann@hs-heilbronn.de, Internet: http://www.hs-heilbronn.de
Dr. Richard Zowalla, Telefon: 07131-504-6791, E-Mail: richard.zowalla@hs-heilbronn.de, Internet: www.hs-heilbronn.de
https://doi.org/10.1371/journal.pone.0281582
Merkmale dieser Pressemitteilung:
Journalisten, Lehrer/Schüler, Studierende, Wirtschaftsvertreter, Wissenschaftler, jedermann
Gesellschaft, Informationstechnik, Medizin
überregional
Forschungsergebnisse
Deutsch
Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.
Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).
Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.
Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).
Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).