Das Internet ist zwar weltweit verbreitet, doch der oft beschworene globale Charakter wird durch den ‚Digital Divide‘ relativiert - digitale Telhabe hängt noch immer stark von ökonomischen Voraussetzungen ab. CISPA-Forscher Masudul Bhuiyan wollte wissen, ob sich auch Unterschiede hinsichtlich der Sicherheit und des Datenschutzes von Webseiten finden lassen. Seine Untersuchung von 200.000 Webseiten aus 20 Industrienationen sowie Entwicklungs- und Schwellenländern kommt zu dem Ergebnis, dass die Webseiten in Entwicklungs- und Schwellenländern eher kleiner und einfacher sind, häufiger Effizienzprobleme haben, umgekehrt aber vermutlich weniger anfällig für Sicherheitslücken sind.
Unterschiede in der Digitalisierung zwischen Industrieländern sowie Entwicklungs- und Schwellenländern betreffen eine Vielzahl von Faktoren. „Bisherige Studien haben vor allem Makro-Level-Indikatoren untersucht, wie das Vorhandensein von Internet, die Smartphone-Nutzung oder die generelle technologische Infrastruktur“, erklärt CISPA-Forscher Masudul Bhuiyan. Aus diesen Studien geht hervor, dass in Entwicklungsländern nur 60 Prozent der Bevölkerung online sind, während es in den Industrienationen 93 Prozent sind. Umgekehrt greifen die Menschen in Schwellen- und Entwicklungsländern stärker auf das mobile Internet zu. Darüber hinaus ist die technische Entwicklung dort oft rasant und überspringt ganze Entwicklungsstufen, was auch als Leapfrogging-Phänomen bekannt ist. „Anekdotische Erzählungen in der Community legen darüber hinaus nahe, dass sich Webseiten in Industrienationen und Entwicklungs- und Schwellenländern signifikant unterscheiden. Wir wollten wissen, ob an dieser Hypothese etwas dran ist“, erzählt Bhuiyan.
Weltweit einzigartiger Datensatz als Datenbasis
Für die Studie haben Bhuiyan und seine Kollegen je 10.000 Webseiten der zehn bevölkerungsreichsten Industrienationen sowie der zehn bevölkerungsreichsten Entwicklungs- und Schwellenländer untersucht. „Wir haben uns dabei auf die Definition des Internationalen Währungsfonds (IWF) gestützt“, so der CISPA-Forscher. Ausgehend von der Klassifizierung des IWF wurden die Entwicklungs- und Schwellenländer China, Indien, Pakistan, Brasilien, Nigeria, Bangladesch, Russland, Mexiko und Philippinen sowie die Industrienationen USA, Japan, Deutschland, Frankreich, Großbritannien, Italien, Südkorea, Spanien, Kanada und Australien für die Studie ausgewählt. Pro Land suchten die Forscher dann die 10.000 populärsten Webseiten heraus. Diese Bedingung hatte zur Folge, dass die Philippinen anstatt Äthiopien ins Sample kamen, da sich dort nicht genug Webseiten ausreichender Größe fanden. Die Webseiten wurden einem Land zugerechnet, wenn sie entweder länderspezifische Top-Level-Domains wie .de nutzten, oder im WHOIS Protokoll eine dem Land zuordenbare Adresse angegeben war. „Wir haben die Tools Google Lighthouse und Puppeteer genutzt, um die insgesamt 200000 Webseiten zu crawlen“, erzählt Bhuiyan. „Konkret untersucht wurde dann die Webseitengröße und Komplexität, die Performance-Optimierung, Sicherheitsmaßnahmen wie die Nutzung von https statt http, Datenschutzanwendungen wie der Rückgriff auf Cookies sowie die Integration aktueller technologischer Features.“
Unklares Bild: Unterschiede geringer und weniger deutlich als erwartet
„Das Ergebnis unserer Untersuchung ist, dass Webseiten in Entwicklungs- und Schwellenländern grundsätzlich kleiner und einfacher aufgebaut sind als die in Industrienationen“, erklärt Bhuiyan. „Das kommt der Nutzung aus dem mobilen Internet entgegen, das in diesen Ländern weit verbreitet ist. Gleichwohl sind die Webseiten in einigen Punkten weniger optimal programmiert. So finden sich ineffiziente Bildformate, unnötiger Code und es fehlt oft ein responsives Design. Auch die Nutzung von https, was den verschlüsselten Verbindungsaufbau ermöglicht, ist weniger verbreitet.“ Erstaunt hat den CISPA-Forscher, dass die Unterschiede zwischen beiden Gruppen gleichwohl nicht so stark waren wie erwartet: „Zum Teil sind die Unterschiede zwischen den einzelnen Ländern innerhalb einer Gruppe größer als zwischen den Gruppen“, so Bhuiyan.
Aufschlussreich waren auch die Ergebnisse zur Nutzung von Trackern und Cookie-Bannern. „Wir haben auf den Webseiten aus Industrienationen mehr Tracker gefunden als bei denen aus Entwicklungs- und Schwellenländern“, so Bhuiyan. „Der Grund dafür ist, dass Industrieländer tendenziell ausgeklügeltere Werbestrategien anwenden, die stark auf Tracker setzen – selbst bei strengeren Datenschutzgesetzen.“ Ein unerwarteter Trend fand sich bei Schwachstellen. So enthalten Webseiten in Industrieländern tendenziell mehr anfällige Bibliotheken, die theoretisch ausgenutzt werden könnten. „Eine Erklärung dafür könnte die größere Bedeutung von JavaScript-Bibliotheken bei den Webseiten in den Industrienationen sein“, erklärt der CISPA-Forscher. „Denn diese verbessern nicht nur die Funktionalität der Webseiten, sondern erhöhen auch deren Angriffsflächen.“
Ausblick und weitere Forschungsdesiderate
„Das interessante an unserer Studie ist“, erklärt Bhuiyan „dass wir nicht diesen einen großen Faktor gefunden haben, der sich zwischen den Ländern unterscheidet. Aus diesem Grund ist weitergehende Forschung erforderlich. Ein großer Erfolg ist jedoch, dass wir diesen riesigen Datensatz zusammenstellen konnten, den andere Forschende jetzt nutzen können.“ Auf der Entwicklerplattform Github steht der Datensatz mit den 200.000 gecrawlten Webseiten Interessierten zum Download zur Verfügung. Zum ersten Mal finden sich dort umfassende Datensätze mit Webseiten aus Ländern wie Nigeria, Bangladesch oder den Philippinen – alles Regionen, die bisher eher nicht im Fokus der IT-Sicherheitsforschung standen.
Bhuiyan möchte sich in Zukunft in seiner Forschung unter anderem auf Webseiten aus Südost-Asien konzentrieren. „In der aktuellen Studie ist uns aufgefallen, dass viele Webseiten aus Indien, Pakistan und Bangladesch auf Englisch sind“, erklärt er. „Das Problem dabei ist, dass nur ein kleiner Teil der Bevölkerung dort Englisch spricht. Wir wollen untersuchen, welche Auswirkungen die Sprachnutzung auf die Barrierefreiheit der Webseiten sowie den Umgang mit Sicherheitshinweisen hat.“ Damit kann der CISPA-Forscher seinem Antrieb weiter nachgehen, das Internet so inklusiv wie möglich zu gestalten.
Bhuiyan, Masudul Hasan Masud; Varvello, Matteo; Staicu, Cristian-Alexandru; Zaki, Yasir (2025). Digital Disparities: A Comparative Web Measurement Study Across Economic Boundaries. CISPA. Conference contribution. https://doi.org/10.60882/cispa.28365449.v1
Visualiszierung zum Paper "Digital Disparities: A Comparative Web Measurement Study Across Economic ...
CISPA
Merkmale dieser Pressemitteilung:
Journalisten
Informationstechnik
überregional
Forschungsergebnisse, Wissenschaftliche Publikationen
Deutsch
Visualiszierung zum Paper "Digital Disparities: A Comparative Web Measurement Study Across Economic ...
CISPA
Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.
Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).
Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.
Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).
Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).