idw - Informationsdienst
Wissenschaft
Webseiten werden im Sekundentakt geändert, gelöscht oder neu strukturiert. Web-Archive speichern Momentaufnahmen dieser Seiten und bewahren somit Teile unseres digitalen Gedächtnisses. Doch wie verlässlich und vertrauenswürdig sind diese Archive? Sind sie tatsächlich ein unverfälschtes und unveränderliches Abbild der Webseiten zu einem früheren Zeitpunkt? Wissenschaftler der Technischen Universität Braunschweig haben die Sicherheit von Web Archiven untersucht und diese dafür gezielt angegriffen.
Im Februar dieses Jahres wurden Tausende Webseiten der US-Regierung offline genommen. So ist beispielsweise die offizielle Hilfeseite der US-Regierung zum Thema Mobbing im Bereich LGBTQ nun gesperrt. Web-Archive sind eine bekannte Lösung gegen dieses Problem. Sie erzeugen sogenannte „Snapshots“, also Momentaufnahmen, einer Webseite zu einem bestimmten Zeitpunkt und helfen uns so, unsere Vergangenheit zu dokumentieren. Die Website zum Mobbing ist über das „Internet Archive“ noch einsehbar. Eine Milliarden Webseiten sind dort inzwischen archiviert.
Verlässliche Quellen
„Web-Archive, wie die Wayback Machine, sind Stützpfeiler für die wahrheitsgetreue Bewahrung von Informationen“, sagt Professor Martin Johns, Leiter des Instituts für Anwendungssicherheit der TU Braunschweig. Forschende nutzen die Archive, um die Entwicklung von JavaScript-Tracking im Verlauf der Zeit zu messen. Richter*innen verewigen Webseiten, die als Beweise in Gerichtsprozessen herangezogen werden. Wikipedia-Editoren berufen sich auf Archive als verlässliche Quellen, und Nutzer*innen können mithilfe der Archive heimliche Änderungen an Online-Artikeln nachvollziehen.
Für alle Nutzenden der Archive ist implizit klar: Mithilfe der Snapshots können die Archive ein „unverfälschtes“ und „unveränderliches“ Abbild der Webseite zu einem früheren Zeitpunkt erzeugen. Doch halten die „Zeitmaschinen“ dieser Erwartung wirklich stand?
Zwei neue Angreifermodelle gegen Web-Archive
Doktorand Robin Kirchner vom Institut für Anwendungssicherheit hat in Kooperation mit Professor Nick Nikiforakis von der Stony Brook University, New York (USA), herausgefunden, dass diese Archive fragiler sind als gedacht.
Die Wissenschaftler entwickelten zwei neue Angreifermodelle und untersuchten, ob acht bekannte Archive diesen Angriffen standhalten. Ihre Ergebnisse haben sie in einem Paper veröffentlicht und auf der Conference on Computer and Communications Security (CCS) in Taiwan präsentiert. „Die von uns aufgedeckten Sicherheitslücken erlauben effektiv, nachträglich archivierte Web-Inhalte zu verfälschen, also über die Vergangenheit zu lügen“, so Professor Johns.
So versucht der von den Wissenschaftlern entwickelte „Evasive Adversary“, seine eigene Webseite vor der Archivierung zu verbergen. Dieser Web-Angreifer kann in Echtzeit erkennen, wenn ein Archiv gerade versucht, seine Webseite zu archivieren. Folglich kann er sich vor den Archiven verbergen oder ihnen gezielt verfälschte Informationen liefern.
Der „Anachronistic Adversary“ wiederum schafft es, die Kontrolle über seine archivierten Webseiten zu behalten und diese jederzeit nachträglich zu verändern. Dabei wird nicht das Archiv selbst angegriffen. Der für den Angriff verantwortliche Code bleibt nach der Archivierung im Snapshot enthalten und lädt beim Aufruf aktuelle Inhalte aus einer vom Angreifer kontrollierten Quelle nach. Dadurch kann der Angreifer den vom Snapshot dargestellten Inhalt nachträglich verändern, ohne den archivierten Snapshot selbst zu modifizieren.
Acht Archive unter der Lupe
Acht bekannte Internetarchive haben die Forschenden untersucht. Darunter befinden sich das bekannteste Archiv, die Wayback Machine, sowie der kostenpflichtige Service der Harvard University, Perma.cc. Darüber hinaus nahmen sie Archive.today, FreezePage, Arquivo, Megalodon, GhostArchive und Conifer unter die Lupe.
Das Ergebnis: Alle Archive sind gegen mindestens eines der beiden Angreifermodelle anfällig. Nach den Beobachtungen der Wissenschaftler konnten sie sich mit ihren Angriffen gezielt vor allen Archiven verbergen. Für Professor Johns noch alarmierender: „Die meisten Archive waren auch gegenüber unseren anachronistischen Angriffen verwundbar. Das bedeutet, dass wir über Web-Angriffe die Archivkopien unserer Webseiten in sieben von acht Archiven nachträglich jederzeit verändern konnten.“
Links:
https://www.nytimes.com/2025/02/02/upshot/trump-government-websites-missing-page..., Archive Link: https://archive.ph/mxScx
https://www.stopbullying.gov/bullying/lgbtq
https://web.archive.org/web/20250121064232/https://www.stopbullying.gov/bullying...
Prof. Dr. Martin Johns
Technische Universität Braunschweig
Institut für Anwendungssicherheit
Mühlenpfordtstr. 23
38106 Braunschweig
Tel.: +49 531 391-7466 / -3277
E-Mail: m.johns@tu-braunschweig.de
www.tu-braunschweig.de/ias
Robin Kirchner
Technische Universität Braunschweig
Institut für Anwendungssicherheit
Mühlenpfordtstr. 23
38106 Braunschweig
Tel.: +49 531 391-2271
E-Mail: robin.kirchner@tu-braunschweig.de
www.tu-braunschweig.de/ias
Robin Kirchner, Chris Tsoukaladelis, Martin Johns, and Nick Nikiforakis: The Power to Never Be Wrong: Evasions and Anachronistic Attacks Against Web Archives.
Proceedings of the ACM Conference on Computer and Communications Security (CCS), Taipei, Taiwan, 2025.
https://doi.org/10.1145/3719027.3765051
Web-Archive sind das kollektive Gedächtnis des Internets, doch sie sind gegenüber neuen Sicherheitsl ...
Source: Kristina Rottig/TU Braunschweig
Die zwei neuen Angreifermodelle der Forschenden können ihre Webseiten gezielt vor Archiven verbergen ...
Source: Robin Kirchner/TU Braunschweig
Criteria of this press release:
Journalists, Scientists and scholars
Information technology
transregional, national
Research projects, Research results
German

You can combine search terms with and, or and/or not, e.g. Philo not logy.
You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).
Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.
You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).
If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).