idw - Informationsdienst
Wissenschaft
HIRI-Forschungsteam macht auf Überoptimismus gängiger Ansätze aufmerksam und schlägt erweiterte Modelle vor | Aktuelle Studie in PLOS Biology
Um Antibiotikaresistenzen bei Krankheitserregern vorherzusagen, greifen Fachleute zunehmend auf maschinelles Lernen zurück. Mit dessen Hilfe lassen sich anhand der Genetik eines Erregers Resistenzmechanismen erkennen. Die Ergebnisse sind allerdings mit Vorsicht zu betrachten: Forschende des Würzburger Helmholtz-Instituts für RNA-basierte Infektionsforschung (HIRI) konnten nachweisen, dass die Modelle häufig weniger zuverlässig sind als angenommen. Ihre Erkenntnisse wurden im Fachmagazin PLOS Biology veröffentlicht. Sie tragen dazu bei, verlässlichere Werkzeuge zur Vorhersage und Bekämpfung von Antibiotikaresistenzen zu entwickeln.
Antibiotikaresistente Infektionen stellen eine immer größer werdende Bedrohung dar. Anstatt Bakterien klassisch zu kultivieren und ihre Reaktion auf Antibiotika zu testen, analysieren Labore zunehmend das bakterielle Erbgut, um frühzeitig Resistenzen zu identifizieren. Aus den DNA-Sequenzen des Erregers können Forschende ableiten, über welche Resistenzmechanismen er verfügen könnte und anschließend wirksame Behandlungsmöglichkeiten vorschlagen. Computerprogramme, die aus vorhandenen Sequenzierungsdaten „lernen”, sind dabei ein vielversprechender Weg, um vorherzusagen, welche Antibiotika wirken und welche nicht. Diese Technologien haben jedoch auch Defizite: Eine oft unterschätzte Herausforderung sind dabei die Annahmen, die die computergestützten Methoden selbst treffen.
Forschende vom Würzburger Helmholtz-Institut für RNA-basierte Infektionsforschung (HIRI), einem Standort des Braunschweiger Helmholtz-Zentrums für Infektionsforschung (HZI) in Kooperation mit der Julius-Maximilians-Universität Würzburg (JMU), konnten gemeinsam mit der University of Birmingham in Großbritannien nachweisen, dass genau diese Annahmen zu übermäßig optimistischen Ergebnissen hinsichtlich der Vorhersagekraft führen und so deren Aussagewert verzerren können.
Die meisten klassischen Methoden des maschinellen Lernens – Technologien, die aus Daten lernen und ohne explizite Programmierung selbstständig Muster erkennen – erfordern, dass die Trainingsdaten unabhängig und identisch verteilt sind. Das ist bei Bakterienproben allerdings nicht der Fall: Eng verwandte Bakterien weisen viele gemeinsame Merkmale auf. Während einer Epidemie setzen sich „erfolgreiche” Erregervarianten schnell durch. Wenn sie sich unter anderem aufgrund ihrer Abwehrmechanismen gegen Antibiotika so rasch vermehren, verbreiten sich automatisch auch andere Merkmale – selbst, wenn diese nichts mit Resistenz zu tun haben.
Dies kann den Anschein erwecken, dass bestimmte genetische Merkmale direkt mit einer Resistenz zusammenhängen, obwohl sie in Wirklichkeit nur aufgrund der Verwandtschaft der Erreger gemeinsam auftreten. Die Algorithmen lernen folglich, verwandte Stämme vorherzusagen, anstatt die Resistenz selbst.
24.000 Genome von fünf Bakterienarten
„In diesem Projekt haben wir mehr als 24.000 Genome, also die Gesamtheit aller Erbinformationen, von fünf bedeutenden krankheitsverursachenden Bakterienarten analysiert“, sagt Lars Barquist. Er ist ein mit dem HIRI assoziierter Wissenschaftler und Professor an der University of Toronto in Kanada. Barquist hat die Studie, die in PLOS Biology veröffentlicht wurde, als korrespondierender Autor initiiert. Bei den untersuchten Bakterienarten handelt es sich um den Magen-Darm- und Harnwegserreger Escherichia coli, den opportunistischen Erreger Klebsiella pneumoniae, den Magen-Darm-Keim Salmonella enterica, den Hautkommensalen und opportunistischen Erreger Staphylococcus aureus sowie den Hauptverursacher der außerhalb des Krankenhauses erworbenen Lungenentzündung, Streptococcus pneumoniae. Für diese Keime liefern gängige maschinelle Lernverfahren ein übermäßig positives Bild davon, wie gut die Resistenzvorhersage funktioniert.
„Wir wollten untersuchen, wie sich die verzerrte Stichprobenauswahl auf die Leistungsfähigkeit von Machine-Learning-Tools zur Vorhersage von Resistenzen auswirkt“, so Barquist. Die Forschenden konstruierten Szenarien, in denen Resistenzen mit bakteriellen Stammbäumen verknüpft sind. Sie konnten zeigen, dass herkömmliche Ansätze zu überoptimistischen Ergebnissen führen können, die nicht verallgemeinerbar sind. „Wenn die Modelle realistischer bewertet werden, indem sichergestellt wird, dass die Trainings- und Testbakterien nicht aus derselben genetischen Familie stammen, sinkt die Genauigkeit – manchmal sogar drastisch“, bemerkt Erstautorin Yanying Yu, die im Labor von Lars Barquist promoviert hat. Diese Ergebnisse deuten darauf hin, dass Modelle, welche die evolutionären Beziehungen zwischen Bakterien außer Acht lassen, möglicherweise nicht in der Lage sind, echte Resistenzsignale zu erfassen. Dadurch wird ihre Fähigkeit eingeschränkt, genaue Vorhersagen für bisher unbekannte Abstammungslinien zu treffen. Infolgedessen ist es unwahrscheinlich, dass solche Methoden zuverlässige Anhaltspunkte für eine präzise Behandlung liefern, wenn neue pathogene Stämme auftreten.
Die Studie vermittelt einen umfassenden Eindruck vom Ausmaß dieses Problems: „Viele der bisherigen Methoden-Bewertungen waren wahrscheinlich zu optimistisch“, schlussfolgert Barquist. „Um zuverlässige Instrumente zur Vorhersage von Antibiotikaresistenzen zu entwickeln, ist es unerlässlich, die evolutionären Beziehungen der Bakterien zu berücksichtigen“, bemerkt Yu.
Die Forschungsergebnisse bieten wertvolle Ansatzpunkte für die Entwicklung verbesserter Testverfahren und Datensätze und können als Orientierung für zukünftige Modelle und Überwachungssysteme dienen. Damit ermöglichen sie neue methodische Ansätze, die die Struktur von Bakterienpopulationen berücksichtigen und somit präzisere Vorhersagen erlauben.
Förderung
Die Studie wurde aus Mitteln des Bayerischen Staatsministeriums für Wissenschaft und Kunst im Rahmen des Forschungsnetzwerks bayresq.net und des kanadischen Natural Sciences and Engineering Research Council gefördert.
Helmholtz-Institut für RNA-basierte Infektionsforschung:
Das Helmholtz-Institut für RNA-basierte Infektionsforschung (HIRI) ist die weltweit erste Einrichtung ihrer Art, die die Forschung an Ribonukleinsäuren (RNA) mit der Infektionsbiologie vereint. Auf Basis neuer Erkenntnisse aus seinem starken Grundlagenforschungsprogramm will das Institut innovative therapeutische Ansätze entwickeln, um menschliche Infektionen besser diagnostizieren und behandeln zu können. Das HIRI ist ein Standort des Braunschweiger Helmholtz-Zentrums für Infektionsforschung (HZI) in Kooperation mit der Julius-Maximilians-Universität Würzburg (JMU) und befindet sich auf dem Würzburger Medizin-Campus. Weitere Informationen unter https://www.helmholtz-hiri.de/de
Helmholtz-Zentrum für Infektionsforschung:
Wissenschaftler:innen am Helmholtz-Zentrum für Infektionsforschung (HZI) untersuchen in Braunschweig und an anderen Standorten in Deutschland bakterielle und virale Infektionen sowie die Abwehrmechanismen des Körpers. Sie verfügen über fundiertes Fachwissen in der Naturstoffforschung und deren Nutzung als wertvolle Quelle für neuartige Antiinfektiva. Als Mitglied der Helmholtz-Gemeinschaft und des Deutschen Zentrums für Infektionsforschung (DZIF) betreibt das HZI translationale Forschung, um die Grundlagen für die Entwicklung neuartiger Therapien und Impfstoffe gegen Infektionskrankheiten zu schaffen. https://www.helmholtz-hzi.de
Medienkontakt:
Luisa Härtig
Manager Communications
Helmholtz-Institut für RNA-basierte Infektionsforschung (HIRI)
luisa.haertig@helmholtz-hiri.de
+49 (0)931 31 86688
Yu Y, Wheeler NE, Barquist L
Biased sampling driven by bacterial population structure confounds machine learning prediction of antimicrobial resistance
PLOS Biology (2025), DOI: 10.1371/journal.pbio.3003539
https://doi.org/10.1371/journal.pbio.3003539
https://www.helmholtz-hzi.de/media-center/newsroom/news-detailseite/vorhersage-v... Pressemitteilung des HZI
Elektronenmikroskopische Aufnahme von EHEC-Bakterien (Escherichia Coli) auf einer Darmzelle.
Quelle: Manfred Rohde
Copyright: HZI/Manfred Rohde
Merkmale dieser Pressemitteilung:
Journalisten, Wissenschaftler
Biologie, Informationstechnik, Medizin
überregional
Forschungsergebnisse, Wissenschaftliche Publikationen
Deutsch

Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.
Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).
Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.
Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).
Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).