Daten in Gruppen aufzuteilen, ohne dass sich dabei ungewollte Cluster mit ähnlichen Elementen bilden, ist etwa für die Auswertung medizinischer Daten von großer Bedeutung. Zu diesem „Anticlustering“-Problem entwickelten Psychologen und Informatiker der Heinrich-Heine-Universität Düsseldorf (HHU) 2020 ein neues Verfahren. Zusammen mit Forschenden der University of California in San Francisco (UCSF) entwickelten sie nun eine Erweiterung, die für die Analyse von Hochdurchsatz-Sequenzierungsdaten und mehr wichtig ist. Die Forschenden beschreiben ihr neues Werkzeug im Zusammenhang mit einer Anwendung bei der chronischen Erkrankung Endometriose in der Fachzeitschrift Cell Reports Methods.
Endometriose ist eine komplexe, oft schmerzhafte Erkrankung, von der Millionen von Frauen weltweit betroffen sind. Bei ihr bildet sich Gewebe, das demjenigen der Gebärmutterschleimhaut ähnelt, außerhalb der Gebärmutter, etwa in den Eierstöcken oder auch im Darm. Das Gewebe kann sich während des Menstrationszyklus verändern.
Um die zellulären und molekularen Faktoren zu untersuchen, die bei der Entstehung und dem Schweregrad der Endometriose eine Rolle spielen, führen multidisziplinäre Experten der UCSF und der Stanford University im Rahmen des ENACT-Zentrums Analysen von Daten hunderter Frauen durch. Ein Team unter der Leitung von UCSF-Professorin Dr. Tomiko T. Oskotsky leitet die Bemühungen um eine solide Versuchsplanung für Untersuchungen mit Hochdurchsatztechnologien, darunter die Einzelkern-RNA-Sequenzierung.
Aus technischen Gründen müssen die Proben dabei in Chargen verarbeitet werden. Sind diese nicht sorgfältig ausbalanciert – etwa in Bezug auf das Krankheitsstadium oder das Alter der Patientinnen –, können sogenannte Chargeneffekte die Ergebnisse verfälschen. Im Endeffekt wäre es dann schwierig zu beurteilen, ob beobachtete Unterschiede eine biologische Ursache haben oder nur Artefakte des technischen Prozesses sind.
Hier kommt die Anticlustering-Methode ins Spiel, die Dr. Martin Papenberg vom Institut für Experimentelle Psychologie und Prof. Dr. Gunnar Klau, Lehrstuhlinhaber für Algorithmische Bioinformatik, beide von der HHU 2020 in der Zeitschrift Psychological Methods vorstellten. Sie stellten sie als frei verfügbares Modul „anticlust“ zur Verfügung.
„Die Fragestellung aus den USA verlangt, zusätzlich zum bisherigen Leistungsumfang von anticlust, dass verwandte Proben – etwa mehrere Gewebeproben derselben Patientin – in derselben Charge gruppiert werden, um aussagekräftige Vergleiche bei einzelnen Patientinnen zu ermöglichen“, erläutert Dr. Papenberg die neue Herausforderung, die er durch Entwicklung der so benannten „Must-Link-Methode“ lösen konnte.
Prof. Klau: „Wir konnten unseren Ansatz erfolgreich erweitern, so dass wir, bei gleichbleibend guter Verteilung der Proben auf verschiedene Chargen, notwendigerweise zusammengehörende Proben in ein Sample sortieren können. So wird ein methodisches Bias vermieden und die Kolleginnen und Kollegen aus der Medizin können Schlüsse aus den Daten ziehen, die sich auf die Einflüsse der Gene auf die Endometriose beziehen.“
Prof. Oskotsky: „Indem wir mit anticlust die Chargeneffekte durch ein besseres Versuchsdesign minimieren, sind wir zuversichtlich, dass die Beobachtungen in unseren molekularen Daten wirklich die zugrundeliegende Biologie widerspiegeln. Dieser Ansatz trägt dazu bei, neue Erkenntnisse über Endometriose zu gewinnen, und zeigt, wie durchdachte Berechnungsmethoden die biomedizinische Forschung erheblich verbessern können.“
Die Forschungsarbeiten wurden durch das Eunice Kennedy Shriver National Institute of Child Health & Human Development der National Institutes of Health der USA unter der Fördernummer P01HD106414 unterstützt.
Martin Papenberg, Cheng Wang, Maïgane Diop, Syed Hassan Bukhari, Boris Oskotsky, Brittany R. Davidson, Kim Chi Vo, Binya Liu, Juan C. Irwin, Alexis Combes, Brice Gaudilliere, Jingjing Li, David K. Stevenson, Gunnar W. Klau, Linda C. Giudice, Marina Sirota, Tomiko T. Oskotsky. Anticlustering for Sample Allocation To Minimize Batch Effects. Cell Reports Methods (2025).
DOI: 10.1016/j.crmeth.2025.101137
https://www.hhu.de/die-hhu/presse-und-marketing/aktuelles/pressemeldungen-der-hh...
Dr. Martin Papenberg (links) aus der Psychologie und Prof. Dr. Gunnar Klau aus der Informatik leitet ...
Copyright: HHU / Nicolas Stumpe
Criteria of this press release:
Journalists, Scientists and scholars
Information technology, Medicine, Psychology
transregional, national
Research results, Scientific Publications
German
Dr. Martin Papenberg (links) aus der Psychologie und Prof. Dr. Gunnar Klau aus der Informatik leitet ...
Copyright: HHU / Nicolas Stumpe
You can combine search terms with and, or and/or not, e.g. Philo not logy.
You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).
Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.
You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).
If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).