idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instanz:
Teilen: 
16.05.2023 09:53

Neuartige KI-basierte Software ermöglicht schnelle und zuverlässige Abbildung von Proteinen in Zellen

Johann Jarzombek Presse- und Öffentlichkeitsarbeit
Max-Planck-Institut für molekulare Physiologie

    Dortmunder Max-Planck-Forschende haben eine Software entwickelt, die Proteine in der Kryo-Elektronentomographie genau erkennt, auswählt und so die mühsame händische Selektion ersetzt.

    Die Kryo-Elektronentomographie (Kryo-ET) entwickelt sich zu einer leistungsfähigen Technik zur Abbildung detaillierter 3D-Bilder von zellulären Umgebungen und eingeschlossenen Biomolekülen. Eine der Herausforderungen bei dieser Methode ist jedoch die Identifizierung von Proteinmolekülen in den Bildern für die anschließende Prozessierung am Computer. Ein Forscherteam um Stefan Raunser, Direktor am MPI für molekulare Physiologie in Dortmund, hat unter der Leitung von Thorsten Wagner eine Software entwickelt, um Proteine in überfüllten zellulären Räumen zu identifizieren. Das neue Open-Source-Tool mit dem Namen TomoTwin nutzt metrisches Deep Learning basierend auf neuronalen Netzen, und ermöglicht es Forschenden, mehrere Proteine mit hoher Genauigkeit und hohem Durchsatz zu lokalisieren, ohne das neuronale Netz jedes Mal manuell neu erstellen oder neu trainieren zu müssen.

    Je mehr, desto besser
    "TomoTwin ebnet den Weg für die automatisierte Identifizierung und Lokalisierung von Proteinen direkt in ihrer zellulären Umgebung und erweitert damit das Potenzial der Kryo-ET", sagt Gavin Rice, Co-Autor der Studie. Die Kryo-ET hat das Potenzial, die Funktionsweise von Biomolekülen in einer Zelle zu entschlüsseln und damit die Grundlagen des Lebens und die Entstehung von Krankheiten aufzudecken.
    Bei einem Kryo-ET-Experiment erstellen die Forschenden in einem Transmissions-Elektronenmikroskop 3D-Bilder, so genannte Tomogramme, eines zellulären Raums mitsamt den darin enthaltenen komplexen Biomolekülen. Für ein detaillierteres Bild jedes einzelnen Proteins, bilden sie einen Mittelwert aus so vielen Kopien wie möglich - ähnlich wie Fotografen, die dasselbe Foto mit unterschiedlichen Belichtungen aufnehmen, um sie später zu einem perfekt belichteten Bild zu kombinieren. Entscheidend ist, dass man die verschiedenen Proteine im Bild richtig identifiziert und lokalisiert, bevor man sie mittelt. „Wir können Hunderte von Tomogrammen pro Tag erstellen, aber uns fehlten bisher Werkzeuge, um die Moleküle darin vollständig zu identifizieren", sagt Rice.

    Handverlesen
    Bisher haben die Forschenden in den Tomogrammen nach Übereinstimmungen mit bereits bekannten Molekülstrukturen gesucht. Die dazu benutzten Algorithmen sind jedoch fehleranfällig. Eine weitere Option ist die Identifizierung von Molekülen per Hand, die zwar eine qualitativ hochwertige Auswahl gewährleistet, jedoch Tage bis Wochen pro Datensatz in Anspruch nimmt.

    Weiterhin ist der Einsatz einer Form des überwachten maschinellen Lernens möglich. Diese Tools können sehr genau sein, sind aber derzeit nicht sehr benutzerfreundlich, da die Software für jedes neue Protein mit manueller Kennzeichnung von Tausenden von Beispielen trainiert werden muss - eine schier unmögliche Aufgabe für kleine biologische Moleküle in einer überfüllten zellulären Umgebung.

    TomoTwin
    Die neu entwickelte Software TomoTwin überwindet viele dieser Hürden: Sie lernt, die sich in ihrer Form innerhalb eines Tomogramms ähnelnden Moleküle herauszufiltern und ordnet sie einem geometrischen Raum zu - das System wird belohnt, wenn es ähnliche Proteine nahe beieinander platziert, und bestraft, wenn es das nicht tut. In der entstehenden Karte (Bild 1) können die Forschenden die verschiedenen Proteine isolieren und genau identifizieren und sie auf diese Weise in der Zelle lokalisieren. "Ein Vorteil von TomoTwin ist, dass wir ein vortrainiertes „Picking-Modell“ anbieten", sagt Rice. Durch den Wegfall des Trainingsschritts kann die Software sogar auf lokalen Computern laufen - wo die Verarbeitung eines Tomogramms bisher 60-90 Minuten dauerte, reduziert sich die Laufzeit auf dem MPI-Supercomputer Raven auf 15 Minuten pro Tomogramm.
    TomoTwin ermöglicht es den Forschenden, Dutzende von Tomogrammen in der Zeit auszuwählen, die sonst für die manuelle Auswahl eines einzigen Tomogramms erforderlich ist. Dies erhöht den Datendurchsatz aber auch die mittlere Geschwindigkeit ein besseres Bild zu erhalten. Derzeit kann die Software nur globuläre Proteine oder Proteinkomplexe mit einer Größe von mehr als 150 Kilodalton in Zellen aufspüren; in Zukunft will die Raunser-Gruppe auch Membranproteine, fadenförmige Proteine und Proteine mit geringerer Größe einbeziehen.


    Wissenschaftliche Ansprechpartner:

    Prof. Dr. Stefan Raunser
    Direktor Abteilung Strukturbiochemie
    Max-Planck-Institut für molekulare Physiologie
    Tel.: +49 231 133 2300
    E-Mail: Stefan.Raunser@mpi-dortmund.mpg.de


    Originalpublikation:

    Rice G, Wagner T, Stabrin M, Raunser S (2023). TomoTwin: generalized 3D localization of macromolecules in cryo-electron tomograms with structural data mining. Nature Methods. Doi: 10.1038/s41592-023-01878-z.


    Weitere Informationen:

    https://www.mpi-dortmund.mpg.de/aktuelles/tomotwin


    Bilder

    TomoTwin-Verarbeitungskarten für ein auf 2D abgeflachtes Tomogramm. Partikel verschiedener Makromoleküle werden in der Karte entsprechend ihrer Struktur angeordnet, so können verschiedene Makromoleküle in Zellen identifiziert und lokalisiert werden.
    TomoTwin-Verarbeitungskarten für ein auf 2D abgeflachtes Tomogramm. Partikel verschiedener Makromole ...

    MPI für molekulare Physiologie

    Erstautoren Gavin Rice (links) und Thorsten Wagner (rechts).
    Erstautoren Gavin Rice (links) und Thorsten Wagner (rechts).

    MPI für molekulare Physiologie


    Merkmale dieser Pressemitteilung:
    Journalisten, Lehrer/Schüler, Studierende, Wissenschaftler, jedermann
    Biologie, Chemie, Informationstechnik
    überregional
    Forschungsergebnisse, Wissenschaftliche Publikationen
    Deutsch


     

    TomoTwin-Verarbeitungskarten für ein auf 2D abgeflachtes Tomogramm. Partikel verschiedener Makromoleküle werden in der Karte entsprechend ihrer Struktur angeordnet, so können verschiedene Makromoleküle in Zellen identifiziert und lokalisiert werden.


    Zum Download

    x

    Erstautoren Gavin Rice (links) und Thorsten Wagner (rechts).


    Zum Download

    x

    Hilfe

    Die Suche / Erweiterte Suche im idw-Archiv
    Verknüpfungen

    Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.

    Klammern

    Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).

    Wortgruppen

    Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.

    Auswahlkriterien

    Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).

    Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).