Artificial Intelligence interpretierbar gemacht: Maschinelles Lernen auf biologischen Netzwerken

idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Thema Corona

Imagefilm
Science Video Project



Teilen: 
04.08.2020 10:31

Artificial Intelligence interpretierbar gemacht: Maschinelles Lernen auf biologischen Netzwerken

Laura Alvarez Public Relations
CeMM Forschungszentrum für Molekulare Medizin der Österreichischen Akademie der Wissenschaften

    Forscher am CeMM haben eine neue Methode entwickelt, um die Funktion von Zellen im Computer abzubilden und digital zu analysieren. Die neue Methode kombiniert „Deep Learning“ (maschinelles Lernen auf tiefen neuronalen Netzen) mit der Interpretierbarkeit biologischer Netzwerke. Mit dieser Methode können riesige Datensätze aus der Hochdurchsatz-Sequenzierung von einzelnen Zellen effektiv analysiert und interpretiert werden. Die Studie leistet außerdem einen wichtigen Beitrag zur Interpretierbarkeit von Artificial Intelligence (AI), sodass Menschen verständlich nachvollziehen können, warum ein Computermodell auf eine bestimmte Art und Weise entscheidet.

    Computersysteme, die wesentliche Aspekte menschlicher Problemlösung nachahmen, werden als künstliche Intelligenz oder Artificial Intelligence (AI) bezeichnet. Die AI-Forschung hat in den letzten Jahren massive Fortschritte gemacht. Vor allem die Technologie des „Deep Learning“ ermöglichte bahnbrechende Erfolge, um Beispiel bei selbstfahrenden Autos, Strategiespielen wie Go und Schach, und ersten vielversprechende Anwendungen in der medizinischen Diagnostik. Deep Learning verwendet künstliche neuronale Netze. Das sind mathematische Modelle, die basierend auf Trainingsdaten immer weiter adaptiert werden, bis sie „gelernt“ haben, für einen gegebenen Datensatz die passende Lösung zu berechnen.

    In der Biologie hat sich Deep Learning als leistungsstarke Methode zur Vorhersage von biologischen Eigenschaften oder „Phänotypen“ etabliert (also von beobachtbaren Merkmalen von Zellen oder eines Individuums, beispielsweise anhand von Genomdaten). Allerdings ist Deep Learning normalerweise eine „Black Box“-Methode: Mit ausreichend Trainingsdaten können diese künstlichen neuronale Netze zum Beispiel lernen, aus den aktiven Genen den Zelltyp oder aus DNA-Sequenzdaten die Struktur von Proteinen vorherzusagen. Sie können jedoch die erlernten Muster nicht auf verständliche Weise erklären. Aus diesem Grund hat Deep Learning bisher wenig dazu beigetragen, unser Verständnis der molekularen Funktionen unserer Zellen zu verbessern.

    Um diesen Mangel an Interpretierbarkeit zu beheben, verfolgten die CeMM-Forscher Nikolaus Fortelny und Christoph Bock die Idee, Deep Learning direkt auf biologischen Netzwerken durchzuführen – statt auf den sonst üblichen künstlichen neuronalen Netzwerken mit ihrer schematischen und schwer interpretierbaren Struktur. Die beiden Forscher etablierten dafür sogenannte wissensbasierte neuronale Netze („knowlege-primed neural networks“, KPNNs), die auf unserem Wissen über Signalwege und genregulatorische Netzwerken aufbauen. In KPNNs entspricht jeder Knoten einem bestimmten Protein oder Gen, und jede Kante hat eine mechanistische biologische Interpretation (z. B. Protein A reguliert die Expression von Gen B). Die KPNN-Methode zur Analyse der Genregulation und der Signalprozessierung in Zellen wird in einer neuen Studie beschrieben, die in Genome Biology veröffentlicht wurde.

    Indem KPNNs den Deep-Learning-Algorithmus dazu bringen, ausschließlich vom biologischen Netzwerk vorgegebenen biologische Signalwege und Regulationsprozesse zu verwenden, bilden sie eine Brücke zwischen der Vorhersagekraft von Deep Learning und unserem Verständnis biologischer Systeme. Dadurch liefert der neue Ansatz relevante Einblicke in die biologischen Abläufe in den untersuchten Systemen bei gleichzeitig hoher Vorhersageleistung. Wesentliche technische Neuerungen dieser Deep-Learning-Methode betreffen die Stabilisierung der Knotengewichte bei Redundanz im Netzwerk, quantitative Interpretierbarkeit der Knotengewichte und Anpassungen an die spezielle Struktur biologischer Netzwerke.

    Die CeMM-Forscher demonstrierten ihre neue Methode anhand von großen Einzelzelldatensätzen, einschließlich eines Datensatzes mit der Gen-Aktivität von 483.084 Immunzellen, der von der weltweiten Human Cell Atlas Initiative veröffentlicht wurde. In diesem Datensatz entdeckten die Wissenschaftler eine unerwartete Vielfalt in den regulatorischen Netzwerken, insbesondere im Vergleich zwischen den Immunzellen aus dem Knochenmark und jenen aus Nabelschnurblut.

    Die KPNN-Methode kombiniert die Vorhersagekraft von Deep Learning, mit der Interpretierbarkeit biologischer Netzwerke. KPNNs sind besonders für die Analyse von Einzelzell-RNA-Sequenzierungsdaten geeignet. Darüber hinaus ist die neue Methode auf viele andere Bereiche der biologischen und biomedizinischen Forschung übertragbar, in denen relevantes Vorwissen als Netzwerke dargestellt werden kann.

    Die von KPNNs erhaltenen Vorhersagen und biologischen Erkenntnisse könnten in Zukunft besonders hilfreich sein, um die Zellsignale und die Genregulation in gesunden und kranken Zellen zu analysieren, um neue Zielproteine für Medikamente zu identifizieren und um überprüfbare biologische Hypothesen aus Einzelzell-RNA-Sequenzierungsdaten abzuleiten. Die Studie zeigt darüber hinaus, wie Fortschritte der AI-Forschung und insbesondere Deep-Learning-Methoden für die Analyse von biologischen Mechanismen nutzbar und interpretierbar gemacht werden können.

    Die Studie “Knowledge-primed neural networks enable biologically interpretable deep learning on single-cell sequencing data” wurde am 3. August 2020 in Genome Biology veröffentlicht. DOI: 10.1186/s13059-020-02100-5

    Autoren:
    Nikolaus Fortelny und Christoph Bock

    Fördermittel:
    Die Studie wurde mit Unterstützung eines New Frontiers Group Award der ÖAW, Förderung aus Spezialforschungsbereich des Österreichischen Wissenschaftsfonds (FWF SFB F 6102-B21) sowie Forschungsgeldern des Europäischen Forschungsrats (ERC) im Rahmen des Forschungs- und Innovationsprogramms „Horizont 2020“ der Europäischen Union finanziert (Fördervereinbarung Nr. 679146). Nikolaus Fortelny wurde durch ein Stipendium der Europäischen Organisation für Molekularbiologie unterstützt (EMBO ALTF 241-2017).

    Christoph Bock ist seit 2012 Principal Investigator bei CeMM. Er betreibt interdisziplinäre Forschung, um die epigenetischen und genregulatorischen Grundlagen von Krebs zu verstehen und die Präzisionsmedizin mit Genomics-Technologien voranzutreiben. Seine Forschungsgruppe kombiniert experimentelle Biologie (Hochdurchsatz-Sequenzierung, Epigenetik, CRISPR-Screening, synthetische Biologie) mit Informatik (Bioinformatik, maschinelles Lernen, künstliche Intelligenz). Er ist außerdem Gastprofessor an der Medizinischen Universität Wien, wissenschaftlicher Koordinator der Biomedical Sequencing Facility (BSF) am CeMM, und Schlüsselforscher am Ludwig Boltzmann Institute for Rare and Undiagnosed Diseases. Er koordiniert ein EU-Projekt Horizont 2020 zur Einzelzellanalyse menschlicher Organoide als Beitrag zum menschlichen Zellatlas. Christoph Bock ist gewähltes Mitglied der Young Academy der ÖAW und erhielt bedeutende Forschungspreise, darunter die Otto-Hahn-Medaille der Max-Planck-Gesellschaft (2009), ein ERC Starting Grant (2016-2021) und den Overton-Preis von der International Society of Computational Biology (2017).

    Das CeMM Forschungszentrum für Molekulare Medizin der Österreichischen Akademie der Wissenschaften ist eine internationale, unabhängige und interdisziplinäre Forschungseinrichtung für molekulare Medizin unter der wissenschaftlichen Leitung von Giulio Superti-Furga. Das CeMM orientiert sich an den medizinischen Erfordernissen und integriert Grundlagenforschung sowie klinische Expertise, um innovative diagnostische und therapeutische Ansätze für eine Präzisionsmedizin zu entwickeln. Die Forschungsschwerpunkte sind Krebs, Entzündungen, Stoffwechsel- und Immunstörungen sowie seltene Erkrankungen. Das Forschungsgebäude des Instituts befindet sich am Campus der Medizinischen Universität und des Allgemeinen Krankenhauses Wien. www.cemm.oeaw.ac.at


    Wissenschaftliche Ansprechpartner:

    Christoph Bock (c.bock@cemm.oeaw.ac.at)


    Originalpublikation:

    https://doi.org/10.1186/s13059-020-02100-5


    Weitere Informationen:

    https://cemm.at/index.php?id=35&no_cache=1&tx_news_pi1%5Bnews_preview%5D...


    Anhang
    attachment icon Pressetext (DE)

    Merkmale dieser Pressemitteilung:
    Journalisten, Wissenschaftler
    Biologie, Medizin
    überregional
    Forschungsergebnisse
    Deutsch


    Erstautor Nikolaus Fortelny sowie Senior-Autor Christoph Bock


    Zum Download

    x

    Abbildung 1 - Nikolaus Fortelny et al (Genome Biology)


    Zum Download

    x

    Hilfe

    Die Suche / Erweiterte Suche im idw-Archiv
    Verknüpfungen

    Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.

    Klammern

    Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).

    Wortgruppen

    Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.

    Auswahlkriterien

    Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).

    Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).

    Cookies optimieren die Bereitstellung unserer Dienste. Durch das Weitersurfen auf idw-online.de erklären Sie sich mit der Verwendung von Cookies einverstanden. Datenschutzerklärung
    Okay