Wie lässt sich aus einer großen Menge an genomischen Daten nützliches Wissen gewinnen? Dieser Frage widmet sich PD Dr. Katharina Hoff an der Universität Greifswald. Ihre Forschung zielt darauf ab, die automatische Vorhersage von Genen in Genomen mithilfe von maschinellen Lernverfahren zu verbessern. Mit der kürzlichen Aufnahme in das Heisenberg-Programm der Deutschen Forschungsgemeinschaft (DFG) erhält sie Unterstützung, eine unabhängige Arbeitsgruppe aufzubauen.
Hoff richtet als Bioinformatikerin ihren Schwerpunkt auf die Verbesserung und Automatisierung der Genomannotation, d. h. sie will computergestützt herausfinden, welche Teile einer DNA-Sequenz welche biologische Funktion aufweisen. Dabei konzentriert sie sich auf die automatisierte Vorhersage von proteinkodierenden Genen in Genomen. Im Rahmen der DFG-Förderung plant sie ihre Vision einer Foundation Model-basierten Revolution umzusetzen. „Im Fokus steht für mich die Entwicklung eines umfassenden Annotationssystems für Millionen eukaryotischer Genome, d. h., wir wollen eine Softwarelösung entwickeln, die nicht nur einzelne DNA-Sequenzen analysiert, sondern Millionen verschiedener Organismen in einem gemeinsamen, standardisierten System verarbeiten kann. Dabei sollen nicht nur die Positionen der Gene in den Genomen, sondern auch deren biologische Funktion sowie die Position und Funktion repetitiver Elemente bestimmt werden. Das wäre ein Durchbruch, denn bisher fehlt oft eine einheitliche und zuverlässige Methode, um aus dieser Datenflut nützliche Erkenntnisse zu gewinnen.“
Neue Methoden für die Analyse von Millionen Genomen
Mit über 1,5 Millionen eukaryotischen Spezies – Organismen wie Pilze, Pflanzen, Tiere und Menschen –, die im Rahmen des internationalen Großforschungsprojekts Earth BioGenome Project (EBP) sequenziert werden sollen, stoßen bisherige Methoden schnell an ihre Grenzen. „Wir haben nicht nur sehr viele, sondern auch sehr komplexe Daten“, sagt Hoff. „Traditionelle Methoden können da vor allem für Spezies, die bisher in den Genomdatenbanken unterrepräsentiert sind, nicht mithalten. Daher setzen wir auf Foundation Modelle, die man sich so ähnlich vorstellen kann, wie die Grundlage populärer ChatBots, nur für Genomdaten statt natürlicher Sprache, und weitere maschinelle Lernverfahren.“
Neue Ansätze aus dem Bereich des Deep Learning, wie das an der Universität Greifswald entwickelte Tool „Tiberius“, könnten die Genauigkeit der Genvorhersage deutlich verbessern. Dennoch fehlt für den größten Teil der bislang generierten Genomdaten eine systematische Beschreibung der Inhalte. „Ohne skalierbare neue Methoden bleibt viel Potenzial ungenutzt“, betont die Bioinformatikerin. „Eine verbesserte Genvorhersage hat direkte Auswirkungen auf die Entwicklung neuer Medikamente, die Resistenz von Pflanzen gegenüber Krankheiten oder den Schutz gefährdeter Arten. Wir wollen nicht nur Daten erzeugen, sondern daraus nützliche Erkenntnisse gewinnen – für die Wissenschaft, aber auch für die Gesellschaft.“
Heisenberg-Projekt stärkt die Genomforschung in Greifswald
Als Expertin für die Analyse eukaryotischer Genomdaten hat sich Hoff international einen Namen gemacht. Zu ihren wichtigsten Entwicklungen gehören die Software-Pipelines BRAKER und Galba. So wurde BRAKER bereits über 4400 Mal laut Google Scholar zitiert und mehr als 39 000 Mal als Software-Tool bei Github heruntergeladen. Doch nun geht es um mehr: nicht nur einzelne Gene zu finden, sondern systematisch alle Genstrukturen und funktionen für Millionen von Arten zu identifizieren und auszuwerten.
Dabei hat sich Hoff für die Heisenberg-Förderung ihres Projekts, die bundesweit umgesetzt werden kann, bewusst für die Universität Greifswald und das Institut für Mikrobiologie entschieden. „Die enge Zusammenarbeit mit experimentellen Mikrobiolog*innen, insbesondere im Bereich der Einzeller, ist für die Validierung und Anwendung der entwickelten Methoden von zentraler Bedeutung“, erklärt sie. In Greifswald sieht sie ein ideales Umfeld für ihre Forschung: „Das interdisziplinäre Forschungsgebäude des Center for Functional Genomics of Microbes und die Nähe zum entstehenden Helmholtz-Institut für One Health schaffen optimale Voraussetzungen für unsere Arbeit. Die moderne Recheninfrastruktur der Universität mit speziellen Grafikprozessoren (GPUs) ermöglicht die rechenintensiven Deep-Learning-Analysen, die wir brauchen. Für mich ist das die Chance, langfristig an der Zukunft der Genomforschung mitzuwirken und gleichzeitig die nächste Generation von Bioinformatiker*innen auszubilden.“
Weitere Informationen
Das Heisenberg-Programm der DFG fördert herausragende Wissenschaftler*innen mit dem Ziel, ihnen die Möglichkeit zu geben, eine eigenständige Forschungsgruppe aufzubauen und ihre wissenschaftliche Karriere langfristig zur Professur zu vertiefen. Die Förderung dauert fünf Jahre und bietet umfangreiche finanzielle und institutionelle Unterstützung für innovative Forschungsprojekte.
Für Medienvertreter*innen:
Wir stellen Ihnen unter dem Link https://ugreif.de/knycm ein Foto für die Berichterstattung, das im direkten Zusammenhang mit der Medieninformation steht, bereit. Bei der Verwendung ist das Copyright zu beachten.
Ansprechpartnerin an der Universität Greifswald
PD Dr. Katharina Hoff
Institut für Mathematik und Informatik
Walther-Rathenau-Straße 47, 17489 Greifswald
Telefon +49 3834 420 4624
katharina.hoff@uni-greifswald.de
https://www.linkedin.com/in/pd-dr-katharina-hoff-53283596/
https://bsky.app/profile/katharinahoff.bsky.social
https://fosstodon.org/@KatharinaHoff
Porträt PD Dr. Katharina Hoff
Quelle: Foto: Martha Bahls/UG
Merkmale dieser Pressemitteilung:
Journalisten, Studierende, Wissenschaftler
Informationstechnik, Mathematik
überregional
Buntes aus der Wissenschaft, Personalia
Deutsch

Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.
Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).
Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.
Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).
Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).