idw - Informationsdienst
Wissenschaft
Mit einer neu entwickelten Methode, die KI-generierte Proteinsequenzen mit natürlich vorkommenden vergleicht, lassen sich funktions- und strukturgebende Aminosäuren wesentlich genauer bestimmen als bisher.
Proteine gehören zu den wichtigsten Bausteinen der Natur und spielen bei den biologischen Prozessen in allen Organismen eine zentrale Rolle. Dementsprechend groß ist der Wunsch der Wissenschaft, sie so genau wie möglich zu verstehen. Als Polymer aus verschiedenen Aminosäuren können Proteine unterschiedliche dreidimensionale Strukturen und verschiedene Funktionen aufweisen. Welche Aminosäuren eher die Proteinfunktion und welche die strukturelle Stabilität beeinflussen, ist aber oftmals schwierig zuzuordnen.
Hier ist einem Team um Andreas Winkler und Oliver Eder vom Institut für Biochemie der TU Graz mit dem sogenannten Function-Structure-Adaptability-Ansatz (FSA) ein Durchbruch gelungen, den sie nun im Fachjournal „Structure“ vorstellen. FSA vergleicht Machine-Learning-generierte, idealisierte Proteinsequenzen mit natürlichen Sequenzen, die in Jahrmillionen der Evolution entstanden sind. Dadurch lassen sich mit bisher nicht erreichter Genauigkeit die für Funktion und Stabilität ausschlaggebenden Aminosäuren identifizieren. Dieses Wissen liefert eine wichtige Grundlage für die Herstellung und Modifikation von Proteinen und damit für die Entwicklung neuer Medikamente, für die gezielte Verbesserung von Proteinen in industriellen Anwendungen und für ein besseres Verständnis von Proteinveränderungen, etwa im Zusammenhang mit Antibiotikaresistenzen.
Die Bausteine des Lebens besser verstehen
„Als Biochemiker wollen wir verstehen, wie Proteine in der Natur entstanden sind und dadurch herausfinden, welche Aminosäuren hierbei für die speziellen Funktionen relevant sind“, sagt Andreas Winkler. „Dafür haben wir das, was die Natur im Laufe ihrer Evolution konserviert hat, mit dem kombiniert, was ein KI-Modell als relevant für Stabilität und Struktur eines Proteins erachtet. Diese Verbindung aus Millionen Jahren an Entwicklungsgeschichte und neuester Technik vereinfacht die Analyse und das Verständnis von Proteinen sehr.“
Für seine Methode nutzte das Team das Deep-Learning-Modell ProteinMPNN, das neue Proteinsequenzen mit dem Ziel generiert, eine vorgegebene stabile, dreidimensionale Struktur einzunehmen. Diese Sequenzen glichen die Forschenden mit jenen in natürlichen Proteinen ab. Als Testsystem verwendeten sie die Proteinfamilie der Bakteriophytochrome, die einigen Bakterien als Photorezeptoren dienen und eine zentrale Rolle bei der Wahrnehmung von Umwelteinflüssen wie Licht spielen. Die neue Analysemethode ergab: Ist eine Aminosäure in den natürlichen Sequenzen wiederholt vertreten, scheint bei ProteinMPNN aber nicht signifikant auf, deutet das auf eine funktionelle Rolle hin. Ist sie hingegen in beiden Sequenzsammlungen stark vorhanden, ist dies der Hinweis auf eine strukturelle Bedeutung.
Validierung im Labor
Für ihren Ansatz gruppierten die Forschenden Aminosäuren anhand chemischer Eigenschaften, um natürliche und KI-generierte Proteine statistisch zu vergleichen. Das ermöglichte die Klassifizierung der Aminosäuren in drei Kategorien: „funktionell“ (wichtig für die spezifische Rolle des Proteins), „strukturell“ (relevant für Stabilität und Faltung) und „anpassungsfähig“ (eine dritte Kategorie, die noch weiterer Forschung bedarf). Die Ergebnisse validierte das Team mittels umfangreicher Laborversuche, bei denen es durch gezielte Veränderungen entsprechend klassifizierter Aminosäuren die funktionellen Eigenschaften von Proteinen beeinflussen konnte. So gelang es etwa, die Lichtwahrnehmung des Photorezeptor-Testsystems zu beeinflussen. Der Vergleich mit bereits aus der Literatur bekannten funktionellen Resten bestätigte die hohe Trefferquote der neuen Analysemethode.
„Früher waren oftmals etliche Monate bis Jahre an Vorarbeit und Laborarbeit notwendig, um so eine Analyse durchzuführen“, sagt Oliver Eder. „Die Vorarbeiten zur Identifikation potenziell interessanter natürlicher Proteinsequenzen sind für ein neues Protein nun innerhalb einer Woche möglich. Und weil wir mit unserer Methode die funktionellen Aminosäuren wesentlich gezielter vorfiltern können, müssen wir im Labor auch viel weniger Zeit für die Überprüfung und Charakterisierung aufwenden. Da die Methode prinzipiell auf alle Proteinklassen anwendbar ist, können wir Proteine nun deutlich gezielter besser verstehen.“
Andreas WINKLER
Assoc.Prof. Dipl.-Ing. Dr.techn.
TU Graz | Institut für Biochemie
Tel.: +43 316 873 6457
andreas.winkler@tugraz.at
Oliver EDER
BSc MSc
TU Graz | Institut für Biochemie
oliver.eder@tugraz.at
Integrating protein sequence design and evolutionary sequence conservation to uncover spectral tuning sites in red-light photoreceptors
Autor*innen: Oliver Maximilian Eder, Massimo Gregorio Totaro, Stefan Minnich, Gustav Oberdorfer, Andreas Winkler
Erschienen in: Structure 33
DOI: https://doi.org/10.1016/j.str.2025.07.018
Schematische Darstellung der natürlichen Sequenzinformation kombiniert mit den auf Deep Learning bas ...
Copyright: IBC - TU Graz/Hintergrund: Google AI Studio
Criteria of this press release:
Journalists, Scientists and scholars
Biology, Chemistry, Medicine
transregional, national
Research results, Scientific Publications
German

You can combine search terms with and, or and/or not, e.g. Philo not logy.
You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).
Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.
You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).
If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).