idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instance:
Share on: 
06/10/2022 08:18

Mehr Daten in der Chemie

Maren Mielck Abteilung Öffentlichkeitsarbeit
Gesellschaft Deutscher Chemiker e.V.

    Berichte über negative Ergebnisse würden die Planung von chemischen Synthesen verbessern

    Unzählige chemische Experimente sind in Datenbanken zugänglich. Dennoch sind diese Daten nicht gut genug, um mithilfe von künstlicher Intelligenz (KI) und maschinellem Lernen bei neuen Synthesen Produktausbeuten vorherzusagen, hat ein Forschungsteam herausgefunden. Wie das Team in der Zeitschrift Angewandte Chemie berichtet, liegt die schlechte Datenqualität vor allem auch an der Neigung der Wissenschaftler:innen, fehlgeschlagene Experimente nicht zu veröffentlichen.

    Bei der Vorhersage von Molekülstrukturen und Materialeigenschaften leisten maschinelle Lernwerkzeuge bereits sehr viel. Geht es aber konkret um die Produktausbeute bei einer Synthese, liefern KI-basierte Modelle nur ungenaue Vorhersagen, stellten Forschende um Frank Glorius von der Westfälischen Wilhelms-Universität Münster fest.

    Den Grund für das Scheitern identifizierten die Forschenden in der Qualität der Daten, auf die die KI zurückgreift. „Die Vorhersage von Reaktionsausbeuten, also der Reaktivität, ist viel herausfordernder als die Vorhersage von molekularen Eigenschaften. Ausgangsstoffe, Hilfsstoffe, Mengen, Bedingungen, Ausführung des Experiments – sie alle bestimmen die Ausbeute, was bedeutet, dass dieses Problem sehr datenintensiv wird,“ erklärt Frank Glorius, Korrespondenzautor der Studie. Trotz der riesigen Menge an verfügbarer Literatur reichten die Daten also nicht aus, um Ausbeuten korrekt vorherzusagen.

    Das Problem liege dabei häufig nicht an zu wenig berichteten Experimenten, sondern an einer Datenschieflage. Drei mögliche Ursachen identifizierten die Forschenden: Zum einen unterliegen die Ergebnisse von chemischen Synthesen grundsätzlich experimentellen Fehlern. Zweitens treffen Wissenschaftler:innen bei ihrer Reaktionsplanung mehr oder weniger bewusst eine Vorauswahl, die auf persönlicher Erfahrung und Vertrauen in etablierte Verfahren beruht. Und drittens melden sie fehlgeschlagene Reaktionen weniger häufig als erfolgreiche – vermeintlich führen nur Reaktionen mit einem positiven Ergebnis zu einem wissenschaftlichen Fortschritt.

    Um herauszufinden, welcher der drei Faktoren den größten Einfluss hat, veränderten Glorius und sein Team den Datensatz für vier gängige (und daher datenreiche) organische Reaktionen. So erhöhten sie künstlich den experimentellen Fehler, reduzierten die Daten auf eine noch kleinere Vorauswahl, oder sie nahmen aus dem Datensatz negative Ergebnisse heraus. Am wenigsten Einfluss auf das Modell hatte der experimentelle Fehler, sehr groß war dagegen der Einfluss der negativen Ergebnisse, heißt es in der Studie.

    Wissenschaftler:innen sollten also unbedingt ermutigt werden, fehlgeschlagene Ergebnisse ebenfalls zu berichten, schreibt das Team. Damit verbessere sich die Datenlage, und KI-basierte maschinelle Lernmodelle können die Arbeit beschleunigen und effizienter machen. „Maschinelles Lernen wird die Effizienz in der (molekularen) Chemie dramatisch verbessern. Chemiker:innen kommen mit weniger Reaktionen aus, um ein bestimmtes Ziel zu erreichen wie zum Beispiel optimale Ausbeuten. Dadurch werden chemische Prozesse – und die Welt – nachhaltiger,“ bekräftigt Glorius.

    Angewandte Chemie: Presseinfo 12/2022

    Autor/-in: Frank Glorius, Westfälische Wilhelms-Universität Münster (Germany), https://www.uni-muenster.de/Chemie.oc/glorius/glorius.html

    Angewandte Chemie, Postfach 101161, 69451 Weinheim, Germany.
    Die "Angewandte Chemie" ist eine Publikation der GDCh.


    Original publication:

    https://doi.org/10.1002/ange.202204647


    More information:

    http://presse.angewandte.de


    Images

    Mehr Daten in der Chemie
    Mehr Daten in der Chemie

    (c) Wiley-VCH


    Criteria of this press release:
    Journalists, Scientists and scholars, Students
    Chemistry, Materials sciences
    transregional, national
    Research results, Scientific Publications
    German


     

    Mehr Daten in der Chemie


    For download

    x

    Help

    Search / advanced search of the idw archives
    Combination of search terms

    You can combine search terms with and, or and/or not, e.g. Philo not logy.

    Brackets

    You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).

    Phrases

    Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.

    Selection criteria

    You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).

    If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).