Der Gewinnerbeitrag der Open Research Challenge 2020 liefert eine Methode, paläontologische Datensätze zu bereinigen.
Die von der Friedrich-Alexander-Universität Erlangen-Nürnberg (FAU) organisierte Open Research Challenge 2020 lud Nachwuchswissenschafterinnen und Nachwuchswissenschaftler aus aller Welt ein, Ideen zu entwickeln, mithilfe derer falsche und veraltete Einträge in der größten paläontologischen Datenbank bereinigt werden können. Gewonnen hat die Einreichung eines Paläontologen aus Bristol. Es handelt sich um einen Code, der die Datensets bereinigt.
Wie reagierten Organismen auf klimatische Veränderungen in der Vergangenheit? Warum haben mache Spezies Massenaussterben überlebt? In der Paläontologie gibt es viele offene Fragen, die nur durch den Einsatz von Big Data beantwortet werden können. – Und auch nur dann, wenn die Datenbanken gut sortiert sind. Ein Problem der Datenbanken ist die Zuordnung in die Klassen, die Taxonomie, denn diese verändert sich mit neuen Erkenntnissen. Die Änderungen zu dokumentieren ist schwierig und oft werden Korrekturen nicht in existierende Datenspeicher übernommen. Folglich sind Wissenschaftlerinnen und Wissenschaftler gezwungen sicherzustellen, dass ihre Daten auf dem neusten Stand sind bevor sie ihren eigentlichen Fragen nachgehen können. Forschende der FAU, die sehr oft mit Datenbanken arbeiten, haben junge Wissenschaftlerinnen und Wissenschaftler nach einer Lösung für dieses Problem gefragt.
Die Antwort kommt aus dem Vereinigten Königreich. Der Gewinner der Open Research Challenge 2020, Joseph Flannery Sutherland von der School of Earth Sciences der Universität Bristol, hat einen Code entwickelt, der Paläontologen helfen wird, Fehler und Ungereimtheiten in Datensätzen zu markieren. Dadurch können sich Wissenschaftlerinnen und Wissenschaftler auf ihre eigentliche Forschung konzentrieren. Joe Flannery Sutherland hat einen Code geschrieben, der taxonomische Fehler in der Paleobiology Database (PBDB), der größten Datenbank der Disziplin, automatisch berichtigt. Die Daten werden von Forschenden aus aller Welt zusammengetragen und für quantitative Analysen zu Diversifizierung und Aussterben genutzt. Mittlerweile besteht die Datenbank aus mehr als 1,2 Millionen Datensätzen, von denen viele fehlerhaft oder veraltet sind. Der Code von Joseph Flannery Sutherland, der im Statistikprogramm R entwickelt wurde, wird falsche taxonomische Zuordnungen und Widersprüche in der Schichtzuordnung korrigieren und im Idealfall durch richtige Informationen ersetzen.
Wissenschaftlerinnen und Wissenschaftler müssen dadurch nicht mehr die einzelnen Einträge per Hand berichtigen, etwas, das viel Zeit kostet und fehleranfällig ist. Stattdessen können sie sich auf eine unkomplizierte und reproduktionsfähige Methode verlassen. Prof. Dr. Wolfgang Kießling vom Lehrstuhl für Paläoumwelt an der FAU ist sich sicher, dass der Code die Qualität von Veröffentlichungen und Forschung verbessern wird. „Der Code den Joe Flannery Sutherland entwickelt hat, hilft sehr dabei, unschlüssige und falsche Informationen aus den Datensätzen zu entfernen. Ich bin mich sicher, dass hochspannende Papiere daraus entstehen werden, die die Gesamtqualität der Forschung steigern werden.“
Mehr Informationen:
Blandina Mangelkramer
Stabstelle Presse und Kommunikation
09131/85-70210
blandina.mangelkramer@fau.de
Joe Flannery Sutherland ist der Gewinner der Open Research Challenge 2020
Bild: Joe Flannery Sutherland
Merkmale dieser Pressemitteilung:
Journalisten, Wissenschaftler, jedermann
Geowissenschaften
überregional
Wettbewerbe / Auszeichnungen
Deutsch
Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.
Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).
Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.
Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).
Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).