Sie sind heterogen, nicht immer einfach zu handhaben und sekündlich werden es mehr: Ohne Daten entsteht kein neues Wissen. Wie aber kann die Wissenschaft sie nachhaltig nutzen, aus ihnen neue, reproduzierbare Erkenntnisse gewinnen und Innovationen entwickeln? Mit „Data Train – Training in Research Data Management and Data Science“ hat die U Bremen Research Alliance ein interdisziplinäres Weiterbildungsangebot für Promovierende geschaffen, das Kompetenzen im Umgang mit Forschungsdaten und bei der Datenwertschöpfung vermittelt.
Katharina Friz hat sich Einiges vorgenommen. Gleich mit drei Krisen in 29 Ländern beschäftigt sich die Wirtschaftswissenschaftlerin: der Finanzkrise 2008 / 2009, der Krim-Krise 2015 und der latent schwelenden Umweltkrise. Welche wirtschaftlichen Auswirkungen haben diese Krisen insbesondere auf das Innovationsverhalten von Unternehmen in Russland, aber auch in den anderen Transformationsländern? Also in denjenigen Staaten in Mittel- und Osteuropa sowie in Asien, die einst zum Einflussbereich der Sowjetunion gehörten und den Übergang von der Zentralverwaltungswirtschaft in eine marktwirtschaftliche Wirtschaftsordnung erlebten? Das untersucht die 27-Jährige in ihrer Doktorarbeit an der Universität Bremen.
„Ich arbeite empirisch“, sagt Katharina Friz. Daten bilden die Basis für ihre Promotion. Sie stammen etwa von der Europäischen Bank für Wiederaufbau und Entwicklung oder auch von dem russischen Umfrageinstitut Levada. Es handelt sich um Word-, Excel- und PDF-Dateien oder einfach nur um Zahlenreihen, die sie mithilfe einer Statistiksoftware auswertet. „Sobald man in die Datenwelt eintaucht, merkt man, wie groß sie eigentlich ist, und dann kann es schnell kompliziert werden“, erzählt sie. Wie kommt man an die richtigen Daten? Wie wertet man sie aus? Wie verlässlich sind sie? Wie verwaltet man sie nachhaltig? Das seien Fragen, die sie in ihrem Wissenschaftsalltag beschäftigen.
--- „Sobald man in die Datenwelt eintaucht, merkt man, wie groß sie eigentlich ist, und dann kann es schnell kompliziert werden.“ ---
Um sie besser beantworten zu können, um sich mit anderen Promovierenden auszutauschen und über den Tellerrand der eigenen Disziplin zu blicken, nimmt die wissenschaftliche Mitarbeiterin in der Arbeitsgruppe von Prof. Dr. Jutta Günther an Data Train teil. Dieses Programm hat die U Bremen Research Alliance mit Unterstützung des Landes Bremen ins Leben gerufen. „Forschende aller Fachrichtungen brauchen grundlegende Kenntnisse im Umgang mit den Daten. Mit Data Train wollen wir den Teilnehmenden ein fundiertes Wissen vermitteln“, sagt Prof. Dr. Iris Pigeot, stellvertretende Vorsitzende der U Bremen Research Alliance und Initiatorin des Angebots.
Das Management von Daten ist von zunehmender Relevanz. Immer mehr, mehr, mehr Daten werden produziert. In jeder Sekunde werden 9000 Tweets versendet, 1000 Fotos auf Instagram gepostet, sammeln Sensoren zum Beispiel Bewegungs-, Umwelt- und Gesundheitsdaten. Von jetzt 64 auf 175 Zettabyte im Jahr 2025 wächst der Datenberg, wird geschätzt, wobei ein Zettabyte eine Zahl mit einundzwanzig Nullen ist.
Nicht alle, aber viele dieser Daten haben für die Wissenschaft einen enormen Wert. So leistet etwa die Verknüpfung von GPS-Daten, die von Handys erzeugt werden, mit Gesundheitsdaten einen wertvollen Beitrag zur Bekämpfung der Corona-Pandemie. Wer die Techniken des Forschungsdatenmanagements und Data-Science-Anwendungen beherrscht, hat einen Vorsprung nicht nur in der wissenschaftlichen Arbeit bei der Suche nach Innovationen und neuen Erkenntnissen. Diese Fähigkeiten sind auch außerhalb der Universitäten und Forschungsinstitute enorm gefragt. Die Wirtschaft sucht händeringend Menschen mit Datenkompetenzen.
Dabei muss man nicht zwangsweise Expertin oder Experte für komplexe Methoden der Datenanalyse sein und die Programmierung von Algorithmen oder maschinelles Lernen beherrschen, obwohl auch diese Themen Bestandteil des Ausbildungsprogramms sind. „Das Gute an dem Angebot ist, dass es flexibel ist. Die Teilnehmenden können nach ihren Bedürfnissen Schwerpunkte setzen, auch gezielt nur einzelne Kurse besuchen und es lässt sich gut in die Arbeit für die Promotion integrieren“, sagt Katharina Friz.
--- „Zusätzlich zu den Kursen wollen wir den Teilnehmenden eine Plattform für Austausch und Vernetzung zur Verfügung stellen.“ ---
Drei interdisziplinäre Abschnitte, die ineinander übergehen, umfasst Data Train. Den Auftakt macht der „Starter Track“: interaktive, zweistündige Online-Vorlesungen zu grundlegenden Themen wie Data Science, Big Data, Datenmanagement und -sicherheit. Es folgt der „Operator Track Data Steward“, in dem es in mehrtägigen Hands-on-Workshops um das Dokumentieren, Verwalten, Vorprozessieren und Harmonisieren von Daten geht. Im letzten Abschnitt, dem „Operator Track Data Scientist“, geht es schließlich um die Vermittlung umfassender Methoden aus der Mathematik, Statistik und Informatik zur Datenauswertung wie maschinelles Lernen oder auch die Visualisierung von Daten.
Zusätzlich zu den Kursen wollen wir den Teilnehmenden eine Plattform für Austausch und Vernetzung zur Verfügung stellen“, erläutert Dr. Tanja Hörner, die Programmkoordinatorin. „Außerdem bieten wir inspirierende Vorträge über Daten aus Wirtschaft, Gesellschaft sowie allen Bereichen der Wissenschaft und werden digitale Aus- und Weiterbildungsmaterialien zur Verfügung stellen.“ Ein gutes Dreivierteljahr dauert das Programm, das im März 2021 begonnen hat. Ist ein Abschnitt, genannt Track, abgeschlossen, er halten die Teilnehmenden einen Nachweis über alle absolvierten Kurse. Im Frühjahr 2022 startet dann ein neuer Durchgang.
Ein zentraler Bestandteil der Ausbildung ist die Vermittlung der FAIR-Prinzipien: Findable, Accessible, Interoperable und Reusable – also auffindbar, zugänglich, interoperabel und wiederverwendbar – müssen die Daten sein. Das hört sich einfacher an, als es ist. Denn die Daten sind äußerst heterogen und es gilt, gemäß den rechtlichen und ethischen Rahmenbedingungen zu handeln. Dabei kann es sich um Fotos handeln, um Text- oder Audiodateien, um Filme, Zahlen oder Tabellen in den unterschiedlichsten Formaten.
„Jeder spricht über Daten, aber es sind die Metadaten, auf die es ankommt“, betont Prof. Dr. Frank Oliver Glöckner. Der Professor für Erdsystem-Datenwissenschaften am Fachbereich Geowissenschaften der Universität Bremen und Leiter des Bereichs Daten am Rechen- und Datenzentrum des Alfred-Wegener- Institutes in Bremerhaven ist einer der Architekten des Programms – ebenso wie Prof. Dr. Rolf Drechsler, Sprecher des Data Science Centers der Universität Bremen. Insgesamt engagieren sich mehrere Dutzend Forschende aus der U Bremen Research Alliance für Data Train und vermitteln in den Kursen ihr Wissen – ohne zusätzliche Entlohnung übrigens. Auch allianz- externe Forschungseinrichtungen und Wirtschafts- unternehmen unterstützen Data Train mit Beiträgen.
Doch zurück zu den Metadaten: Das sind Informationen, die eine Datei beschreiben – im Falle eines Fotos etwa, wer es wann, wo und mit welcher Blende aufgenommen hat und was darauf zu sehen ist. Im Falle eines Buches ist das der Name der Autorin oder des Autors, die Auflage, das Erscheinungsjahr, der Verlag und die ISBN. Metadaten beschreiben also einen Datensatz. „Sie müssen wie gesagt den FAIR-Datengrundsätzen entsprechen, maschinenlesbar und interpretierbar sein“, sagt Glöckner.
--- „Für mich wäre es schön gewesen, wenn es das Angebot schon zu Beginn meiner Promotion gegeben hätte.“ ---
Katharina Friz hat ihre ersten Veranstaltungen im „Starter Track“ absolviert, sie hat sie als bereichernd empfunden. Darunter ist auch eine Vorlesung von Philosophie-Professor Dr. Dr. Norman Sieroka zum kritischen Denken im Umgang mit Daten gewesen. „Das war mal ein ganz anderer, sehr lehrreicher Blickwinkel.“ Spätestens Ende des Jahres wird die Nachwuchswissenschaftlerin ihre Promotion abgeschlossen haben, gerade in der Schlussphase gibt es viel zu tun. Ob sie Data Train bis zum Ende absolviert, ob sie auch beim Data Steward und Data Scientist dabei sein wird, weiß sie noch nicht. „Für mich“, sagt sie, „wäre es schön gewesen, wenn es das Angebot schon zu Beginn meiner Promotion gegeben hätte.“
**********
--- Aktuell startet das neue Veranstaltungsformat des Data Train Programms: „Die Data Storys“: ---
In anwendungsnahen Vorträgen werden inspirierende "Storys" über den Umgang mit Daten, Datenmanagement und Data Science in der Privatwirtschaft vorgestellt. Die Referentinnen und Referenten beleuchten die Wichtigkeit von Datenkompetenzen im Hinblick auf ihre jeweiligen Arbeitsfelder und diskutieren aktuelle Herausforderungen. Die Vorträge werden durch eine gemeinsame Diskussion ergänzt.
--- Das neue Format startet mit: ---
Data Story #001 “Data Centric Systems in the Public Sector and Industry”
Vortragende: Sonja Sievi & Götz Anspach von Broecker (AIRBUS)
Moderation: Prof. Frank Oliver Glöckner (Data Train Sprecher)
Wann: 8.12.2021, 16:00-18:00 Uhr
Wo: Online via VC
Dr. Tanja Hörner (data-train@vw.uni-bremen.de)
Impact – Das Wissenschaftsmagazin der U Bremen Research Alliance
In der U Bremen Research Alliance kooperieren die Universität Bremen und zwölf Forschungsinstitute der vier deutschen Wissenschaftsorganisationen sowie das Deutsche Forschungszentrum für Künstliche Intelligenz - alle mit Sitz im Bundesland.
Das seit 2019 erscheinende Forschungsmagazin Impact dokumentiert die kooperative Forschungsstärke der Allianz und ihre gesellschaftliche Relevanz. „Mit Data Train zu neuen Erkenntnissen“ wurde in Ausgabe 4 (06.2021) veröffentlicht.
https://www.uni-bremen.de/fileadmin/user_upload/sites/research_alliance/Impact_M...
http://www.uni-bremen.de/data-train Informationen zu Data Train und Data Storys
U Bremen Research Alliance Data Train
U Bremen Research Alliance
U Bremen Research Alliance
Criteria of this press release:
Business and commerce, Journalists, Scientists and scholars, Students, Teachers and pupils, all interested persons
interdisciplinary
transregional, national
Advanced scientific education, Transfer of Science or Research
German
You can combine search terms with and, or and/or not, e.g. Philo not logy.
You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).
Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.
You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).
If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).