Im Rahmen eines von der Deutschen Forschungsgemeinschaft (DFG) geförderten Projekts haben Wissenschaftler des Lehrstuhls für Data & Knowledge Engineering an der Bergischen Universität Wuppertal eine neue Funktion für die freie Online-Enzyklopädie Wikipedia entwickelt: Seit Anfang Januar besteht die Möglichkeit, mathematische Formeln um die Bedeutung ihrer einzelnen Elemente zu erweitern. Die Erweiterung basiert auf der Erforschung effektiver Methoden zur automatischen Aufbereitung mathematischer Ausdrücke als maschinenlesbare Informationen.
„Bei vielen Wikipedia-Artikeln fehlt eine gute Erklärung dafür, was die einzelnen Bestandteile der Formeln bedeuten. Das wiederum löst einigen Unmut bei Leser*innen aus“, erklärt Moritz Schubotz. Der Wissenschaftliche Mitarbeiter am Lehrstuhl für Data & Knowledge Engineering von Prof. Dr. Bela Gipp hat die neue Funktion gemeinsam mit Lehrstuhlkollege André Greiner-Petter entwickelt.
Ein Beispiel aus der Praxis findet sich auf der Wikipedia-Seite zur Masse-Energie-Äquivalenz – dem berühmten, von Albert Einstein entdeckten Naturgesetz – beschrieben durch die Formel „E=mc2“: Diese enthält neuerdings Informationen zu den Variablen „E“, „m“ und „c“. „Durch Klicken auf die Formel wird eine neue Informationsseite geöffnet, auf der die Bedeutungen der einzelnen Elemente sowie Links zur weiteren Beschreibung der Formel angezeigt werden“, so Schubotz. Dort erfahren die Leser*innen u.a., dass „E“ für Energie steht, und eine physikalische Größe darstellt. „Die Nutzer*innen müssen somit nicht mehr den kompletten Artikel lesen und sich in dem Fachgebiet des Artikels auskennen, um die Formel als solche zu verstehen.“
Die Wissenschaftler leisten damit einen wichtigen Beitrag für die Verarbeitung mathematischer Ausdrücke und setzen dafür auch auf Künstliche Intelligenz. „Eine entsprechende Informationsseite, wie beispielsweise die zur Äquivalenz von Masse und Energie, manuell zu erstellen, wäre sehr viel Arbeit. Daher erforschen wir Methoden, wie diese Informationen automatisch extrahiert werden können“, fasst Schubotz zusammen. Wichtige Daten zu den unterschiedlichsten Formeln stammen dabei aus der sogenannten „Wikidata“, einer zentralen, sprachunabhängigen Wikipedia-Datenbank, die von Menschen sowie von Computerprogrammen bearbeitet werden kann.
„Während die schlagwort-basierte Suche nach relevanten und verwandten Publikationen in vielen wissenschaftlichen Bereichen zu guten Ergebnissen führt, bedarf es in der Mathematik und in den Naturwissenschaften aufgrund der hohen Dichte an mathematischen Ausdrücken zusätzlicher Strategien“, merkt Schubotz an. Einen ersten Schritt stelle dabei die Aufbereitung der mathematischen Ausdrücke dar: „Diese sind in der Regel für die Darstellung optimiert und als Bilder oder in speziellen Formaten abgespeichert. Für Suchmaschinen zum Beispiel sind das schwer auffindbare Inhalte. Erst durch eine semantische Anreicherung, also das Hinzufügen von Bedeutungen, werden die Formeln zu maschinenlesbaren Informationen.“
Derartige neue Methoden sind eine Grundlage für die automatische Erkennung ähnlicher sowie verwandter mathematischer Ausdrücke. Sie helfen beispielsweise dabei, Such- und Empfehlungsdienste für wissenschaftliche Publikationen zu verbessern und ermöglichen Verlinkungen zu ähnlichen Artikeln und Informationsquellen. Schubotz: „Davon profitieren nicht zuletzt Schüler*innen sowie Studierende in naturwissenschaftlichen Fächern, die sich mathematisches Wissen mit verschiedenen digitalen Medien aneignen.“
Moritz Schubotz
Lehrstuhl für Data & Knowledge Engineering
Telefon 01578/0471397
E-Mail schubotz{at}uni-wuppertal.de
http://purl.org/mir
http://dke.uni-wuppertal.de
Criteria of this press release:
Journalists
Information technology, Language / literature, Mathematics
transregional, national
Research projects, Transfer of Science or Research
German
You can combine search terms with and, or and/or not, e.g. Philo not logy.
You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).
Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.
You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).
If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).