Sprachdialogsysteme wie Alexa und Siri sind inzwischen große Hilfen bei der Bedienung von Computern, sei es für die Internetsuche oder das "Smart Home". Die Daten allerdings, also die Sprachbefehle, werden auf Servern dieser Firmen langfristig gespeichert, was vielen Benutzern Unbehagen bereitet. Saarbrücker Sprachtechnologen möchten nun im Verbund mit internationalen Kollegen ein Sprachdialogsystem entwickeln, das sowohl von der Qualität her an die großen Marktführer heranreicht, aber auch die Daten so verarbeitet, dass die Privatsphäre des Nutzers immer gewahrt bleibt. Das Projekt wird mit 3,2 Millionen Euro von der EU gefördert. 600.000 Euro fließen an die Saar-Uni.
Sie erleichtern unseren Alltag, hinterlassen aber gleichzeitig bei vielen Nutzern ein mulmiges Gefühl: Sprachdialogsysteme wie Apples Siri oder Amazons Alexa. Inzwischen sind die Kinderkrankheiten beseitigt, und die Systeme funktionieren erstaunlich gut im Alltag. Allerdings landen die Daten der Nutzer, also auch ihre Sprachbefehle und Anfragen, auf Servern der Anbieter. Was damit geschieht, ist nicht klar. Diese Unsicherheit ist häufiger Kritikpunkt beim Umgang mit den praktischen Helfern.
„Maschinelles Lernen braucht allerdings eine riesige Datenmenge, um gut zu funktionieren. Je mehr Daten, desto besser wird das System“, gibt Thomas Kleinbauer zu bedenken. Der Wissenschaftler forscht am Lehrstuhl für Sprach- und Signalverarbeitung bei Professor Dietrich Klakow, der mit seinem Team einen sprachtechnologischen Teil des COMPRISE-Projekts übernimmt. Es ist per se also nicht verwunderlich, dass die großen IT-Unternehmen aus den USA so viele Daten sammeln, wie sie können. Aus technischer Sicht ist es vielmehr sinnvoll, alle diese Daten zu speichern und zu verarbeiten.
„Aber wir wissen natürlich nicht, was in letzter Konsequenz mit den Daten geschieht“, sagt Thomas Kleinbauer. Unter den gespeicherten Daten könnten sich ja auch kritische Dinge befinden, nicht nur Musiktitel oder die Suche nach der neuen Jeans: „Will man beispielsweise die Kreditkartennummer oder seine Patientendaten, die ein Arzt per Sprachassistent in sein Computersystem eingegeben hat, dort gespeichert haben?“
Die Saarbrücker Sprachtechnologen suchen im COMPRISE-Projekt also nach Wegen, ein Sprachdialogsystem zu entwickeln, das zum einen hohe Datenschutzauflagen erfüllt und zum anderen auch die sehr gute Nutzwertigkeit der großen kommerziellen Systeme aufweist. Die Forscher haben dabei viele Punkte im Blick: „Kritische Informationen könnten beispielsweise ausgeblendet oder geändert werden, eine Stimme kann verfremdet werden, bevor sie auf einem Server gespeichert wird“, nennt Professor Klakow einige Beispiele. Das Maschinelle Lernen würde mit solchen anonymisierten Daten aber ebenso funktionieren. „Die Daten an sich blieben nutzbar“, erklärt Klakow. „Gleichzeitig aber wären weniger private Daten auf Servern gespeichert, die außerhalb der Reichweite der Nutzer stehen.“
Am Ende der dreijährigen Forschung wollen die Wissenschaftler mehrere Demonstratoren, zum Beispiel für die Bereiche E-Commerce und E-Health, entwickelt haben, welche die Technologie im kleinen Maßstab vorführen kann.
Federführend im COMPRISE-Projekt (Cost-effective, Multilingual, Privacy-driven voice-enabled Services) ist das nationale französische Institut für Informatik und angewandte Mathematik INRIA (www.inria.fr). Neben der Universität des Saarlandes sind außerdem folgende Partner an COMPRISE beteiligt: Netfective Technology SA (Frankreich, www.bluage.com), Ascora GmbH (Deutschland, https://ascora.net), TILDE SIA (Lettland, www.tilde.com), Rooter Analysis SL (Spanien, www.rooter.es).
Prof. Dr. Dietrich Klakow
Tel.: (0681) 30258122
Dietrich.Klakow@lsv.uni-saarland.de
Dr. Thomas Kleinbauer
Tel.: (0681) 30258130
E-Mail: thomas.kleinbauer@lsv.uni-saarland.de
https://project.inria.fr/comprise/
https://twitter.com/compriseh2020
https://www.linkedin.com/company/comprise-h2020
Criteria of this press release:
Journalists
Information technology, Language / literature
regional
Cooperation agreements, Research projects
German
You can combine search terms with and, or and/or not, e.g. Philo not logy.
You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).
Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.
You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).
If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).