Sprachdialogsysteme wie Alexa und Siri sind inzwischen große Hilfen bei der Bedienung von Computern, sei es für die Internetsuche oder das "Smart Home". Die Daten allerdings, also die Sprachbefehle, werden auf Servern dieser Firmen langfristig gespeichert, was vielen Benutzern Unbehagen bereitet. Saarbrücker Sprachtechnologen möchten nun im Verbund mit internationalen Kollegen ein Sprachdialogsystem entwickeln, das sowohl von der Qualität her an die großen Marktführer heranreicht, aber auch die Daten so verarbeitet, dass die Privatsphäre des Nutzers immer gewahrt bleibt. Das Projekt wird mit 3,2 Millionen Euro von der EU gefördert. 600.000 Euro fließen an die Saar-Uni.
Sie erleichtern unseren Alltag, hinterlassen aber gleichzeitig bei vielen Nutzern ein mulmiges Gefühl: Sprachdialogsysteme wie Apples Siri oder Amazons Alexa. Inzwischen sind die Kinderkrankheiten beseitigt, und die Systeme funktionieren erstaunlich gut im Alltag. Allerdings landen die Daten der Nutzer, also auch ihre Sprachbefehle und Anfragen, auf Servern der Anbieter. Was damit geschieht, ist nicht klar. Diese Unsicherheit ist häufiger Kritikpunkt beim Umgang mit den praktischen Helfern.
„Maschinelles Lernen braucht allerdings eine riesige Datenmenge, um gut zu funktionieren. Je mehr Daten, desto besser wird das System“, gibt Thomas Kleinbauer zu bedenken. Der Wissenschaftler forscht am Lehrstuhl für Sprach- und Signalverarbeitung bei Professor Dietrich Klakow, der mit seinem Team einen sprachtechnologischen Teil des COMPRISE-Projekts übernimmt. Es ist per se also nicht verwunderlich, dass die großen IT-Unternehmen aus den USA so viele Daten sammeln, wie sie können. Aus technischer Sicht ist es vielmehr sinnvoll, alle diese Daten zu speichern und zu verarbeiten.
„Aber wir wissen natürlich nicht, was in letzter Konsequenz mit den Daten geschieht“, sagt Thomas Kleinbauer. Unter den gespeicherten Daten könnten sich ja auch kritische Dinge befinden, nicht nur Musiktitel oder die Suche nach der neuen Jeans: „Will man beispielsweise die Kreditkartennummer oder seine Patientendaten, die ein Arzt per Sprachassistent in sein Computersystem eingegeben hat, dort gespeichert haben?“
Die Saarbrücker Sprachtechnologen suchen im COMPRISE-Projekt also nach Wegen, ein Sprachdialogsystem zu entwickeln, das zum einen hohe Datenschutzauflagen erfüllt und zum anderen auch die sehr gute Nutzwertigkeit der großen kommerziellen Systeme aufweist. Die Forscher haben dabei viele Punkte im Blick: „Kritische Informationen könnten beispielsweise ausgeblendet oder geändert werden, eine Stimme kann verfremdet werden, bevor sie auf einem Server gespeichert wird“, nennt Professor Klakow einige Beispiele. Das Maschinelle Lernen würde mit solchen anonymisierten Daten aber ebenso funktionieren. „Die Daten an sich blieben nutzbar“, erklärt Klakow. „Gleichzeitig aber wären weniger private Daten auf Servern gespeichert, die außerhalb der Reichweite der Nutzer stehen.“
Am Ende der dreijährigen Forschung wollen die Wissenschaftler mehrere Demonstratoren, zum Beispiel für die Bereiche E-Commerce und E-Health, entwickelt haben, welche die Technologie im kleinen Maßstab vorführen kann.
Federführend im COMPRISE-Projekt (Cost-effective, Multilingual, Privacy-driven voice-enabled Services) ist das nationale französische Institut für Informatik und angewandte Mathematik INRIA (www.inria.fr). Neben der Universität des Saarlandes sind außerdem folgende Partner an COMPRISE beteiligt: Netfective Technology SA (Frankreich, www.bluage.com), Ascora GmbH (Deutschland, https://ascora.net), TILDE SIA (Lettland, www.tilde.com), Rooter Analysis SL (Spanien, www.rooter.es).
Prof. Dr. Dietrich Klakow
Tel.: (0681) 30258122
Dietrich.Klakow@lsv.uni-saarland.de
Dr. Thomas Kleinbauer
Tel.: (0681) 30258130
E-Mail: thomas.kleinbauer@lsv.uni-saarland.de
https://project.inria.fr/comprise/
https://twitter.com/compriseh2020
https://www.linkedin.com/company/comprise-h2020
Merkmale dieser Pressemitteilung:
Journalisten
Informationstechnik, Sprache / Literatur
regional
Forschungsprojekte, Kooperationen
Deutsch
Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.
Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).
Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.
Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).
Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).