Internationales Forschungsprojekt zu Datenschutz im Computer-Dialog mit ersten Ergebnissen

idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Thema Corona

idw-Abo
Science Video Project



Teilen: 
22.05.2020 10:15

Internationales Forschungsprojekt zu Datenschutz im Computer-Dialog mit ersten Ergebnissen

Thorsten Mohr Pressestelle der Universität des Saarlandes
Universität des Saarlandes

    Seit Ende 2018 entwickeln Saarbrücker Sprachtechnologen in einem internationalen Verbund ein Sprachdialogsystem, das technisch an marktbeherrschende Systeme wie Alexa und Siri heranreicht, aber deutlich besseren Datenschutz bietet. Erste Zwischenergebnisse des COMPRISE-Projekts sind ein Stimmen- und ein Text-Anonymisierer. Beide Werkzeuge stellen sicher, dass sowohl die Nutzerstimmen als auch ihre persönlichen Informationen privat bleiben.

    Der Schlüssel für die Verbesserung von Sprachdialogsystemen wie Alexa, Siri und anderen liegt im Sammeln riesiger Mengen an Sprachdaten von Benutzern: Je mehr diese Systeme mit Sprache trainiert werden, desto besser – nützlicher, schneller, treffsicherer – werden sie. Die Chance, die darin liegt, birgt naheliegenderweise gleichzeitig eines der größten Probleme für den Mensch-Maschine-Dialog: der nur sehr schwierig zu garantierende Datenschutz.

    Denn einerseits gehört Sprache zu den biometrischen Daten, die dazu verwendet werden können, Nutzer zu identifizieren – auch gegen ihren Willen. Andererseits ist die Menge an Informationen, die aus gesprochener Sprache gewonnen werden kann, schlichtweg erstaunlich: So können Information über die Persönlichkeit, allgemeine Merkmale (Geschlecht, Alter, Ethnie, Herkunft), die aktuelle Verfassung (Gesundheitszustand, Alkohollevel, Aufrichtigkeit) und Vorlieben der Benutzers preisgegeben werden, die sie nur ungern mit einem Unternehmen teilen würden. Im Falle einer Sicherheitslücke könnten solche Informationen von Dritten missbraucht werden.

    Eines der Hauptziele von COMPRISE liegt daher in der Entwicklung von Private-by-Design-Sprachtechnologien. Nach Monaten intensiver Arbeit kommt COMPRISE diesem Ziel nun näher, da kürzlich die ersten Werkzeuge des Projekts zum Datenschutz das Licht der Welt erblickt haben.

    Der saarländische Anteil besteht darin in der Arbeit des Teams von Dietrich Klakow, Professor für Sprach- und Signalverarbeitung an der Universität des Saarlandes. Hier betreut insbesondere sein Mitarbeiter Dr. Thomas Kleinbauer die Arbeit im COMPRISE-Projekt. „Wir haben nun in einem ersten Zwischenschritt einen Text-Anonymisierer entwickelt. Dieser soll potenziell den Datenschutz bedrohende Worte oder Phrasen in einem Text identifizieren und durch harmlose Alternativen ersetzen, ohne dabei die Struktur des Textes zu verändern“, erklärt der Sprachtechnologe.

    Konkrete Fälle, für die eine solche Technologie sinnvoll sein kann, gibt es in Hülle und Fülle. Thomas Kleinbauer nennt einige Beispiele: „Sie kaufen zum bei einem neuen Webshop ein und haben dem System Ihre Kreditkartennummer diktiert. Oder Sie wollen sich über ein potenziell kompromittierendes Thema im Internet funkionieren und stellen entsprechende Suchanfragen, etwa zu Selbsthilfegruppen bei einer tödlichen Krankheit.“

    Das Programm würde in solchen Fällen zum Beispiel automatisch die Kreditkartennummer durch eine andere, zufällig generierte Nummer ersetzen oder die konkrete Suchanfrage nach Krankheit und Selbsthilfegruppe durch andere, zufällig erzeugte Wörter ersetzen. Das Gute daran: Die Anonymisierung solcher Daten wäre kein Hindernis dafür, dass die maschinellen Systeme sich weiterhin selbst verbessern könnten. „Die Daten an sich blieben nutzbar“, erklärt Professor Dietrich Klakow. „Gleichzeitig aber wären weniger private Daten auf Servern gespeichert, die außerhalb der Reichweite der Nutzer stehen.“

    Ein weiteres Zwischenergebnis, das das INRIA in Lille inzwischen erarbeitet hat, liegt in einem Voice-Transformer-Programm. Dieses kann die Stimme eines Nutzers in die einer zufälligen anderen Person umwandeln. Damit wird die biometrische Identifizierung des ursprünglichen Nutzers wirksam verhindert.

    Federführend im COMPRISE-Projekt (Cost-effective, Multilingual, Privacy-driven voice-enabled Services) ist das nationale französische Institut für Informatik und angewandte Mathematik INRIA (www.inria.fr). Neben der Universität des Saarlandes sind außerdem folgende Partner an COMPRISE beteiligt: Netfective Technology SA (Frankreich, www.bluage.com), Ascora GmbH (Deutschland, https://ascora.net), TILDE SIA (Lettland, www.tilde.com), Rooter Analysis SL (Spanien, www.rooter.es).
    COMPRISE wird seit Dezember 2018 mit 3,2 Millionen Euro gefördert, wovon rund 600.000 an die Universität des Saarlandes fließen.


    Wissenschaftliche Ansprechpartner:

    Prof. Dr. Dietrich Klakow
    Tel.: (0681) 30258122
    E-Mail: Dietrich.Klakow@lsv.uni-saarland.de

    Dr. Thomas Kleinbauer
    Tel.: (0681) 30258130
    E-Mail: thomas.kleinbauer@lsv.uni-saarland.de


    Weitere Informationen:

    https://project.inria.fr/comprise/
    https://twitter.com/compriseh2020
    https://www.linkedin.com/company/comprise-h2020


    Merkmale dieser Pressemitteilung:
    Journalisten
    Informationstechnik, Sprache / Literatur
    regional
    Forschungsergebnisse, Kooperationen
    Deutsch


    Dr. Thomas Kleinbauer


    Zum Download

    x

    Prof. Dr. Dietrich Klakow


    Zum Download

    x

    Hilfe

    Die Suche / Erweiterte Suche im idw-Archiv
    Verknüpfungen

    Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.

    Klammern

    Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).

    Wortgruppen

    Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.

    Auswahlkriterien

    Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).

    Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).

    Cookies optimieren die Bereitstellung unserer Dienste. Durch das Weitersurfen auf idw-online.de erklären Sie sich mit der Verwendung von Cookies einverstanden. Datenschutzerklärung
    Okay