idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Grafik: idw-Logo

idw - Informationsdienst
Wissenschaft

Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instance:
Share on: 
07/17/2024 16:08

DFKI richtet vertrauenswürdige Forschungsumgebung für sensible persönliche Daten ein

Christof Burgard DFKI Saarbrücken
Deutsches Forschungszentrum für Künstliche Intelligenz GmbH, DFKI

    Personenbezogene Daten sind ein wahrer Schatz für die KI-Forschung, insbesondere in der Medizin. Da sie jedoch sehr persönliche Informationen enthalten, sind sie gesetzlich besonders geschützt. Mit SEMLA – Secure Machine Learning Architecture – hat das DFKI nun eine interne Forschungsinfrastruktur für das Training neuronaler Netze mit hochsensiblen Daten geschaffen. Am 17. Juli wurde die vertrauenswürdige Forschungsinfrastruktur des DFKI in Saarbrücken eingeweiht.

    Medizinische Daten aus Patientenakten, aus der intensivmedizinischen Überwachung oder aus klinischen Studien werden in maschinellen Lernverfahren genutzt, um neuronale Netze zu trainieren. Diese KI-Modelle unterstützen Ärztinnen und Ärzte bei der Interpretation von Ultraschall-, Röntgen-, MRT- oder CT-Bildern, bei der Diagnostik und Therapieplanung, oder in der medizinischen Forschung. Im Krankenhausmanagement erlauben sie beispielsweise Vorhersagen über den Genesungsprozess von Patientinnen und Patienten und ermöglichen so eine präzisere Kapazitätsplanung oder einen nahtlosen Übergang in die Anschlussversorgung. Hinzu kommen Daten aus Bild-, Video- und Audiomaterial, etwa aus der sozialen Interaktion von Ärzten mit Patienten, die wichtige Rückschlüsse etwa auf das Befinden von Patienten mit psychiatrischen oder psychosomatischen Erkrankungen geben können.

    All diese Gesundheitsdaten sind hochsensibel und unterliegen den strengen Bestimmungen der Datenschutzgrundverordnung (DSGVO), den Datenschutzgesetzen von Bund und Ländern sowie einer Reihe weiterer gesetzlicher Vorschriften im Bereich des Gesundheitswesens und der medizinischen Forschung. Dieser Rahmen soll neben der ärztlichen Schweigepflicht die Vertraulichkeit und Integrität der Gesundheitsdaten gewährleisten, ihren Missbrauch verhindern und die Grundrechte und Grundfreiheiten der Patientinnen und Patienten schützen. Auch in deidentifizierter oder pseudonymisierter Form sind Gesundheitsdaten besonders schützenswert, da mit zusätzlichen Informationen, z. B. bei seltenen Krankheiten oder Studien mit kleinen Teilnehmerzahlen, Rückschlüsse auf einzelne Personen möglich sind.

    Damit aus diesen hochsensiblen Daten KI-Modelle werden können, bedarf es vertrauenswürdiger Forschungsumgebungen (Trusted Research Environment, TRE), die die Einhaltung der DSGVO und anderer datenschutzrechtlicher Vorschriften sowie der Grundsätze guter wissenschaftlicher Praxis gewährleisten. Am 17. Juli eröffnet das DFKI eine solche Forschungsumgebung für die Verarbeitung sensibler personenbezogener Daten zum Training neuronaler Netze. SEMLA - Secure Machine Learning Architecture - ist eine DFKI-interne Forschungsinfrastruktur, die den Anforderungen der DSGVO und anderer gesetzlicher Bestimmungen gerecht wird. Herzstück ist die Umsetzung sogenannter technischer und organisatorischer Maßnahmen (TOMs) für den Datenschutz und die Datensicherheit, deren Berücksichtigung in datensensiblen Forschungsprojekten gefordert wird.

    „SEMLA versetzt uns überhaupt erst in die Lage, mit höchstsensiblen Daten zu arbeiten. Wir werten so zunächst Daten aus Medizinprojekten aus, an denen das DFKI beteiligt ist, und trainieren dann auf diesen Daten neuronale Netze. Dafür besteht intern bereits großer Bedarf. In Zukunft soll SEMLA quelloffen zur Verfügung gestellt werden, damit andere Forschungsinstitute und Marktteilnehmer die SEMLA-Lösung einfach anpassen und nutzen können“, sagt SEMLA-Projektleiter Dr. Jan Alexandersson.

    SEMLA ermöglicht Wissenschaftlern die sichere Forschung mit hochsensiblen personenbezogenen Daten. Im Gegensatz zu Cloud-Lösungen speichert und verarbeitet SEMLA die Daten ausschließlich „on premises“, also am DFKI. SEMLA besteht aus einer Recheninfrastruktur (CPU, GPU, Speicher), die in Kaiserslautern betrieben und geschützt wird, sowie einem biometrisch gesicherten Annotations- und Experimentierlabor in Saarbrücken, dem SEMLAb. Die neue Forschungsinfrastruktur ist so ausgelegt, dass mit Daten der zweithöchsten Sensitivitätsklasse 4 nach dem Klassifikationsschema des Alan Turing Institute geforscht werden kann.

    Künftig sollen Drittparteien auf den von SEMLA gehosteten Datensätzen über das Internet Modelle berechnen können. Hierfür wird auch eine Zertifizierung nach ISO 2700X und TISAX sowie nach EuroPriSe – dem Europäischen Datenschutzgütesiegel (EuroPriSe, 2022) – angestrebt.


    Contact for scientific information:

    Dr.-Ing. Jan Alexandersson
    E-Mail: Jan.Alexandersson@dfki.de
    Tel.: +49 681 85775 5347


    More information:

    https://semla.dfki.de


    Images

    SEMLAB-Sicherheitsschleuse: DFKI CEO Prof. Dr. Antonio Krüger beim Handvenen-Scan
    SEMLAB-Sicherheitsschleuse: DFKI CEO Prof. Dr. Antonio Krüger beim Handvenen-Scan

    DFKI

    Projektleiter Dr. Jan Alexandersson erklärt die SEMLA-Architektur
    Projektleiter Dr. Jan Alexandersson erklärt die SEMLA-Architektur

    DFKI


    Criteria of this press release:
    Business and commerce, Journalists, Scientists and scholars
    Information technology
    transregional, national
    Research results, Transfer of Science or Research
    German


     

    Help

    Search / advanced search of the idw archives
    Combination of search terms

    You can combine search terms with and, or and/or not, e.g. Philo not logy.

    Brackets

    You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).

    Phrases

    Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.

    Selection criteria

    You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).

    If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).