idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Grafik: idw-Logo

idw - Informationsdienst
Wissenschaft

Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instance:
Share on: 
07/19/2022 15:10

Französische Forschung als Motor für ein neues KI-Modell

Marie de Chalup Wissenschaftliche Abteilung
Wissenschaftliche Abteilung, Französische Botschaft in der Bundesrepublik Deutschland

    Trainiert vom Jean-Zay-Supercomputer und unter Beteiligung zahlreicher CNRS-Forscher wurde gerade das größte je geschaffene multilinguale und Open-Science-Sprachmodell fertiggestellt.

    Künstliche Intelligenz betrifft heute viele verschiedene Bereiche. Dazu gehört auch die Textproduktion, die auf Sprachmodellen basiert, die ständig verbessert werden. Das Hauptinteresse dieser Modelle liegt in ihrer Fähigkeit, Wortsequenzen auf Grundlage der vorhergehenden Wörter korrekt vorherzusagen. Das Modell baut subtile Darstellungen von Sätzen und Wörtern auf, die es ihm dann ermöglichen, deren lexikalische Merkmale zu erfassen, auch wenn es die Sprache nicht im engeren Sinne versteht. Diese lexikalischen Repräsentationen werden als „word embeddings“ bezeichnet.

    Viele der heute verfügbaren Sprachmodelle weisen jedoch Barrieren auf: Sie sind kompliziert zu untersuchen und die Unternehmen, die sie geschaffen haben, sind nicht vollständig transparent über ihre Gestaltung und Funktionsweise, da diese Tech-Giganten (Google, Microsoft) ihre Kommunikationsgeheimnisse nicht preisgeben. Ein weiteres Problem ist die massive Verwendung des Englischen zulasten anderer Sprachen. Hugging Face, ein von Franzosen in New York gegründetes Start-up-Unternehmen, das eine der weltweit führenden Plattformen für maschinelles Lernen anbietet, hat daher im Sommer 2021 das Projekt BigScience gestartet. Es zielt darauf ab, nach dem Modell der offenen und partizipativen Wissenschaft das größte mehrsprachige und Open-Source-Sprachmodell zu trainieren: Bloom.

    Von dem Projekt begeistert, schlossen sich zahlreiche Partner dem Abenteuer an, bis schließlich rund tausend Forscher aus zweiundsiebzig Ländern beteiligt waren. Sie kommen sowohl aus der akademischen Welt als auch aus Unternehmen wie Airbus, Meta AI, Orange Labs, Mozilla oder Ubisoft. Dank der Unterstützung des CNRS, von GENCI und vom IDRIS konnte ein entscheidender Schritt getan werden: Es wurde eine Maschine gefunden, die Bloom trainieren kann. Das CNRS stattete das Projekt mit einer Zuwendung in Form von 5 Millionen Rechenstunden auf dem Jean-Zay-Supercomputer aus, einem der leistungsstärksten in Europa. BigScience und sein Modell Bloom wären ohne die Leistung von Jean Zay nicht möglich gewesen.

    BigScience wurde auch vom französischen Staat im Rahmen der nationalen Strategie für KI unterstützt. Das Projekt schafft auch technologische Möglichkeiten für die französische Sprache, die Wirtschaft und den Innovationsmarkt.

    Mithilfe dieser verschiedenen Arten der Unterstützung konnte BigScience den Lernprozess von Bloom durchführen. Das Modell nimmt einen Text oder einen Satz auf und behält nur das erste Wort, dann versucht ea, das zweite, dann das dritte usw. zu erraten. Es verfeinert seine Wahrscheinlichkeiten und Statistiken so lange, bis es das erwartete Niveau erreicht hat. Damit dies gelingt, muss Bloom den Vorgang jedoch für eine Textmenge wiederholen, die mehreren Millionen Büchern entspricht. Das erfordert so viele Versuche, dass nur Supercomputer dies in einer angemessenen Zeit schaffen können. Jean Zay trainierte Bloom auf diese Weise vier Monate lang, wobei er dank 400 parallel arbeitender, hochmoderner Grafikprozessoren ein Viertel seiner Gesamtleistung aufbrachte. Während seines Lernprozesses erlangte Bloom die Fähigkeit, 176 Milliarden Parameter in Texten zu verwalten, und arbeitete mit 46 Sprachen gleichzeitig, verteilt auf so unterschiedliche Quellen wie Literatur oder Sportmeldungen.

    Später können Interessierte das Modell von Bloom nutzen und abwandeln, um verschiedene KIs zu erstellen. Diese kostenlose Möglichkeit erfordert lediglich eine Vereinbarung über die Art der Lizenz des endgültigen Tools, die eine verantwortungsvolle Nutzung gewährleistet. Schließlich wird es möglich sein, Artefakte aus dem Training zu gewinnen, um reproduzierbare Experimente durchzuführen und so die Forschung an diesen Modellen voranzutreiben, was nur durch einen freien und offenen Zugang zu diesen Schritten möglich ist.


    Contact for scientific information:

    CNRS


    Original publication:

    https://www.wissenschaft-frankreich.de/ingenieurswissenschaften/franzoesische-fo...


    Images

    Criteria of this press release:
    all interested persons
    Information technology
    transregional, national
    Cooperation agreements, Research projects
    German


     

    Help

    Search / advanced search of the idw archives
    Combination of search terms

    You can combine search terms with and, or and/or not, e.g. Philo not logy.

    Brackets

    You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).

    Phrases

    Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.

    Selection criteria

    You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).

    If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).