idw - Informationsdienst
Wissenschaft
»Speech Intelligibility Meter« in internationale Broadcast-Produktionslösung integriert
In Film-, Fernseh-, Streaming- oder Live-Produktionen ist die Gewährleistung guter Sprachverständlichkeit eine der größten Herausforderungen von professionellen Tonschaffenden. Algorithmen des Fraunhofer IDMT in Oldenburg geben Handlungsempfehlungen durch eine objektive Bewertung der Höranstrengung in Echtzeit. In enger Zusammenarbeit und nach langjähriger Forschungskooperation integrierte RTW die Technologien nun in seine hardwarebasierte Audiomessplattform.
Oldenburg, 22. Oktober 2025. Unklare Dialoge in einer Fernsehserie, zu laute Hintergrundmusik im Reality TV oder ein durch Zuschauerjubel überlagertes Sport-Interview können das Medienerlebnis von Zuschauenden schmälern. Zur Überprüfung von Pegeln und Lautstärke kommen technische Messgeräte während der Produktion von Medien zum Einsatz. Eine objektive Messung der Verständlichkeit von Sprache muss sich erst noch etablieren. Sie würde Arbeitsprozesse erleichtern, denn Tonschaffende hören Audiomischungen so oft, dass Gewöhnungseffekte leicht zu einer Fehleinschätzung der Verständlichkeit führen können.
Der Oldenburger Institutsteil Hör-, Sprach- und Audiotechnologie HSA des Fraunhofer IDMT hat in den vergangenen Jahren Technologien für eine objektive Bewertungsgrundlage von Sprachverständlichkeit entwickelt.
»Speech Intelligibility Meter« für Profi-Hardware
Im September präsentierte das Unternehmen RTW das »Speech Intelligibility Meter« auf der International Broadcast Convention IBC in Amsterdam und dessen Integration in das hardwarebasierte Messgerät TMxCore als optionale Software. Produktionsprofis aus den Bereichen Rundfunk, Fernsehen und Streaming sollen mit diesem Werkzeug sicherstellen können, dass Dialoge objektiv bewertet werden und gleichbleibend klar für das Publikum verständlich sind. »Unsere Zukunftsvision ist es, gemeinsam mit anderen Branchenakteuren, wie dem Fraunhofer IDMT, internationale Empfehlungen zur Messung und Wahrung von Sprachverständlichkeit in Medienproduktionen zu formulieren. Das Speech Intelligibility Meter kann als Ausgangspunkt für diese Bemühungen dienen«, sagt Thomas Valter, Director of Product Management & Marketing bei RTW.
Kooperation als Fundament für besonders robuste Technologien
Die vertrauensvolle Kooperation des Fraunhofer IDMT mit RTW begann bereits vor neun Jahren. In den Projekten »SI4B« (Speech Intelligibility for Broadcasting)1 und »SITA« (Speech Intelligibility Transformation & Autocorrection)2 verfolgte man gemeinsam das Ziel, Sprache im Broadcast-Bereich besser verständlich zu machen. Die Partner fokussierten insbesondere die Entwicklung und Evaluation von Algorithmen zur automatischen Bewertung und Korrektur von Sprachverständlichkeit.
»Durch die Zusammenarbeit in Forschungsprojekten haben wir bereits frühzeitig tiefe Einblicke in die Produktion von Medien im Broadcastbereich erhalten. Dadurch konnten wir in den letzten Jahren an Technologien arbeiten, die nicht nur die Bedürfnisse der Zuschauenden berücksichtigen, sondern auch die konkreten Herausforderungen von Tonschaffenden adressieren«, erklärt Prof. Dr. Jan Rennies-Hochmuth, Gruppenleiter Persönliche Hörsysteme am Fraunhofer IDMT.
KI misst die Höranstrengung in Echtzeit
Im Rahmen der Entwicklung arbeiteten die Forschenden mit Branchenexperten zusammen. Die Sprachverständlichkeitsmessung wurde bereits in die Postproduktionssoftware Nuendo von Steinberg Media Technologies integriert sowie als Plug-in von NUGEN Audio realisiert. Technisch basiert die Messung auf einer Kombination aus automatischer Spracherkennung und psychoakustischer Modellierung, und hat in den letzten Jahren viele Evaluationstests durchlaufen. Über die einfache Messung der Sprachverständlichkeit sind noch weitere Funktionalitäten denkbar, wie zum Beispiel das automatische Markieren kritischer Bereiche direkt in der Timeline oder eine automatisierte Verbesserung der Sprachverständlichkeit.
1 Das Projekt »SI4B« (Speech Intelligibility for Broadcasting) wurde gefördert durch das Bundesministerium für Wirtschaft und Technologie (BMWi), heute Bundesministerium für Wirtschaft und Energie (BMWE).
2 Das Projekt »SITA« (Speech Intelligibility Transformation & Autocorrection) wurde gefördert durch das Bundesministerium für Bildung und Forschung (BMBF), heute Bundesministerium für Forschung, Technologie und Raumfahrt (BMFTR).
Hör-, Sprach- und Audiotechnologie HSA am Fraunhofer-Institut für Digitale Medientechnologie IDMT in Oldenburg
Der im Jahre 2008 unter der Leitung von Prof. Dr. Dr. Birger Kollmeier und Dr. Jens-E. Appell gegründete Institutsteil Hör-, Sprach- und Audiotechnologie HSA des Fraunhofer-Instituts für Digitale Medientechnologie IDMT steht für marktnahe Forschung und Entwicklung mit Schwerpunkten auf
- Sprach- und Ereigniserkennung
- Klangqualität und Sprachverständlichkeit sowie
- Mobile Neurotechnologie und Systeme für eine vernetzte Gesundheitsversorgung.
Mit eigener Kompetenz in der Entwicklung von Hard- und Softwaresystemen für Audiosystemtechnologie und Signalverbesserung setzen die Mitarbeitenden am Standort Oldenburg wissenschaftliche Erkenntnisse in kundengerechte, praxisnahe Lösungen um.
Über wissenschaftliche Kooperationen ist der Institutsteil eng mit der Carl von Ossietzky Universität, der Jade Hochschule und der Hochschule Emden/Leer verbunden. Das Fraunhofer IDMT ist Partner im Exzellenzcluster »Hearing4all« und im Sonderforschungsbereich »Hörakustik«.
Weitere Informationen auf www.idmt.fraunhofer.de/hsa
Kontakt für die Medien:
Christian Colmer
Leiter Marketing und Kommunikation
Fraunhofer-Institut für Digitale Medientechnologie IDMT
Institutsteil Hör-, Sprach- und Audiotechnologie HSA
Marie-Curie-Str. 2
26129 Oldenburg
Telefon +49 441 80097-312 | christian.colmer@idmt.fraunhofer.de
http://www.idmt.fraunhofer.de/hsa
http://www.idmt.fraunhofer.de/hsa
Im sogenannten »SI Chart« in TMxCore von RTW zeigen rote Markierungen kritische Stellen bezüglich de ...
Quelle: RTW
Copyright: RTW
Das »Speech Intelligibility Meter« mit Algorithmen des Fraunhofer IDMT in Oldenburg ist die neuste E ...
Quelle: RTW
Copyright: RTW
Merkmale dieser Pressemitteilung:
Journalisten, Wirtschaftsvertreter, jedermann
Elektrotechnik, Informationstechnik, Kulturwissenschaften, Medien- und Kommunikationswissenschaften, Psychologie
überregional
Forschungs- / Wissenstransfer, Forschungsergebnisse
Deutsch
Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.
Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).
Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.
Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).
Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).