Fraunhofer-Gesellschaft

Publica

Hier finden Sie wissenschaftliche Publikationen aus den Fraunhofer-Instituten.

Hören mit zwei Ohren - Modellierung und Verbesserung von Sprachverständlichkeit

 
: Rennies-Hochmuth, Jan

Vorländer, M. ; Deutsche Gesellschaft für Akustik -DEGA-, Berlin:
Fortschritte der Akustik. DAGA 2016. DVD-ROM : Aachen : 14.-17. März 2016 : 42. Jahrestagung für Akustik
Berlin: DEGA, 2016
ISBN: 978-3-939296-10-2
ISBN: 3-939296-10-4
S.15-19
Jahrestagung für Akustik (DAGA) <42, 2016, Aachen>
Deutsch
Konferenzbeitrag
Fraunhofer IDMT ()

Abstract
Es ist ein erstaunliches Phänomen, wie gut das gesunde Gehör in der Lage ist, unterschiedliche Schallquellen auch in schwierigen akustischen Bedingungen zu trennen und so beispielsweise einem bestimmten Sprecher in Anwesenheit mehrerer Störschallquellen zu folgen. Diesen „Cocktail-Party-Effekt“ verdankt das Gehör einer hochwirksamen Verarbeitung von interauralen Pegel- und Phasenunterschieden der einzelnen Signale. Dieser Beitrag stellt effektive Modellansätze binauraler auditorischer Sprachverarbeitung vor, wobei besonders Hörsituationen beleuchtet werden, in denen die auditorische Quellentrennung durch Echos, Nachhall oder Hörminderung erschwert wird. Anschließend werden anhand mehrerer Anwendungsbeispiele die praktischen Einsatzmöglichkeiten binauraler Modelle veranschaulicht, etwa bei der Sprachkommunikation im Fahrzeuginnenraum oder mit Stereokommunikationssystemen. Im zweiten Teil des Beitrags wird vorgestellt, wie durch den Einsatz von Sprachverständlichkeitsmodellen Algorithmen zur Sprachverbesserung automatisch gesteuert werden können. Je nach Anwendungsfall müssen die Modelle hierfür nicht immer notwendigerweise über komplexe binaurale Verarbeitungsstufen verfügen, sondern bereits einfachere Modellansätze können ausreichen, um eine effektive Verbesserung der Sprachverständlichkeit in Echtzeit an eine gegebene Umgebungsakustik anzupassen. Dadurch ist es möglich, das Sprachsignal nur dann zu modifizieren, wenn es nach Modellvorhersage zu schlecht verständlich ist, und damit auch bei variablen Hintergrundgeräuschen einen guten Kompromiss zwischen Natürlichkeit und Verständlichkeit herzustellen. Anwendungsbeispiele für dieses sogenannte „near-end listening enhancement“ sind Durchsagesysteme an Bahnhöfen oder Flughäfen, In-Car-Kommunikation oder Mobiltelefonie.

: http://publica.fraunhofer.de/dokumente/N-402261.html