Fraunhofer-Gesellschaft

Publica

Hier finden Sie wissenschaftliche Publikationen aus den Fraunhofer-Instituten.

Entwicklung eines Multi-Domain Sprachmodells für das Archivsystem des Westdeutschen Rundfunks

 
: Turzynski, Juliane
: Pörschmann, Christoph; Schmidt, Christoph Andreas

:
Volltext urn:nbn:de:0011-n-4561838 (1.4 MByte PDF)
MD5 Fingerprint: 3b970b6361e6ae8b73e00f2b3c08900b
Erstellt am: 19.7.2017


Köln, 2016, 44 S.
Köln, TH, Bachelor Thesis, 2016
Deutsch
Bachelor Thesis, Elektronische Publikation
Fraunhofer IAIS ()
Sprachmodell; Spracherkennung; Audio Mining; Multi-Domain Sprachmodell; SPSA Algorithmus

Abstract
Die vorliegende Arbeit beschäftigt sich mit der Entwicklung eines Multi-Domain Sprachmodells, das die Spracherkennung des vom Fraunhofer Institut für intelligente Analyse und Informationssysteme IAIS entwickelten Audio Mining Systems dahingehend verbessert, dass große Textmengen unabhängig von ihrer Domäne mit einem zufriedenstellenden Ergebnis analysiert werden. Der Fokus liegt dabei auf der Entwicklung und dem Training von Sprachmodellen. Hierzu soll zum einen die Spracherkennung innerhalb einer Domäne verbessert werden. Dies wird dadurch erreicht, dass domänenspezifische Sprachmodelle erzeugt und mit ausreichend großen Textmengen trainiert werden. Zum anderen soll ein Sprachmodell entwickelt werden, welches domänenunabhängig ist. Hierzu werden die domänenabhängigen Sprachmodelle mitein ander vermischt und ausgehend davon, wie stark ein Sprachmodell in die Bewertung eines Textes einfließen soll, mit Gewichten versehen. Wie gut ein Sprachmodell zu einen gegebenen Text passt, lässt sich über die Perplexität ermitteln. Das Ziel des Mischens ist es, die Gewichte so zu wählen, dass die Perplexität möglichst gering gehalten wird. Hierfür wird von dem von Spall entwickelten Optimierungsalgorithmus mit dem Namen Simultaneous Perturbation Stochastic Approximation Gebrauch gemacht. Abschließend wird im Rahmen einer Evaluation gezeigt, dass das im Rahmen dieser Arbeit entwickelte Sprachmodell bessere Ergebnisse in der Perplexität erzielt, als größere und ungemischte Sprachmodelle.

: http://publica.fraunhofer.de/dokumente/N-456183.html