Entwicklung eines Multi-Domain Sprachmodells für das Archivsystem des Westdeutschen Rundfunks

Turzynski, Juliane

doi:10.24406/publica-fhg-281612

2016

Bachelor Thesis

Abstract

Die vorliegende Arbeit beschäftigt sich mit der Entwicklung eines Multi-Domain Sprachmodells, das die Spracherkennung des vom Fraunhofer Institut für intelligente Analyse und Informationssysteme IAIS entwickelten Audio Mining Systems dahingehend verbessert, dass große Textmengen unabhängig von ihrer Domäne mit einem zufriedenstellenden Ergebnis analysiert werden. Der Fokus liegt dabei auf der Entwicklung und dem Training von Sprachmodellen. Hierzu soll zum einen die Spracherkennung innerhalb einer Domäne verbessert werden. Dies wird dadurch erreicht, dass domänenspezifische Sprachmodelle erzeugt und mit ausreichend großen Textmengen trainiert werden. Zum anderen soll ein Sprachmodell entwickelt werden, welches domänenunabhängig ist. Hierzu werden die domänenabhängigen Sprachmodelle mitein ander vermischt und ausgehend davon, wie stark ein Sprachmodell in die Bewertung eines Textes einfließen soll, mit Gewichten versehen. Wie gut ein Sprachmodell zu einen gegebenen Text passt, lässt sich über die Perplexität ermitteln. Das Ziel des Mischens ist es, die Gewichte so zu wählen, dass die Perplexität möglichst gering gehalten wird. Hierfür wird von dem von Spall entwickelten Optimierungsalgorithmus mit dem Namen Simultaneous Perturbation Stochastic Approximation Gebrauch gemacht. Abschließend wird im Rahmen einer Evaluation gezeigt, dass das im Rahmen dieser Arbeit entwickelte Sprachmodell bessere Ergebnisse in der Perplexität erzielt, als größere und ungemischte Sprachmodelle.

Thesis Note

Köln, TH, Bachelor Thesis, 2016

Author(s)

Turzynski, Juliane

Person Involved

Pörschmann, Christoph

TH Köln

Schmidt, Christoph Andreas

Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS

Publishing Place

Köln

Options

Entwicklung eines Multi-Domain Sprachmodells für das Archivsystem des Westdeutschen Rundfunks