Options
2016
Bachelor Thesis
Titel
Entwicklung eines Multi-Domain Sprachmodells für das Archivsystem des Westdeutschen Rundfunks
Abstract
Die vorliegende Arbeit beschäftigt sich mit der Entwicklung eines Multi-Domain Sprachmodells, das die Spracherkennung des vom Fraunhofer Institut für intelligente Analyse und Informationssysteme IAIS entwickelten Audio Mining Systems dahingehend verbessert, dass große Textmengen unabhängig von ihrer Domäne mit einem zufriedenstellenden Ergebnis analysiert werden. Der Fokus liegt dabei auf der Entwicklung und dem Training von Sprachmodellen. Hierzu soll zum einen die Spracherkennung innerhalb einer Domäne verbessert werden. Dies wird dadurch erreicht, dass domänenspezifische Sprachmodelle erzeugt und mit ausreichend großen Textmengen trainiert werden. Zum anderen soll ein Sprachmodell entwickelt werden, welches domänenunabhängig ist. Hierzu werden die domänenabhängigen Sprachmodelle mitein ander vermischt und ausgehend davon, wie stark ein Sprachmodell in die Bewertung eines Textes einfließen soll, mit Gewichten versehen. Wie gut ein Sprachmodell zu einen gegebenen Text passt, lässt sich über die Perplexität ermitteln. Das Ziel des Mischens ist es, die Gewichte so zu wählen, dass die Perplexität möglichst gering gehalten wird. Hierfür wird von dem von Spall entwickelten Optimierungsalgorithmus mit dem Namen Simultaneous Perturbation Stochastic Approximation Gebrauch gemacht. Abschließend wird im Rahmen einer Evaluation gezeigt, dass das im Rahmen dieser Arbeit entwickelte Sprachmodell bessere Ergebnisse in der Perplexität erzielt, als größere und ungemischte Sprachmodelle.
ThesisNote
Köln, TH, Bachelor Thesis, 2016
Beteiligt
Verlagsort
Köln