Fraunhofer-Gesellschaft

Publica

Hier finden Sie wissenschaftliche Publikationen aus den Fraunhofer-Instituten.

Zeitliche Alignierung von Audiodaten und Transkripten mit Abweichungen

 
: Turzynski, Juliane
: Pörschmann, Christoph; Schmidt, Christoph Andreas

:
Fulltext urn:nbn:de:0011-n-4741808 (1.3 MByte PDF)
MD5 Fingerprint: b715d4e8c78286c68222c2242519e970
Created on: 30.11.2017


Köln, 2017, 84 pp.
Köln, TH, Master Thesis, 2017
German
Master Thesis, Electronic Publication
Fraunhofer IAIS ()

Abstract
Die folgende Arbeit beschäftigt sich mit der Alignierung von Audiodateien und Transkripten mit Abweichungen. Der Begriff "Abweichung" beschreibt in diesem Zusammenhang, dass der gesprochene Text aus der Audiodatei nicht zwingend die selben Wörter widerspiegeln muss wie es das Transkript tut. Das im Rahmen dieser Arbeit entwickelte System soll es ermöglichen die Stellen im Transkript kenntlich zu machen, die mit dem gesprochenen Text in der Audiodatei übereinstimmen. Die Kenntlichmachung erfolgt dabei mit Hilfe von Zeitmarken, die angeben, wann und wie lange ein Wort in der Audiodatei gesprochen wurde. Für die Ermittlung der Wörter und den dazugehörigen Zeitmarken wird der vom Fraunhofer Institut für intelligente Analyse und Informationssysteme entwickelte Spracherkenner verwendet. Die Zuweisung der Zeitmarken zu den entsprechenden Wörter im Transkript erfolgt durch einen Faktorautomaten. Hierbei handelt es sich um einen speziellen endlichen Automaten, dessen Zustände die Wärter in dem Transkript repräsentieren. Durch die Verwendung eines solchen Automaten für die Alignierung des Transkript, wird der Spracherkenner dazu gezwungen, nur die Wörter zu erkennen, die auch im Transkript vorhanden sind. Eine Evaluation dieses Systems zeigt, dass das im Rahmen dieser Arbeit entwickelte System in Kombination mit dem von Fraunhofer Institut für intelligente Analyse- und Informationssysteme entwickelten Spracherkenner eine Alignierungsgenauigkeit von 91% erzielt.

: http://publica.fraunhofer.de/documents/N-474180.html