Fraunhofer-Gesellschaft

Publica

Hier finden Sie wissenschaftliche Publikationen aus den Fraunhofer-Instituten.

From communicative context to speech: Integrating dialogue processing, speech production and natural language generation

 
: Teich, E.; Hagen, E.; Grote, B.; Bateman, J.A.

:

Speech Communication 21 (1997), No.1/2, pp.73-99
ISSN: 0167-6393
English
Journal Article
Fraunhofer IPSI; 2007
man-machine system; speech processing; mathematical model; speech communication

Abstract
Der vorliegende Artikel behandelt das Problem der Auswahl von angemessenen Intonationsmusters in Mensch-Maschine Dialogen, wie sie in intelligenten Informationssystemen, beispielsweise für den Zweck des Informationsretrievals, geführt werden. Es wird ein Ansatz vorgestellt, der die bisher weitgehend disjunkten Paradigmen der automatischen Textgenerierung und der Sprachsynthese in einem Mensch-Maschine-Dialogszenarium integriert. Aufbauend auf einer Beschreibung der beiden eigenständig existierenden Basiskomponenten des Systems - einem Dialogmodell für Informationsretrieval (COR) und einem Textgenerierungssystem für das Deutsche (KOMET-PENMAN) - wird eine communicative-context-to-speech-Architektur entwickelt, in der Intonationsmuster flexibel und dem Kontext angemessen selektiert werden können. Es wird argumentiert, daß mit einem solchen Ansatz die bekannten Lücken von text-to-speech-Systemen undconcept-to-speech -Systemen geschlossen werden können.

 

The current article discusses the problem of appropriate intonation selection in Person-Machine dialogues, such as those expected in intelligent information systems when, for example, information retrieval is required. An approach is proposed which integrates the previously mostly separate paradigms of automatic natural language generation and speech synthesis in a Person-Machine dialogue scenario. The article introduces the two independent basis components adopted in the approach - a dialogue model for information retrieval (COR) and a text generation system for German (KOMET-PENMAN) - and develops from these a communicative-context-to-speech system architecture. This system provides for the flexible and context-appropriate selection of intonation patterns. The paper argues that such an approach removes some of the well-known gaps in both text-to-speech and concept-to-speech systems.

: http://publica.fraunhofer.de/documents/970899.html