Dialogsysteme mit VXML 27.4. Einführung 4.5. VoiceXML 11.5. Elmar Nöth (Uni Erlangen) 18.5. Spracherkennung 25.5. Sprachsynthese 1.6. Dialogmanagment 8.6. Dialogdesign (Human Factors) 15.6. System-Evaluierung 22.6. Übungen VoiceXML 20.7. Planung Prototyp 24.7. – 27.7.(?) Blockseminar Prototyp Entwicklung Institut für Maschinelle Sprachverarbeitung Universität Stuttgart
Dialogsystem? Kommunikationspartner Auskunftssystem Stimminterface Stimmportal Anwendung für Sprachtechnologie Möglichkeit (mehr) Service zu bieten ...? Beispiele...!
Entwicklung eines SDS Implementation Recording of database Training of recognition Dialog implementation System integration Analysis Domain Analysis Task Analysis Wizard of Oz Design Domain Model System Design Dialog Model
Iteratives oder zyklisches Design Service Provider Dialogentwickler Endkunden
Intentional Structure Elemente eines SDS System performance Cooperativity Intitiative Influencing user behaviour Performance Speech Input Acoustic models Grammar Prosody Speech Output Recorded Prompts Speech Synthesis Prosody Speech User Utterances Lexicon Grammar Semantics Style System Utterances Lexicon Grammar Semantics Style Language Attentional State Focus Expectations Intentional Structure Task Communication Types (domain/meta) Interaction Level Linguistic Structure Speech acts Reference Discourse segments Control Interaction History Linguistic Task Performance Domain Model Data Rules User Model Goals Beliefs Preferences User group Cognition Context
Grundsätzliche Konzepte Zentrales Ziel eines SDS ist es, die interaktive Aufgabe effizient und ergonomisch zu lösen Task-oriented SDS: Lösen einer oder mehrer bestimmter Aufgaben innerhalb eines Dialogs mit dem Benutzer Conversational SDS: Führen einer intelligenten Konversation mit dem Benutzer (turing test)
Dialogmanagement Primäres Ziel ist es, die domänen-spezifische Kommunikation auf das Ziel hin voranzutreiben Kontrolle der Interaktion, um vom Benutzer die notwendigen Informationen zu bekommen und somit die gewünschte Information/Funktionalität zu vermitteln Idealerweise: freier Dialog mit Nachfragen
Task complexity Informationsumfang Aufgabenstruktur (ill-structured vs. well-structured) Dialogführung Kontrollmöglichkeiten: Benutzereingabe kontrollieren Dialoginitiative Vorhersage der Benutzereingabe Identifikation einer Unteraufgabe Feedback
Benutzereingabe kontrollieren Aufklärung über Möglichkeiten des Systems Angabe wie das System angesprochen werden kann Feedback über Verstandenes Processing feedback Kontolle der Ausgabe Geschlossene, fokussierte Fagen: Systeminitiative Offene unfokussierte Fragen: Benutzerinitiative
Dialoginitiative system-directed Ansatz mixed-initiative Ansatz Systeminitiative sicher mixed-initiative Ansatz statt Antworten können Fragen kommen user-directed Ansatz ill-structured tasks
VoiceXML Beispiel 1 <? xml version=" 1. 0"?> <vxml version=" 1. 0"> <menu> <prompt> Would you like <enumerate/></ prompt> <choice next=" http://& coffee. vxml"> coffee </ choice> <choice next=" http://& tea. vxml"> tea </ choice> <choice next=" http://& milk. vxml"> milk </ choice> <choice next=" http://& nothing. vxml"> nothing </ choice> <nomatch> I didn't understand what you said.</ nomatch> <noinput> You must say something.</ noinput> </ menu> </ vxml>
VoiceXML Beispiel 2 <? xml version=" 1. 0"?> <vxml version=" 1. 0"> <form> <field name=" drink"> <prompt> Would you like coffee, tea, milk, or nothing? </ prompt> <option value=" coffee"> coffee </ option> <option value=" tea"> tea </ option> <option value=" milk"> milk </ option> <option value=" nothing"> nothing </ option> </ field> <block> <submit next="http:// www. drinks. example/ drink2.asp“ namelist="drink"/> </ block> </ form> </ vxml>
Seminarvoraussetzungen Teilnahme an Seminar und Blockseminar Referat evtl. Programmieraufgabe
Referate VXML Spracherkennung Sprachsynthese Dialogmanagment Dialogdesign Evaluierung + Testen von existierenden Systemen