Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

7. IVR SS-07 1 Günter-Ulrich Tolkiehn, TFH Wildau Alle Rechte vorbehalten: Prof. Dr. Günter-Ulrich Tolkiehn TFH Wildau Sprachtechnologie.

Ähnliche Präsentationen


Präsentation zum Thema: "7. IVR SS-07 1 Günter-Ulrich Tolkiehn, TFH Wildau Alle Rechte vorbehalten: Prof. Dr. Günter-Ulrich Tolkiehn TFH Wildau Sprachtechnologie."—  Präsentation transkript:

1 7. IVR SS-07 1 Günter-Ulrich Tolkiehn, TFH Wildau Alle Rechte vorbehalten: Prof. Dr. Günter-Ulrich Tolkiehn TFH Wildau tolkiehn@tfh-wildau.de Sprachtechnologie Weiterführende Literatur (keine Kaufempfehlung): Detlev Artelt (Hrsg.) “Voice Compass”, 2007 7 IVR

2 7. IVR SS-07 2 Günter-Ulrich Tolkiehn, TFH Wildau Kleine Taxonomie der Sprachtechnologie Sprachaufnahme Sprache  Sprachdaten (Mikrofon, ADC, Codec) Sprachübermittlung (PBX, PSTN/ISDN, LAN, Internet) Sprachdaten  Übertragung  Sprachdaten Sprachspeicherung Sprachdaten  Speichersystem/-medium  Sprachdaten Sprachanalyse Sprache  Text  Daten (Spracherkennung, Sprechererkennung, Sprecherverifikation) Geräusche  Daten (DTMF-, Pausen-Erkenner, grunt-detection, AB-, Besetzt-Erkenner, noise-reduction) Spracherzeugung Daten  Text  Sprachdaten (sprechende Systeme, TTS, Reading) Sprachausgabe Sprachdaten  Sprache (Codec, DAC, Lautsprecher)

3 7. IVR SS-07 3 Günter-Ulrich Tolkiehn, TFH Wildau Sprachaufnehmende und -ausgebende Systeme „der“ Telefon-Standard: Telefonqualität (digital: ITU G.711, 300 Hz –3,4 kHz) Endgerät „knochenförmig“, schnurgebunden oder schnurlos Zifferntastatur 0-9, *, #, plus mehr oder weniger verständliche Funktionstasten, meist kleines alphanumerisches Display, andere Bauformen sind möglich (Headset, Speakerphone, Soundkarte), jedoch bisher nur in Nischen verbreitet Umwandlung von Sprache in Sprachdaten und umgekehrt besondere Qualitäten: Höhere Bandbreiten, zusätzliches Video, Außenmikrophone...

4 7. IVR SS-07 4 Günter-Ulrich Tolkiehn, TFH Wildau Sprachübermittelnde Systeme (i.d.R. duplex!) ADCDEEDÜEDEEDAC Netz DÜE a/b, ISDN, GSM, VoIP,... Sprachaufnehmendes System Sprachausgabe- System E/A-Elemente und UI E/A-Elemente und UI Anforderungen: - Interoperabilität - Einfache und effiziente Bedienung - Akzeptable Sprachqualität (ITU G.114) - Zuverlässigkeit - Niedrige Gesamtkosten (TCO) - Integration in DV-Infrastruktur

5 7. IVR SS-07 5 Günter-Ulrich Tolkiehn, TFH Wildau Sprachspeicher und Verwendung ADCDEEDÜEDEEDAC Netz DÜE Sprachspeicher Sprachspeicher speichern Sprachdaten. Verwendung u.a in: - Voice-Logging-Systemen (teilnehmerseitig, analog und digital, duplex) - Voice-Logging-Systemen im Netz - Voice-Message-Systemen im Netz - Voice-Message-Systemen auf der Teilnehmerseite - Anrufbeantwortern (analog und digital, beim B-Teilnehmer) - Benachrichtigungssystemen (outbound) - Ansagesystemen und IVR-Systemen E/A-Elemente und UI E/A-Elemente und UI

6 7. IVR SS-07 6 Günter-Ulrich Tolkiehn, TFH Wildau Sprachspeicher Anforderungen an Sprachspeichersysteme im Call Center unterscheiden sich von Systemen für persönliche voice-mail: Sprachnachrichten sollen gruppenorientiert abgelegt werden Sprachnachrichten sollen über die ACD gruppenorientiert wieder abgespielt und bearbeitet werden die Auslegung der Systeme erfolgt für bestimmte planbare Überlastsituationen (Anzahl Ports ~ Anzahl Seats) Betrieb i.w. alternierend (entweder Aufnahme oder Wiedergabe) Einspielung qualitativ hochwertigen Ansagen erforderlich

7 7. IVR SS-07 7 Günter-Ulrich Tolkiehn, TFH Wildau PSTN, ISDN CN Sprachspeichersystem App- Server Call Center n n LAN m (~ n) Sprachspeicher, Anbindung

8 7. IVR SS-07 8 Günter-Ulrich Tolkiehn, TFH Wildau Sprachspeicher für DRTV Besondere Anforderungen sind im DRTV-Einsatz durch den extrem scharfen Angebotspeak gegeben: viele Ports (i.d.R. mehr VM-ports als seats) extrem kurze und dennoch präzise Ansagen möglichst kurze Gesprächszeiten bei der Aufnahme möglichst effiziente Abarbeitung über ACD möglichst effiziente Abarbeitung der Rückruflast über outbound-System

9 7. IVR SS-07 9 Günter-Ulrich Tolkiehn, TFH Wildau Sprachanalysierende Systeme Sprache  Text  Daten Spracherkennung Diktiersysteme: Sprache  Text, großer Wortschatz, sprecherabhängig (Training erforderlich), großer Ressourcenverbrauch, hohe Fehlerrate Sprach-Bedienung von Dialog-Systemen und Geräten (heute wortweise: Sprache  Text  Daten oder Sprache  einfache Grammatik  Daten, meist sprecherunabhängig, mittlerer Wortschatz, einstellbare Fehlerrate, zur Laufzeit ladbar, wordspotting und barge-in, nahezu „natural language understanding“. Akzeptiert Störgeräusche und schlechte Tonqualität. Gute Systeme bis 30 Kanäle schon ab ca. 10 T€einfache Grammatik Sprach-Authentifizierung Sprecherverifikation: Sicher in Größenordnung eins aus einige 1000 Sprechererkennung: Ebenfalls in Größenordnung 1 aus 1000 möglich Geräuschanalyse  Daten Pausen-Erkenner zur Datenkompression grunt-detection, AB-Erkennung, Besetzt-Erkenner noise- und distortion-Analyse und -Reduktion DTMF-Erkennung für Dialogsysteme mit Sprachausgabe

10 7. IVR SS-07 10 Günter-Ulrich Tolkiehn, TFH Wildau Einfaches Beispiel für eine Grammatik Quelle: Philips (www.speech.philips.com

11 7. IVR SS-07 11 Günter-Ulrich Tolkiehn, TFH Wildau Spracherzeugende Systeme (TTS) Umwandlung von Textdaten oder anderen nicht- Sprachdaten in Sprachdaten Anwendungen: Reading (TTS, Vorlesen von gespeichertem Fließtext) Ansagen von generiertem Text (Uhrzeit, Börsenkurse, Dialog etc.) Funktionen: ggf. Textgenerierung (Komponente von NL-Dialogsystemen, erfordert semantische und grammatische Synthese) Umwandlung von Text in Phonem-Fluss, heute mit Betonung und Tonhöhenverlauf (erfordert nur einfache Grammatikevaluation) Umwandlung des Phonemflusses in Sprachdaten

12 7. IVR SS-07 12 Günter-Ulrich Tolkiehn, TFH Wildau text-to-speech (TTS) Ein wichtiges Element zur Rationaliserung Für Sprachausgabe von häufig wechselnden Inhalten Wesentliches Element: der Wortschatz (Corpus) und Funktionen zur einfachen Erweiterung (mehrere 10k Worte) Umwandlung Text in Phoneme (sprachabhängig) Ausgabe der Phoneme mit Variation von Tonhöhe Zeitverlauf und Lautstärke (Prosody) Schwierigkeiten: Fremdsprachige Worte, Homographen, Zahlenangaben

13 7. IVR SS-07 13 Günter-Ulrich Tolkiehn, TFH Wildau Komplexe integrierte Systeme Quelle: Philips (www.speech.philips.com)

14 7. IVR SS-07 14 Günter-Ulrich Tolkiehn, TFH Wildau Komplexe integrierte Systeme „Alte Technik“: IVR-Systeme (Interactive Voice Response oder VRU), auto attendant, UM: nur DTMF-Erkennung und Konservenausgabe, Sprachspeicher, spezielle Transaktionen „Neue Technik“: Voice-portals ASR:Word-spotting, barge-in, Grammatik, Sprachmodelle? Welcher Erkenner? Gutes Wörterbuch mit effizienter Erweiterungsfunktion? Welche Sprachen? Wieviel simultane Kanäle? Sprachausgabe aus Konserven? TTS? DTS? Welches? Guter Dialoggenerator? Änderungen der Dialoge während der Laufzeit möglich? Interoperabilität mit TK-Anlage? ISDN? CTI (z.B. Vermittlung, Bedienung VM-System, e-Mail-Abruf)? Datenschnittstelle für Anschluss an Transaktionssysteme und Webserver Voice-Message-Funktion CC-und CRM-Integration?

15 7. IVR SS-07 15 Günter-Ulrich Tolkiehn, TFH Wildau IVR Interactive Voice Response, auch VRU Zum Begriff: Im angelsächsischen sind mit IVR meist Systeme mit reiner DTMF-Ton-Steuerung gemeint, in Europa auch Systeme mit Spracherkennern Verschiedene Einsatzbereiche sind möglich: Vorabinformation und Vorqualifikation von eingehenden Rufen im CC mit live-agents vollautomatischer Dialog (self-service) für Auskunfts-, Konferenz- und Transaktionssysteme (meist noch mit einigen live-agents im Hintergrund für schwierige Kunden) vollautomatischer Dialog mit Vermittlungs, Textausgabe- und Speicherfunktionen (auto-attendant)

16 7. IVR SS-07 16 Günter-Ulrich Tolkiehn, TFH Wildau IVR, Funktionen, Akzeptanzprobleme IVR-Anwendungen mit DTMF kamen in Europa anfangs nicht so gut an, u.a. mangels DTMF-Fähigkeit der Endgeräte IVR-Anwendungen mit Spracherkennung, die praktisch nur DTMF-Eingabe aufsprechen lassen (Einzelworterkennung für Ziffern und ja/nein), hatten auch bei sicherer Erkennung hier ebenfalls keine gute Akzeptanz (ältere Telebanking-Systeme) Voraussetzungen für Akzeptanz scheinen zu sein: Erkenner mit ladbarem und verhältnismäßig großem und dynamischem Wortschatz word-spotting und barge-in ergonomisch gute Dialoge, beschränkte Gesprächsthemen Beispiel: Buchungssystem der DB, Tel. 01805-996622

17 7. IVR SS-07 17 Günter-Ulrich Tolkiehn, TFH Wildau PSTN, ISDN CN IVR-System App- Server Call Center n n LAN m (~ n) IVR im Call Center, Anbindung

18 7. IVR SS-07 18 Günter-Ulrich Tolkiehn, TFH Wildau IVR, Spracherkenner,Leistung IVR-Systeme, Systeme für Wartefelder und voice- message-Systeme haben funktionale Ähnlichkeiten. Es besteht manchmal Verwechselungsgefahr Wesentlich für ein IVR-System sind immer die Komponenten: die DTMF-Erkennung und/oder sprecherunabhängige Spracherkennung (sollte kontextabhängig ladbaren Wortschatz haben) die Komponente zur Wortschatzgenerierung die Sprachausgabekomponente (Konserven und/oder TTS) die Komponente zur Dialoggestaltung (grafisch, mit Templates) eine Schnittstelle zur Mitteilung der aus dem Dialog entnommenen Information an CTI-Server, ACD und eventuelle Back-office Systeme eine andere wesentliche Frage ist, wieviel simultane Kanäle das System tatsächlich verarbeiten kann. Bei Word-spotting und barge-in ist der Erkenner permanent scharf, bei single-word Betrieb nur ca. 20% der Zeit.

19 7. IVR SS-07 19 Günter-Ulrich Tolkiehn, TFH Wildau Voice Portale in den letzten Jahren hat sich für Sprachdialogsysteme die Bezeichnung Voice Portal eingebürgert in der Dialoggestaltung versucht man heute, eine Persona mit der Illusion emotionaler Nähe und Wiedererkennungswert für das System zu designen.

20 7. IVR SS-07 20 Günter-Ulrich Tolkiehn, TFH Wildau Wo stehen wir heute? Quelle: GartnerGroup „The Implications of the 2001 CRM Hype Cycle“ vom 3. 4. 2001

21 7. IVR SS-07 21 Günter-Ulrich Tolkiehn, TFH Wildau Hersteller von Spracherkennern Einige führende Entwickler von sprecherunabhängigen Spracherkennern der 90er: DASA (neuer Firmenname des Bereichs: Temic)Temic Dragon Systems (verkauft) IBM Lernout & Hauspie (out of business)Lernout & Hauspie Nuance Systems Philips (verkauft)Philips Scansoft (verkauft) VCS (verkauft) einige innovative KMUs, auch aus dem Hochschulbereich 2007 sind fast alle genannten Erkenner in der Hand von Nuance Systems


Herunterladen ppt "7. IVR SS-07 1 Günter-Ulrich Tolkiehn, TFH Wildau Alle Rechte vorbehalten: Prof. Dr. Günter-Ulrich Tolkiehn TFH Wildau Sprachtechnologie."

Ähnliche Präsentationen


Google-Anzeigen