7. IVR SS-07 1 Günter-Ulrich Tolkiehn, TFH Wildau Alle Rechte vorbehalten: Prof. Dr. Günter-Ulrich Tolkiehn TFH Wildau Sprachtechnologie.

Slides:



Advertisements
Ähnliche Präsentationen
Telekommunikations- Anlagen in Callcentern
Advertisements

Private Netze Neben öffentlichen GSM-Netzen etabliert sich für die europäischen Eisenbahnen eine neue digitale Zugfunkgeneration, die auf dem GSM-Standard.
Lokale und globale Netzwerke
Eric Dahl, Axel Emmer, Andreas Schmitt
Voice over IP (VoIP).
Telekooperation / RBG University of Technology Darmstadt Motivation AblaufThemenvorstellung Ausklang Audio-Timeshift Synchronisation 1 Audio-Timeshift.
Voice over IP: Dienstequalität zum Anhören
„Ansicht Arbeitsbereich“ ist die nutzerspezifische Ansicht, in der alle Dokumente aufgelistet sind, die dem angemeldeten Benutzer zugeordnet sind. D.h.
Faxtechnologie in VoIP-Netzen.
Inhaltlich orientierter Zugriff auf unstrukturierte Daten
Kapitel 4 Datenstrukturen
WEB-basierte Anwendungen
Version 0.2 Bandmaschinen.
Kommunikationstechnische Anforderungen
Analyse von Voice-over-IP-Software im Vergleich zu Hardwarelösungen und Integration in ein bestehendes, heterogenes VoIP-Netz Auswertung und Empfehlung.
Übung Akustische Phonetik
Computer-Netzwerke FGT-IT-12 Netzwerke planen und installieren
Lokale und globale Netzwerke
Voice-over- IP bei der GWDG
VoIP- und Videolösungen bei der GWDG
2.5. Mikrocontroller-Komponenten
Komplexe Systemlandschaft
Digital Audio Medientyp digital audio representation
Digital Audio Medientyp digital audio representation
10 Standorte in Deutschland
Spezifikation von Anforderungen
Telefonie Geräte und Dienste, die eine direkte Sprachkommunikation ermöglichen. Basisgerät: das Telefon.
VoIP – Voice over IP Von Bernd Heilinger.
MedCom® Medial Server Verbesserte Leistungsmerkmale
Schnittstellen des Computers
: Voice G.-U. Tolkiehn, Tolkiehn & Partner Trends und aktuelle Entwicklungen von Sprachdialogsystemen Einführungsvortrag von Prof. Dr.
2 Zugang zum Internet 2.1 Grundlagen 2.2 Internet-Provider
Telesnap Voic 2009 Produktpräsentation. Einleitung Doc.No.: ASE/APP/PLM/ 0163 / DE.
Konftel 200W DECT Konferenztelefon
Vokabular im Bereich Dialogmarketing
Telefonie (Analog/Digital) Voice over IP Telefonkonferenzen
Sie gehen gerne auf Reisen und besuchen gerne andere Städte? Wir tun das auch! Sie gehen gerne auf Reisen und besuchen gerne andere Städte? Wir tun das.
Entwicklung des sprachgesteuerten Schachcomputers Speech2Chess
Wichtige bibliographische Begriffe: Kurs WA, Zrelski, BRG WY, 2013.
Anforderungen an Satellite Learning Centers Werner Trips Christoph Eberlein.
Lernhilfe zur Kommunikationsanlagen
Inhaltsverzeichnis: 1. Telefonie mit analog und digital
Inhaltsverzeichnis: 1. Telefonie mit analog und digital
Video- und Webkonferenzen als Arbeitsmittel und Forschungsgegenstand Gregor Erbach, FR Computerlinguistik Universität des Saarlandes, Saarbrücken.
19/05/00Science Week Austria 2000 © ftw speech & more Existierende und zukünftige Sprachdialogsysteme.
Thema: Datenbanken benutzen und Informationen verarbeiten
Telefonie Geräte und Dienste, die eine direkte Sprachkommunikation ermöglichen. Basisgerät: das Telefon.
TFH Wildau , Frankfurt Von Call-Center und Homepage zum integrierten Kundeninteraktionssystem Achtung: Zur korrekten Darstellung der Päsentation.
Telefonie Geräte und Dienste, die eine direkte Sprachkommunikation ermöglichen. Basisgerät: das Telefon.
Präsentation der neuen Möglichkeiten des Telekommunikationssystems der Kreisverwaltung Segeberg.
Copyright © Siemens Enterprise Communications GmbH & Co. KG 2006 Modernisierung von Projekt- und Informationssammlungen in einem einheitlichen System Martin.
Referat über USB von Ralph Heinz.
Über die Definition, von dem Modem, ISDN hin zum DSL
Komponenten des Computers
Last Mile Dial-up und Pots von Ender Moritz & Sturn Clemens.
MP3-Player. Produktüberblick  Ein MP3-Player oder MP3-Spieler ist ein Gerät, das digital gespeicherte MP3-Dateien abspielt. Die Bezeichnung MP3-Player.
 Ein MP3-Player oder MP3-Spieler ist ein Gerät, das digital gespeicherte MP3-Dateien abspielt. Die Bezeichnung MP3-Player wird allerdings auch für Geräte.
von Lukas Spiegel & Alexander Dür
Acikgöz & Halastar VOIP Geschichte und Anwendung.
Programmiersprachen II Fortsetzung Datenstrukturen Einfache Bäume Übung 13 Prof. Dr. Reiner Güttler Fachbereich GIS HTW.
Eine komplexe Netzanwendung Webserver und Datenbankserver im Netzwerk in einer Anwendung einrichten.
EchoLink/SVXLink DK5TRB, Thomas Behr, EchoLink Funktionsprinzip Station A Rechner mit EchoLink Software Station B Rechner mit EchoLink Software.
6VoIP Seite 1 G.-U. Tolkiehn IKM, Wirtschaftsinformatik 4. Semester, TFH Wildau, SS 2004, alle Rechte vorbehalten Voice over IP.
IT-Dienstleistungen E-Learning Systeme Content Management 1 Fallbeispiel ILIAS: Das Repository-Objekt-Plugin „Centra“
Mp3 und co. – Audiobearbeitung am PC. Vorteile Audio am PC Audiofiles lassen sich einfacher verwalten und weiter verarbeiten als Kassettenaufnahmen.
Verbindung mit einem Netzwerk
Von Wietlisbach, Lenzin und Winter
 Präsentation transkript:

7. IVR SS-07 1 Günter-Ulrich Tolkiehn, TFH Wildau Alle Rechte vorbehalten: Prof. Dr. Günter-Ulrich Tolkiehn TFH Wildau Sprachtechnologie Weiterführende Literatur (keine Kaufempfehlung): Detlev Artelt (Hrsg.) “Voice Compass”, IVR

7. IVR SS-07 2 Günter-Ulrich Tolkiehn, TFH Wildau Kleine Taxonomie der Sprachtechnologie Sprachaufnahme Sprache  Sprachdaten (Mikrofon, ADC, Codec) Sprachübermittlung (PBX, PSTN/ISDN, LAN, Internet) Sprachdaten  Übertragung  Sprachdaten Sprachspeicherung Sprachdaten  Speichersystem/-medium  Sprachdaten Sprachanalyse Sprache  Text  Daten (Spracherkennung, Sprechererkennung, Sprecherverifikation) Geräusche  Daten (DTMF-, Pausen-Erkenner, grunt-detection, AB-, Besetzt-Erkenner, noise-reduction) Spracherzeugung Daten  Text  Sprachdaten (sprechende Systeme, TTS, Reading) Sprachausgabe Sprachdaten  Sprache (Codec, DAC, Lautsprecher)

7. IVR SS-07 3 Günter-Ulrich Tolkiehn, TFH Wildau Sprachaufnehmende und -ausgebende Systeme „der“ Telefon-Standard: Telefonqualität (digital: ITU G.711, 300 Hz –3,4 kHz) Endgerät „knochenförmig“, schnurgebunden oder schnurlos Zifferntastatur 0-9, *, #, plus mehr oder weniger verständliche Funktionstasten, meist kleines alphanumerisches Display, andere Bauformen sind möglich (Headset, Speakerphone, Soundkarte), jedoch bisher nur in Nischen verbreitet Umwandlung von Sprache in Sprachdaten und umgekehrt besondere Qualitäten: Höhere Bandbreiten, zusätzliches Video, Außenmikrophone...

7. IVR SS-07 4 Günter-Ulrich Tolkiehn, TFH Wildau Sprachübermittelnde Systeme (i.d.R. duplex!) ADCDEEDÜEDEEDAC Netz DÜE a/b, ISDN, GSM, VoIP,... Sprachaufnehmendes System Sprachausgabe- System E/A-Elemente und UI E/A-Elemente und UI Anforderungen: - Interoperabilität - Einfache und effiziente Bedienung - Akzeptable Sprachqualität (ITU G.114) - Zuverlässigkeit - Niedrige Gesamtkosten (TCO) - Integration in DV-Infrastruktur

7. IVR SS-07 5 Günter-Ulrich Tolkiehn, TFH Wildau Sprachspeicher und Verwendung ADCDEEDÜEDEEDAC Netz DÜE Sprachspeicher Sprachspeicher speichern Sprachdaten. Verwendung u.a in: - Voice-Logging-Systemen (teilnehmerseitig, analog und digital, duplex) - Voice-Logging-Systemen im Netz - Voice-Message-Systemen im Netz - Voice-Message-Systemen auf der Teilnehmerseite - Anrufbeantwortern (analog und digital, beim B-Teilnehmer) - Benachrichtigungssystemen (outbound) - Ansagesystemen und IVR-Systemen E/A-Elemente und UI E/A-Elemente und UI

7. IVR SS-07 6 Günter-Ulrich Tolkiehn, TFH Wildau Sprachspeicher Anforderungen an Sprachspeichersysteme im Call Center unterscheiden sich von Systemen für persönliche voic Sprachnachrichten sollen gruppenorientiert abgelegt werden Sprachnachrichten sollen über die ACD gruppenorientiert wieder abgespielt und bearbeitet werden die Auslegung der Systeme erfolgt für bestimmte planbare Überlastsituationen (Anzahl Ports ~ Anzahl Seats) Betrieb i.w. alternierend (entweder Aufnahme oder Wiedergabe) Einspielung qualitativ hochwertigen Ansagen erforderlich

7. IVR SS-07 7 Günter-Ulrich Tolkiehn, TFH Wildau PSTN, ISDN CN Sprachspeichersystem App- Server Call Center n n LAN m (~ n) Sprachspeicher, Anbindung

7. IVR SS-07 8 Günter-Ulrich Tolkiehn, TFH Wildau Sprachspeicher für DRTV Besondere Anforderungen sind im DRTV-Einsatz durch den extrem scharfen Angebotspeak gegeben: viele Ports (i.d.R. mehr VM-ports als seats) extrem kurze und dennoch präzise Ansagen möglichst kurze Gesprächszeiten bei der Aufnahme möglichst effiziente Abarbeitung über ACD möglichst effiziente Abarbeitung der Rückruflast über outbound-System

7. IVR SS-07 9 Günter-Ulrich Tolkiehn, TFH Wildau Sprachanalysierende Systeme Sprache  Text  Daten Spracherkennung Diktiersysteme: Sprache  Text, großer Wortschatz, sprecherabhängig (Training erforderlich), großer Ressourcenverbrauch, hohe Fehlerrate Sprach-Bedienung von Dialog-Systemen und Geräten (heute wortweise: Sprache  Text  Daten oder Sprache  einfache Grammatik  Daten, meist sprecherunabhängig, mittlerer Wortschatz, einstellbare Fehlerrate, zur Laufzeit ladbar, wordspotting und barge-in, nahezu „natural language understanding“. Akzeptiert Störgeräusche und schlechte Tonqualität. Gute Systeme bis 30 Kanäle schon ab ca. 10 T€einfache Grammatik Sprach-Authentifizierung Sprecherverifikation: Sicher in Größenordnung eins aus einige 1000 Sprechererkennung: Ebenfalls in Größenordnung 1 aus 1000 möglich Geräuschanalyse  Daten Pausen-Erkenner zur Datenkompression grunt-detection, AB-Erkennung, Besetzt-Erkenner noise- und distortion-Analyse und -Reduktion DTMF-Erkennung für Dialogsysteme mit Sprachausgabe

7. IVR SS Günter-Ulrich Tolkiehn, TFH Wildau Einfaches Beispiel für eine Grammatik Quelle: Philips (

7. IVR SS Günter-Ulrich Tolkiehn, TFH Wildau Spracherzeugende Systeme (TTS) Umwandlung von Textdaten oder anderen nicht- Sprachdaten in Sprachdaten Anwendungen: Reading (TTS, Vorlesen von gespeichertem Fließtext) Ansagen von generiertem Text (Uhrzeit, Börsenkurse, Dialog etc.) Funktionen: ggf. Textgenerierung (Komponente von NL-Dialogsystemen, erfordert semantische und grammatische Synthese) Umwandlung von Text in Phonem-Fluss, heute mit Betonung und Tonhöhenverlauf (erfordert nur einfache Grammatikevaluation) Umwandlung des Phonemflusses in Sprachdaten

7. IVR SS Günter-Ulrich Tolkiehn, TFH Wildau text-to-speech (TTS) Ein wichtiges Element zur Rationaliserung Für Sprachausgabe von häufig wechselnden Inhalten Wesentliches Element: der Wortschatz (Corpus) und Funktionen zur einfachen Erweiterung (mehrere 10k Worte) Umwandlung Text in Phoneme (sprachabhängig) Ausgabe der Phoneme mit Variation von Tonhöhe Zeitverlauf und Lautstärke (Prosody) Schwierigkeiten: Fremdsprachige Worte, Homographen, Zahlenangaben

7. IVR SS Günter-Ulrich Tolkiehn, TFH Wildau Komplexe integrierte Systeme Quelle: Philips (

7. IVR SS Günter-Ulrich Tolkiehn, TFH Wildau Komplexe integrierte Systeme „Alte Technik“: IVR-Systeme (Interactive Voice Response oder VRU), auto attendant, UM: nur DTMF-Erkennung und Konservenausgabe, Sprachspeicher, spezielle Transaktionen „Neue Technik“: Voice-portals ASR:Word-spotting, barge-in, Grammatik, Sprachmodelle? Welcher Erkenner? Gutes Wörterbuch mit effizienter Erweiterungsfunktion? Welche Sprachen? Wieviel simultane Kanäle? Sprachausgabe aus Konserven? TTS? DTS? Welches? Guter Dialoggenerator? Änderungen der Dialoge während der Laufzeit möglich? Interoperabilität mit TK-Anlage? ISDN? CTI (z.B. Vermittlung, Bedienung VM-System, -Abruf)? Datenschnittstelle für Anschluss an Transaktionssysteme und Webserver Voice-Message-Funktion CC-und CRM-Integration?

7. IVR SS Günter-Ulrich Tolkiehn, TFH Wildau IVR Interactive Voice Response, auch VRU Zum Begriff: Im angelsächsischen sind mit IVR meist Systeme mit reiner DTMF-Ton-Steuerung gemeint, in Europa auch Systeme mit Spracherkennern Verschiedene Einsatzbereiche sind möglich: Vorabinformation und Vorqualifikation von eingehenden Rufen im CC mit live-agents vollautomatischer Dialog (self-service) für Auskunfts-, Konferenz- und Transaktionssysteme (meist noch mit einigen live-agents im Hintergrund für schwierige Kunden) vollautomatischer Dialog mit Vermittlungs, Textausgabe- und Speicherfunktionen (auto-attendant)

7. IVR SS Günter-Ulrich Tolkiehn, TFH Wildau IVR, Funktionen, Akzeptanzprobleme IVR-Anwendungen mit DTMF kamen in Europa anfangs nicht so gut an, u.a. mangels DTMF-Fähigkeit der Endgeräte IVR-Anwendungen mit Spracherkennung, die praktisch nur DTMF-Eingabe aufsprechen lassen (Einzelworterkennung für Ziffern und ja/nein), hatten auch bei sicherer Erkennung hier ebenfalls keine gute Akzeptanz (ältere Telebanking-Systeme) Voraussetzungen für Akzeptanz scheinen zu sein: Erkenner mit ladbarem und verhältnismäßig großem und dynamischem Wortschatz word-spotting und barge-in ergonomisch gute Dialoge, beschränkte Gesprächsthemen Beispiel: Buchungssystem der DB, Tel

7. IVR SS Günter-Ulrich Tolkiehn, TFH Wildau PSTN, ISDN CN IVR-System App- Server Call Center n n LAN m (~ n) IVR im Call Center, Anbindung

7. IVR SS Günter-Ulrich Tolkiehn, TFH Wildau IVR, Spracherkenner,Leistung IVR-Systeme, Systeme für Wartefelder und voice- message-Systeme haben funktionale Ähnlichkeiten. Es besteht manchmal Verwechselungsgefahr Wesentlich für ein IVR-System sind immer die Komponenten: die DTMF-Erkennung und/oder sprecherunabhängige Spracherkennung (sollte kontextabhängig ladbaren Wortschatz haben) die Komponente zur Wortschatzgenerierung die Sprachausgabekomponente (Konserven und/oder TTS) die Komponente zur Dialoggestaltung (grafisch, mit Templates) eine Schnittstelle zur Mitteilung der aus dem Dialog entnommenen Information an CTI-Server, ACD und eventuelle Back-office Systeme eine andere wesentliche Frage ist, wieviel simultane Kanäle das System tatsächlich verarbeiten kann. Bei Word-spotting und barge-in ist der Erkenner permanent scharf, bei single-word Betrieb nur ca. 20% der Zeit.

7. IVR SS Günter-Ulrich Tolkiehn, TFH Wildau Voice Portale in den letzten Jahren hat sich für Sprachdialogsysteme die Bezeichnung Voice Portal eingebürgert in der Dialoggestaltung versucht man heute, eine Persona mit der Illusion emotionaler Nähe und Wiedererkennungswert für das System zu designen.

7. IVR SS Günter-Ulrich Tolkiehn, TFH Wildau Wo stehen wir heute? Quelle: GartnerGroup „The Implications of the 2001 CRM Hype Cycle“ vom

7. IVR SS Günter-Ulrich Tolkiehn, TFH Wildau Hersteller von Spracherkennern Einige führende Entwickler von sprecherunabhängigen Spracherkennern der 90er: DASA (neuer Firmenname des Bereichs: Temic)Temic Dragon Systems (verkauft) IBM Lernout & Hauspie (out of business)Lernout & Hauspie Nuance Systems Philips (verkauft)Philips Scansoft (verkauft) VCS (verkauft) einige innovative KMUs, auch aus dem Hochschulbereich 2007 sind fast alle genannten Erkenner in der Hand von Nuance Systems