4. 10. 04: Voice 2004 1 G.-U. Tolkiehn, Tolkiehn & Partner Trends und aktuelle Entwicklungen von Sprachdialogsystemen Einführungsvortrag von Prof. Dr.

Slides:



Advertisements
Ähnliche Präsentationen
Präsentation des Unternehmens
Advertisements

Telekommunikations- Anlagen in Callcentern
Der elektronische Handel über das Internet
Travel and Consumer Services Proseminar Allgegenwärtiges Rechnen – Ubiquitous Computing Tim Behlhardt Matr. Nr.:
Unübersichtliche Lage im Gehaltsgestrüpp
Anbindung mobiler Endgeräte über den Terminal Service
Voice over IP (VoIP).
Multi-Server Shutdown
Architekturen von CRM von Prof. Dr
WML – Wireless Markup Language Vortrag von Eduard Jakel.
E-lab Seminar Fehlertoleranz und Echtzeit für E-Commerce Prof. Miroslaw Malek Peter K. Ibach e-lab.
:35 Architektur Moderner Internet Applikationen – Sonderthema 1 Copyright ©2003 Christian Donner. Alle Rechte vorbehalten. Architektur Moderner.
Systemverwaltung wie es Ihnen gefällt.
Computeria Zürich Treff vom 4. Oktober 2006 Microsoft Vista (RC1) der Nachfolger von Windows XP Ein Vortrag von René Brückner.
Ulrich Kähler, DFN-Verein
WEB-basierte Anwendungen
Analyse von Voice-over-IP-Software im Vergleich zu Hardwarelösungen und Integration in ein bestehendes, heterogenes VoIP-Netz Auswertung und Empfehlung.
Bildungsaktivitäten in Second Life - Lehren und Lernen virtuell
e.com Networking in der Wolke
Voice-over- IP bei der GWDG
PinK Plattform für intelligente Kollaborationsportale Dr. Joachim Quantz, e.V. Berlin, 13. September 2005.
APIs für Computerunterstützte Telefonie - Gliederung
Die Bank von morgen - eine neue Welt für IT und Kunden? 23. Oktober 2001.
Internet für Alle – zwischen Euphorie und Ignoranz
IBM Workplace Forms - In Kürze © 2007 IBM Corporation XML basierte elektronische Formulare: Effizienzsteigerung und Kostenreduktion durch Automatisierung.
Distanzbasierte Sprachkommunikation für Peer-to-Peer-Spiele
2 Distanzbasierte Sprachkommunikation für Peer-to-Peer-Spiele.
Simulation komplexer technischer Anlagen
Microsoft Project 2013 & Project Server 2013
Telefonie Geräte und Dienste, die eine direkte Sprachkommunikation ermöglichen. Basisgerät: das Telefon.
VoIP – Voice over IP Von Bernd Heilinger.
Durchführung einer Zielgruppenanalyse
PROCOS Lösungen Technologie © PROCOS AG, FL-Vaduz
Stand: Version: LANCOM Systems GmbH Stand: Version:
Telesnap Voic 2009 Produktpräsentation. Einleitung Doc.No.: ASE/APP/PLM/ 0163 / DE.
Seminar XML-Technologien - WML Seminar XML-Technologien W ireless M arkup L anguage Christian Spieler.
Der führende Anbieter von SecureZIP Lösungen 20. July, 2004.
Vokabular im Bereich Dialogmarketing
Warum brauche ich ein CMS – Content Management System?
Telefonie (Analog/Digital) Voice over IP Telefonkonferenzen
1 Teil 2 Einblicke in Exchange 2003 (Basis Beta 2)
Panasonic Mobility Solutions 2009
Das integrierte Lösungsportfolio
*Integrität, Offenheit, Innovation, Unterstützung von offenen Standards.
Vokabular im Bereich Dialogmarketing
D I E V E R W A L T U N G D E S 2 1. J H D T ´ S F.Grandits / U.Linauer E-Government Kommunikationsarchitektur Schnittstellen für integrierte Lösungen.
Auslegung eines Vorschubantriebes
Lernhilfe zur Kommunikationsanlagen
Inhaltsverzeichnis: 1. Telefonie mit analog und digital
ESRI EUROPEAN USER CONFERENCE
Inhaltsverzeichnis: 1. Telefonie mit analog und digital
Video- und Webkonferenzen als Arbeitsmittel und Forschungsgegenstand Gregor Erbach, FR Computerlinguistik Universität des Saarlandes, Saarbrücken.
Windows Server 2012 R2 Upgrade-Potential
19/05/00Science Week Austria 2000 © ftw speech & more Existierende und zukünftige Sprachdialogsysteme.
Thema: Datenbanken benutzen und Informationen verarbeiten
Comparex Services Applications & Products
Über die Bezahlung per Telefonrechnung
Evaluation des sprachgesteuerten Assistenten Jasper
Telefonie Geräte und Dienste, die eine direkte Sprachkommunikation ermöglichen. Basisgerät: das Telefon.
TFH Wildau , Frankfurt Von Call-Center und Homepage zum integrierten Kundeninteraktionssystem Achtung: Zur korrekten Darstellung der Päsentation.
Werbung und Marketing: Worauf muss geachtet werden?
->Prinzip ->Systeme ->Peer – to – Peer
Datenbanken im Web 1.
XML Die “E-Lance Economy” oder die “Digital Economy” stellt neue Anforderungen an Funktionalität im Netz. XML wurde vom World Wide Web Consortium (W3C)
Acikgöz & Halastar VOIP Geschichte und Anwendung.
7. IVR SS-07 1 Günter-Ulrich Tolkiehn, TFH Wildau Alle Rechte vorbehalten: Prof. Dr. Günter-Ulrich Tolkiehn TFH Wildau Sprachtechnologie.
IT-Dienstleistungen E-Learning Systeme Content Management 1 Fallbeispiel ILIAS: Das Repository-Objekt-Plugin „Centra“
Das Software Defined Datacenter Rüdiger Melzer Senior Systems Engineer, Alliance Management VMware
 Präsentation transkript:

: Voice G.-U. Tolkiehn, Tolkiehn & Partner Trends und aktuelle Entwicklungen von Sprachdialogsystemen Einführungsvortrag von Prof. Dr. G.-U. Tolkiehn IIR-Konferenz Voice 2004 am in Frankfurt/M.

: Voice G.-U. Tolkiehn, Tolkiehn & Partner Inhalte des Vortrags: Stand der Technik, aktuelle Entwicklungen: Voice-Portale - mehr als nur Automatisierung zur Senkung der Kontaktkosten im Call Center: Ergänzung und/oder Alternative zu Web-Portalen Spracherkennung und –synthese: Perfektionierung, z. B. durch phonetische Transskriptionsverzeichnisse, Grammatiken, KI Konzentration bei den großen Basistechnologie-Anbietern: Wenig Hoffnung auf Preissenkungen Trends und Perspektiven: Wachstum: V-Commerce soll wesentlichen Anteil an e-Commerce erobern Neue Anwendungsgebiete: Gewinnspiele, -reading und Überweisungen - Sprachtechnologie kann viel mehr Immer wichtiger für innovative Lösungen: Software- und Systemhäuser Wie steht es mit plug-and-play-Lösungen für KMUs?

: Voice G.-U. Tolkiehn, Tolkiehn & Partner Stand der Technik: IVR, Voice-Portale Quelle: GartnerGroup The Implications of the 2001 CRM Hype Cycle vom

: Voice G.-U. Tolkiehn, Tolkiehn & Partner Kleine Systematik: Elemente von Sprachsystemen Sprachaufnehmende Systeme Sprache Sprachdaten (Mikrofon, ADC, Codec) Sprachübermittelnde Systeme (PBX, PSTN, ISDN, LAN, Internet) Sprachdaten Übertragung Sprachdaten Sprachspeicherung Sprachdaten Speichersystem/-medium Sprachdaten Sprachanalysierende Systeme Sprache Sprachdaten Text Daten Bedeutung (Spracherkennung (Worte), Sprachverständnis, Sprechererkennung, Sprecherverifikation) Geräusche Daten (DTMF-, Pausen-Erkenner, grunt-detection, AB-, Besetzt-Erkenner, noise-reduction) Sprache erzeugende Systeme Daten Text Sprachdaten Sprache (sprechende Systeme, TTS, Reading) Sprachausgabesysteme Sprachdaten Sprache (Codec, DAC, Lautsprecher)

: Voice G.-U. Tolkiehn, Tolkiehn & Partner Sprachaufnehmende und -ausgebende Systeme der Standard: Telefonqualität (digital: ITU G.711, 300 Hz –3,4 kHz) oder neuerdings: GSM-Qualität Endgerät knochenförmig, schnurgebunden oder schnurlos Zifferntastatur 0-9, *, #, plus mehr oder weniger verständliche Funktionstasten, meist kleines alphanumerisches Display, andere Bauformen sind möglich (Headset, Speakerphone, Soundkarte), jedoch bisher nur in Nischen verbreitet Umwandlung von Sprache in Sprachdaten und umgekehrt besondere Qualitäten: Höhere Bandbreiten, zusätzliches Video, Außenmikrophone...

: Voice G.-U. Tolkiehn, Tolkiehn & Partner Bereiche der Sprachqualität Quelle: Leitfaden VoIP, Swyx Communications AG, 2000 GSM Voice over Internet ISDN

: Voice G.-U. Tolkiehn, Tolkiehn & Partner Sprachspeicher, Verwendung in Systemen ADCDEEDÜEDEEDAC Netz DÜE Sprachspeicher Sprachspeicher speichern Sprachdaten. Es gibt sie analog, digital, mit VoIP, als Komponenten von: Voice-Logging-Systemen teilnehmerseitig (simplex/duplex, an Endgerät, PBX, LAN) Voice-Logging-Systemen im (öffentlichen) Netz Voice-Message-Systemen im (öffentlichen) Netz Voice-Message-Systemen auf der Teilnehmerseite Anrufbeantwortern (analog und digital, beim B-Teilnehmer) Benachrichtigungssystemen (outbound) Ansagesystemen, IVR-Systemen, auto-attendants, voice portals E/A-Elemente und UI E/A-Elemente und UI

: Voice G.-U. Tolkiehn, Tolkiehn & Partner Sprachanalysierende Systeme (ASR) Spracherkennung Diktiersysteme (Sprache Text, großer Wortschatz, i.d.R. sprecherabhängig, großer Ressourcenverbrauch, hohe Fehlerraten) Sprach-Bedienung von Dialog-Systemen heute i.w. wortweise: –Sprache Text Daten oder –Sprache Text einfache Grammatik Daten,einfache Grammatik meist sprecherunabhängig, mittlerer Wortschatz, ladbar, einstellbare Fehlerrate, wordspotting und barge-in, Ziel natural language understanding Sprach-Authentifizierung Sprecherverifikation (sicher in Größenordnung 1 aus einige 1000) Sprechererkennung (ebenfalls 1 aus einige 1000) Geräuschanalyse DTMF-Erkennung für Dialogsysteme mit Sprachausgabe Pausen-Erkenner zur Datenkompression grunt-detection, AB-Erkennung, Besetzt-Erkenner noise- und distortion-Analyse und -Reduktion

: Voice G.-U. Tolkiehn, Tolkiehn & Partner Spracherzeugende Systeme Umwandlung von Textdaten oder anderen nicht- Sprachdaten in Sprachdaten Anwendung: Reading (TTS, Vorlesen von gespeichertem Fließtext) Ansagen von generiertem Text (Zeit, Börsenkurse, Auskunft) Funktionen: ggf. Textgenerierung (Komponente von NL-Dialogsystemen, erfordert semantische und grammatische Synthese) Umwandlung von Text in Phonem-Fluss, heute mit Betonung und Tonhöhenverlauf (erfordert eine relativ einfache Grammatikevaluation) Umwandlung des Phonemflusses in Sprachdaten

: Voice G.-U. Tolkiehn, Tolkiehn & Partner Top-View: Was will der Betreiber? Kosten sparen durch Verlagerung von so viel Dialog wie möglich vom live agent in die Maschine. Die Schallmauer 1/Call durchbrechen V-Commerce: Mit Sprache neue Geschäftsmöglichkeiten schaffen – aber zu geringen Kosten. Webserver können viel, sind aber nicht immer das Optimum. Was will der User? In erster Linie, dass er das bekommt, was er haben will, dann, wenn er es haben will, ohne Risiken und zu bekannten und akzeptablen Kosten. Einfach, verfügbar, klar, verlässlich, preiswert, sicher.

: Voice G.-U. Tolkiehn, Tolkiehn & Partner Vergleich mit Webserver und Call Center Also: Call Center-Funktionalität zu Transaktionskosten von Webservern. In USA wurden vor Jahren Webserver (Shops und Helpdesks) mit der Dialogstruktur der bereits erprobten IVR-Systeme ausgestattet. Ein Fehlschlag. Wer heute versucht, Voice-Portale mit der Dialogstruktur von Web-Shops aufzubauen begibt sich ebenfalls in Gefahr. Die Dialogstruktur von IVR-Systemen tut es natürlich auch nicht mehr Ist das alles? Gute Dialoge aus den Call Center Erfahrungen ableiten und gute Technik einsetzen? Sollte doch gehen. Oder?

: Voice G.-U. Tolkiehn, Tolkiehn & Partner Gefahrenpotentiale Lehrsatz: Automatisierung senkt Kosten zu Risiken und Nebenwirkungen fragen Sie Ihren Vertriebsleiter oder Unternehmensberater Negativ-Beispiel: Geldautomaten der Banken Kommunikation mit Menschen ist eine komplexe Angelegenheit. Sachebene - Beziehungsebene Was kommuniziert Ihr Voice-Portal eigentlich auf der Beziehungsebene? a ba Selbst für eine relativ einfache Kommunikation auf der Sachebene benötigen wir aber bereits

: Voice G.-U. Tolkiehn, Tolkiehn & Partner Komplexe integrierte Systeme Quelle: Philips ( Grammatik- Analyse

: Voice G.-U. Tolkiehn, Tolkiehn & Partner Komplexe integrierte Systeme Alte Technik: IVR-Systeme (Interactive Voice Response oder VRU), auto attendant, UM: Meist nur DTMF-Erkennung und Konservenausgabe, Sprachspeicher, spezielle einfache Transaktionen Neue Technik: Voice-portals, integrativer Ansatz ASR: Word-spotting, barge-in, Grammatik, Sprachmodelle? Welcher Erkenner? Gutes Wörterbuch mit effizienter Erweiterungsfunktion? Welche Sprachen? Wieviel simultane Kanäle? Sprachausgabe aus Konserven? TTS? DTS? Welche Lösung? Guter Dialoggenerator? Auswertungen und Änderungen der Dialoge während der Laufzeit einfach durch Anwender möglich? Interoperabilität mit TK-Anlage? ISDN? VoIP? CTI (z.B. Vermittlung, Bedienung VM-System, -Abruf)? Datenschnittstelle für Transaktionssysteme und Webserver Brauchbare Voice-Message-Funktionen, auch ACD-fähig? Contact Center und CRM-Integration?

: Voice G.-U. Tolkiehn, Tolkiehn & Partner IVR-Technik in deutschen Contact Centern 2002 Quelle: Marktstudie PartnerConsulting & TFH Wildau Juni, 2003 Summe: 47%

: Voice G.-U. Tolkiehn, Tolkiehn & Partner Investitionsabsichten in Contact Centern ,6% der befragten Unternehmen planten in 2002 bis 2004 in IVR-Technologie investieren 5,9% der befragten Unternehmen planten in 2002 bis 2004 in Voice-Logging-Systemen zu investieren Keiner der Teilnehmer wollte in Voic Systeme investieren Die Studie wird ab Oktober erneut durchgeführt. Wir werden dann auch explizit nach Voice-Portalen fragen

: Voice G.-U. Tolkiehn, Tolkiehn & Partner Voice-Portal-taugliche Bereiche identifizieren! Quelle: White Paper von Concerto Software

: Voice G.-U. Tolkiehn, Tolkiehn & Partner Was können wir demnächst erwarten? Trotz aller Schwierigkeiten: V-Commerce erhält durch Automatisation zweite Luft als wesentliche Komponente von e-commerce. Einige Einzelbelege: steigende Anzahl von Webseiten zu v-commerce ( in Google allein auf deutsch 410 Treffer!) Nuance hat seinen Webauftritt in umbenannt, nicht zu verwechseln mit Gegenwärtiges Voice Event Revival ca. 5 Jahre nach dem Absterben vieler alter Voice Events Aber es dauert! Wer hat schon mal in einem vollautomatisierten v- shop eingekauft? Wo bleiben v-government und v-administration?

: Voice G.-U. Tolkiehn, Tolkiehn & Partner Was können wir demnächst erwarten? Weitere Perfektionierung der Basis-Technologie, auch neue kleine Anbieter beachten! Weiterentwicklung der SW-Komponenten (Grammatik, KI, Dialoggeneratoren etc.) Neue Hardware (Hochleistungsfähige, preiswerte CAPI und VoIP-Komponenten) SW- und Systemhäuser spezialisieren sich auf Voice- Portal-Lösungen und Anwendungsintegration Weitere Verbesserung der Flexibilität und Handhabbarkeit der Lösungen durch den Anwender Kleine Ready-to-Run-Lösungen out-of-the-box Preissenkungen für SW leider eher nicht

: Voice G.-U. Tolkiehn, Tolkiehn & Partner Gartner Hype Cycle 2003 Trough of Disillusionment Slope of Enlightenment Plateau of Productivity Maturity Technology Trigger Peak of Inflated Expectations Visibility Key: Time to Plateau Less than two years Two to five years Five to 10 years Beyond 10 years Wireless LANs/ Text-to- Speech VPN Grid Computing Biometrics WAP/ Wireless Web Location Sensing P2P Web Services PDA Phones Speech Recognition on Desktop Personal Fuel Cells Identity Services E-Tags Natural Language Search Nanocomputing VoIP Bluetooth Speech Recognition in Call Center PKI E-Payments

: Voice G.-U. Tolkiehn, Tolkiehn & Partner Fazit: Es wird sich noch einiges tun in den nächsten fünf Jahren sind für Voice-Portale also noch erhebliche technische Weiterentwicklungen die Erprobung neuer Einsatzgebiete und erhebliche Zunahme der Marktdurchdringung zu erwarten Wir bleiben dran. Tun Sie es auch!

: Voice G.-U. Tolkiehn, Tolkiehn & Partner Vielen Dank für Ihre Aufmerksamkeit! Fragen und Anmerkungen bitte! Datenversion anfordern von:

: Voice G.-U. Tolkiehn, Tolkiehn & Partner Einfaches Beispiel für eine Grammatik Quelle: Philips (