Multimodale Interfaces - A

Slides:



Advertisements
Ähnliche Präsentationen
Benutzerorientierte Designprinzipien für die Microsoft-Guidelines
Advertisements

Bund der Sparer E.V. AFA – AG.
Webseiten, die gefunden werden Dr. Eduard Heindl, Heindl Internet AG Tübingen.
Hinweise und Anregungen zum Anfertigen von
Wenn man hot potatoes startet erhält man folgenden Bildschirm.
Eine moderne Fremdsprache in der Schule lernen
Klaus J. Kohler IPDS, Kiel
Hier ist die automatische Flugauskunft des Flughafens München. Wie kann ich Ihnen helfen?Eine Auskunft bitte. Ist der Flug LH 225 pünktlich?Ist der Flug.
1. Satzbetonung, Töne, und Grundfrequenz
Die Prosodie Jonathan Harrington Felicitas Kleber.
F. H&H Theorie und „adaptive dispersion“ in Lindbloms Modell
Inhalte zielgerichtet darstellen Adressatengerechte Informationen
Intelligent self-adaptation of user interface complexity in a case-based medical training system Alexander Hörnlein, Frank Puppe.
Online Recherche 1.Vorbereitung der Recherche (bevor Sie sich in einen Host, bzw. Eine Datenbank einwählen) Erster Schritt: Ermittlung des Informationsbedarfs.
Aufgabenbereiche Stufe 2 – BiP
Design von Benutzungsoberflächen
Sprachverstehenstest in germanischen Sprachen
Maschinelles Lernen und automatische Textklassifikation
Überblick Software Bestellungsver- waltungsprozess Dialogmanagement Simulation Sprachverarbeitung Verschiedene Arbeitsphasen Routengraphen Sprachverarbeitung:
Auditive Wahrnehmungsstörungen und Verarbeitungsstörungen – AVWS
Spezifikation von Anforderungen
Outlook_03 - Freigabe von Postfächern für Kollegen
Leitfaden zum Elterninformationstag Informationsübermittlung Madrassatul-ilm.
Internet ohne Barrieren - Und was ist mit der Sprache?
Präsentieren… ABER WIE ?
für mehrspuriges Denken
JavaScript.
Der Spracherwerb des Kindes
Werbepsychologische Checkliste. Berücksichtigung situativer Gegebenheiten Beachtet das zu schaltende Werbemittel auch die übrigen Reize und Informationen.
Warum brauche ich ein CMS – Content Management System?
Zum verständlich machen, wozu die Trigger-Funktion geeignet ist,
POSTER TITEL, SO KURZ WIE MÖGLICH AutorIn, AutorIn, AutorIn, Autorin
Eine Vorlage zur Erstellung von Buyer Personas
Grunderfahrungen für den Schreib- und Leselernprozess
Wie schreibe ich eine Diplom- bzw. Masterarbeit ?
Sprechfertigkeit Sprechen
NATIVIST THEORIE.
ELP-TT Training teachers to use the European Language Portfolio EFSZ-Kurzprojekt ELP_TT2 Koordination: Mag. Margarete Nezbeda.
Deutschunterricht mit dem Lehrmittel «Die Sprachstarken»
Präsentation #6 Einladung an Dritte. Manchmal möchten Menschen nicht, dass wir denken, sie bräuchten Geld und lehnen Angebote deshalb vorschnell ab. Was.
PRO:CONTROL Ziel des Moduls Arbeitspakete
„Wuppis Abenteuerreise durch die phonologische Bewusstheit“ ist ein umfassendes Sprachförderprogramm für Vorschulkinder, mit der Leitfigur Wuppi als liebenswerter.
Hilft Beten?.
Oliver Spritzendorfer Thomas Fekete
Gehörlose & Hörende Teil 1
Hausaufgabenfibel der Bernhardschule
HipHop Projekttage mit Pyranja
Using latent semantic analysis to find different names for the same entity in free text Präsentation und Diskussion des Papers Im Rahmen des PS Web-Information.
Konstruktives Feedback geben
2. MKT – Die verbale Selbstinstruktion Mi
GIS Design: A Hermeneutic View (Michael D. Gould)
Vortrag: Frames & Javascript.
Information Retrieval, Vektorraummodell
Präsentationen im Unterricht
Kommunikation mit psychisch kranken Menschen
Wolfgang Wahlster Der Weg zum sprachverstehenden Computer Deutsches Forschungszentrum für Künstliche Intelligenz GmbH Stuhlsatzenhausweg 3, Geb
Sensible Themen Was Sie tun können, wenn die Unzufriedenheit mit dem Aussehen für eine/n Lernende/n oder KollegIn ein Problem darstellt LIFELONG LEARNING.
VIA-Elterntraining Inhalt Besprechung der Hausaufgabe
Unsere Vorteile Wir sind da um zu helfen. Die Schüler können mit uns offener reden als mit den Lehrern. Die Schüler sprechen lieber mit uns, weil wir.
On-Demand™ Der “Markt” ist... Demo Modus: mit Hilfe von Grafiken, Sound (Sprache), Text und Animationen werden Lernsequenzen in Folge abgespielt - ähnlich.
Portfolio in den Bildungs- und Lerngeschichten
Dreamteam: Web 2.0 und der Katalog Anne Christensen und Thomas Hapke GBV-Verbundkonferenz
Einführung Dialogsysteme
Dieser Vortrag wird gesponsort von:
Gestaltungsprinzipien für PowerPoint
Willkommen Deutsch 13b Helfen Sie bitte bei diesem Umbau.
Mac Datenrettung
1. Betreuer: Prof. Dr. Jörg Striegnitz 2. Betreuer: Dr. Martin Schindler Kontextsensitive Autocompletion für Klassendiagramme in der UML/P Florian Leppers.
Kollegiale Hospitation
 Präsentation transkript:

Multimodale Interfaces - A 10 Multimodale Interfaces - A Oviat, S. 291

Multim. Interf. – Architektur & Informationsfluss 10 Multim. Interf. – Architektur & Informationsfluss Oviat, S. 298

Natürliche Sprache mit Texteingabe 10.1 Natürliche Sprache mit Texteingabe Beispiele: Anfrage bei Hilfe Datenbankabfrage Suchanfragen Konfigurationsaufgaben Interaktive Bestell- und Transaktionsvorgänge

Wisber-Beispiel (1) WISBER: Guten Tag, hier ist WISBER 10.1 Wisber-Beispiel (1) WISBER: Guten Tag, hier ist WISBER (2) USER: Ich habe 40.000 DM geerbt und möchte diesen Betrag anlegen. (3) WISBER: Welche Laufzeit soll die Anlage haben? (4) USER: Die Laufzeit der Anlage soll acht Jahre betragen. (5) WISBER: Besitzen Sie ein Sparbuch mit mehr als zwei Nettomonatseinkommen? (6) USER: Ich habe fünf Nettomonatseinkommen auf mehreren Sparbüchern. (7) WISBER: Möchten Sie während der Laufzeit auf den Betrag zurückgreifen können? (8) USER: Nein. (9) WISBER: Dann empfehle ich Ihnen Pfandbriefe. Sie haben eine Rendite von 7%. (10) USER: Gibt es Anlagen mit einer höheren Rendite als 7%? (11) WISBER: Nein Was ist Wisber?  Siri 1989: Sprachanalyse und Textgenerierung im natürlich-sprachlichen Beratungssystem WISBER (Wissensbasierter Beratungsdialog)

Komponenten im natürlich-sprachlichen Dialog 10.1 Komponenten im natürlich-sprachlichen Dialog Komplexe Anfrage oder Aufforderung wird geparst Grundformen werden abgeleitet Füllwörter werden eliminiert Mit Thesaurus wird abgeglichen (Einsetzen von Synonymen) Textdokumente identifizieren, die mit der Anfrage ein hohe Überlappung aufweisen  nach Relevanz ordnen z.B. für Juristische Datenbanken: „Finde alle Fälle mit Pächtern, die ihre Vermieter erfolglos wegen unzureichender Beheizung verklagt haben.“ Problem: Modell des Benutzers von der Treffgenauigkeit des Systems

Nutzungseinschränkungen bei natürlich-sprachlichen Schnittstellen 10.1 Nutzungseinschränkungen bei natürlich-sprachlichen Schnittstellen Habitability: Fähigkeit eines Benutzers, sich innerhalb der Einschränkungen eines Dialogsystems zurecht zu finden. Beispiel: What is the Salary of John Smith‘s Manager? Einschränkungsarten: Conceptual: Information ist nicht in der DB enthalten Functional: nicht in einem Schritt abfragbar, sondern „who is the manager of John smith?  J.B.  What is J.B.‘s Salary? Syntactical: Genetiv-Konstruktion mit „‘s“ wird nicht erkannt Lexical: „salary“ ist nicht bekannt aber „earnings“ Helander 282f

Nutzungsprobleme bei natürlicher Sprache 10.1 Nutzungsprobleme bei natürlicher Sprache Es muss mit Restriktionen umgegangen werden (funktionale sind am schwerwiegendsten, danach syntaktische; Eingeschränktes Vokabular fällt leicht) Benutzer bevorzugen syntaktische Ellipsen Unklare Formulierung formaler Probleme (Verknüpfungslogik, Quantoren) Natürliche Sprache kann ineffizient sein Es werden falsche Modelle der Sprachverarbeitung aufgebaut Das System muss Themenfokussierung durchführen Ambiguität ist aufzulösen Kontext und Weltwissen sind zu berücksichtigen

Nutzungsprobleme - Beispiele 10.1 Nutzungsprobleme - Beispiele  Es muss mit Restriktionen umgegangen werden (funktionale sind am schwerwiegendsten, danach syntaktische; Eingeschränktes Vokabular fällt leicht) Sys: Im Angebot sind Städtereisen nach Hamburg, Paris, Wien und Berlin Ben: Was ist der Preis von Hamburg Sys: Welche Wertpapiere möchten Sie? Ben1: Ich habe etwa 10.000 DM Ben2: Ich kann 10.000DM anlegen Ben3: Ich möchte Pfandbriefe Ben: Ich hätte gerne eine Tasse Kaffee und ein Butterhörnchen oder ein Croissant Implizite Reihenfolgen: Ich brauche eine Zeitplanung für die Vorlesung und die Folienerstellung im kommenden Semester.

Feedback und mentale Modelle 10.1 Feedback und mentale Modelle Benutzer bilden sich Modelle über die Funktionsweise und die damit verbundenen Restriktionen nat-spr. Systeme: Geeignete Feedback-Meldungen kann die angemessene Modellbildung unterstützen, Nutzer imitieren die „Sprechweise“ des Systems: Knappe und prägnante Rückmeldungen werden leichter imitiert Fehlermeldungen sollen die richtige, vom Nutzer verstehbare Eingabe wiederholen  Feedback sollte das Vokabular nicht variieren. Helander 294f

Multimodal conversational System 10.1 Multimodal conversational System Karat et al., S.178

Speechrecognition – Anwendungsklassen und -kontext 10.2 Speechrecognition – Anwendungsklassen und -kontext Kommando-Eingabe „Dritter-Arm“ Informationseingabe, - abfrage Situation, in denen Keyboard und Mouse nicht benutzbar sind Telefonbasierte Interaktion Transkription Eppinger, S. 221 Karat et al., S. 170

Schritte der Einzelworterkennung 10.2 Schritte der Einzelworterkennung Ermittlung der Wortgrenze, Pausen müssen trotz Störung und Rauschen erkannt werden Vorverarbeitung und Normierung: Störgeräuschunterdrückung, Eliminierung der Sprecherspezifika, Eliminierung von Intensität und Dynamik Erstellung eines Referenzmusters  Clusterbildung Klassifikation – Zuordnung eines gesprochenen Wortes zu einem Cluster mit ausreichendem Abstand zu den anderen Clustern Berücksichtigung vorheriger Zuordnungen und Abstände sowie Adaption Berücksichtigung des Kontextes Eppinger, 230ff

Sprachsynthese – prosodische Elemente 10.2 Sprachsynthese – prosodische Elemente Betonung: Lautstärke, Dehnung, Grundfrequenz-änderung Lautstärke und Intensität, Lautstärkeverlauf über den Satz Sprachrhythmus und Variation der Dauer von Sprachlauten Variation der Grundfrequenz, Satzmelodie Eppinger, S. 293ff

Speech-Synthesis – 4 Stufen 10.2 Speech-Synthesis – 4 Stufen Verstehbare Ausgabe Simulation der Qualität menschlicher Sprecher Gesprochene Sprache klingt ähnlich wie die des Nutzers, dessen Botschaft gehört werden soll, und für den das System persönlich entwickel wird Gesprochene Sprache klingt ähnlich wie die des Nutzers, dessen Botschaft gehört werden soll, und das System stellt sich anhand von Sprachaufnahmen individuell auf verschiedene Benutzer ein.

Conversation: Speech Input angemessen 10.2 Conversation: Speech Input angemessen + - Kein Keyboard verfügbar Hände sind anderweitig beschäftigt Kommandos sollten direkt „ansprechbar“ sein Nutzer können oder wollen nicht tippen Physiologische Behinderung Nutzer muss parallel zur MCI mit anderen sprechen Laute Umgebung Maus und Tastatur sind effizienter Privacy ist wichtig Lai & Yankelovich, S.699

Speech Output angemessen 10.2 Speech Output angemessen + - Augen müssen etwas anderes beobachten Die Aufmerksamkeit des Nutzers muss gewonnen werden Sehbehinderungen Das Interface soll eine Persönlichkeit nachahmen Große Informationsmenge Daten müssen verglichen werden Komplex strukturierte Information Vertrauliche oder persönliche Information Lai &Yankelovich, S. 700

Speech-Conversation: Guidelines 10.2 Speech-Conversation: Guidelines Interaktion von Anfang an auf Speech planen, da man ein grafisch orientiertes Interface nicht zu Speech-Interaktion übersetzen kann Die Informationseinteilung muss bei Speech-Interaktion anders geplant werden, keine Tabellen etc. Begrenzte Gedächtnis-Kapazität berücksichtigen Die für den Nutzer möglichen Reaktionen sind nicht sichtbar – das muss kompensiert werden Das System sollte Feedback zum verstandenen Text geben Sprachausgabe: Aufgenommene Äußerungen verwenden, wenn alles Sagbare bekannt ist; Wiedergabe und Synthese nicht vermischen Lai & Yankelovich, S. 700ff

Speech-Conversation: mögliche Fehler 10.2 Speech-Conversation: mögliche Fehler Stimme ist deutlich anders als bei den gespeicherten Mustern (z.B. bei Kindern) Wörter sind nicht im Vokabular enthalten Sätze passen nicht zum Grammatikmodell des Systems Sprechen beginnt, bevor das System aufnahmebereit ist Wörter klingen zu ähnlich Zu lange Pausen Nutzer spricht nicht flüssig Akzent oder Heiserkeit Mikrophon ist nicht passend eingestellt Hintergrundgespräche oder ungewollte Artikulation (Lachen) Ein Gespräch mit anderen Personen kommt dazwischen Lai & Yankelovich, S. 702

Speech- Conversation: Fehler und Fehler-behebung 10.2 Speech- Conversation: Fehler und Fehler-behebung Rejection: Wort wird nicht erkannt, System sollte um Wiederholung bitten (wechselnde Paraphrasen der Aufforderung), Substitution: das gemeinte Wort wird durch ein anderes ersetzt  Paraphrasiert wiederholen Insertion: nicht Gesprochenes wird eingesetzt Hilfe: Alternativen anbieten Buchstabieren lassen (kann schwierig sein) Das Naheliegendste anbieten YES oder NO Fragen stellen Lai & Yankelovich, S. 707ff

Multimodale Fehlerkorrektur 10.2 Multimodale Fehlerkorrektur Bei multimodalen Korrekturmöglichkeiten schalten Benutzer auf alternative Korrekturmöglichkeiten um! Was ist das für eine Studie? Time? Suhm et al., S. 84