M u l t i m o d a l e S y s t e m e / M E Multimodale Systeme Joulavskaia Natalie Nikoulina Irina.

Slides:



Advertisements
Ähnliche Präsentationen
Proseminar: Anwendungen für Augmented Reality
Advertisements

Pop Jazz C B A Jazz C A Lehrstuhl für Künstliche Intelligenz
Modellierung sozio-technischer Systeme SeeMe - Semi-strukturierte, sozio-technische Modellierungsmethode.
» Imagine « Gestaltung von Benutzungsschnittstellen in der Praxis, Beispiele für Hypermedia- Systeme und virtuelle Realität Videoseminar zur Software-Ergonomie.
Designing Software for Ease of Extension and Contraction
Das „Vorgehensmodell“
BORT Basically Operating Robot Thing
Motivation Richard Göbel.
Java: Grundlagen der Sprache
Formale Sprachen – Mächtigkeit von Maschinenmodellen
von Reaktionen und chemischen Suppen
Entwicklung der Programmiersprachen
SciAgents - Eine agentenbasierte Umgebung für verteilte wissenschaftliche Berechnungen Alexander StarkeSeminar Software Agenten
Informationsgewinnung mit Agenten
Raumbezogene Identitäten nach Peter Weichhart
SWIMMING POOL STEUERUNG
Anwendungen. © Prof. T. Kudraß, HTWK Leipzig Historie des WWW Grundlage Internet – Entwickelt Ende der 60er Jahre vom US-Militär (ARPA-Net) – Technische.
CAR Car Augmented Reality Präsentiert von Michael Emmersberger
George Herbert Mead Soziale Handlungen: das Verhalten eines Individuums stellt einen Reiz für ein anderes dar, um in einer bestimmten Weise wiederum auf.
Projekt A4: Alignment of Situation Models Gert Rickheit Sven Wachsmuth Constanze Vorwerg Agnes Swadzba SFB-Kolloqium,
Vorlesung 3: Verschiedenes Universität Bielefeld – Technische Fakultät AG Rechnernetze und verteilte Systeme Peter B. Ladkin
Seminar: Architekturbeschreibungssprachen
Explizite und editierbare Metainformationen für Software Muster.
Theorien zum computergestützten Lernen mit Multimedia
1 Vorlesung 3 Verschiedenes Peter B. Ladkin
UML Begleitdokumentation des Projekts
Mensch-Computer-Interaktion
Vorlesung Gestaltung von soziotechnischen Informationssystemen - RequirementsEngineering und Contextual Design- Thomas Herrmann, Lehrstuhl Informations-
Diplomarbeit Thema: Untersuchungen zur Spezifikation und Realisierung von Interoperabilitätskonzepten (hauptsächlich) CORBA-basierter Multiagentensysteme.
Steffen Mankiewicz 1.
Semantic Media Showcase – Universität Potsdam
Spatial Decision Support Systems (SDSS)
Antragspaket Außenbereichsrobotik Folie 1 Prof. Dr.-Ing. B. Wagner Umgebungsmodelle mit dynamischer Annotation auf der Basis von in Echtzeit erfassten.
Spezifikation von Anforderungen
12. Vorlesung: Aktivitätsdiagramme
Schnelles und effizientes Suchen. Was ist MPEG 7? Wie funktioniert MPEG? Was bietet MPEG 7? Wo wird MPEG 7 verwendet?
Multimodale Interfaces
EXCEL PROFESSIONAL KURS
Betriebssysteme allgemein
Der modulare Aufbau BusinessNavigator.
Webservice Grundlagen
Tobias Kluge: FAME Middleware / Karlsruhe / The FAME project – Middleware.
Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/
CEF 2001, New Haven Genetic Neural Fuzzy Explorer GENEFER Konzeption, Technologien und Einsatzmöglichkeiten Eric Ringhut Muenster Institute for Computational.
UML-Kurzüberblick Peter Brusten.
Context-awareness Andreas Bossard, Matthias Hert.
5 Software-Qualität 5.1 Qualität 5.2 Taxonomie der Software-Qualitäten.
PRO:CONTROL Ziel des Moduls Arbeitspakete
Vom Geschäftsprozess zum Quellcode
Datenverarbeitung im PC
Eike Schallehn, Martin Endig
© 2001 Sven Dammann1 Aufbau Integrierter Informationssysteme XML Bearbeitung und relationale Abbildung Sven Dammann Martin-Luther-Universität Halle-Wittenberg.
Grundlagen, Prinzipien und Aufgaben eines Betriebssystems
Technische Universität München Zentralübung Automotive Software Engineering – Übungsblatt 6.
Datenbanken im Web 1.
Digitale Annotationen. Grundlage: John Bradley “Towards a Richer Sense of Digital Annotation: Moving Beyond a Media Orientation of the Annotation of Digital.
2. Sitzung Forschungsprozess als Abfolge von Entscheidungen
Seminar: Software-Architektur Einführender Vortrag
AB TAMS Technische Aspekte Multimodaler Systeme Daniel Westhoff Universität Hamburg Fachbereich Informatik Proseminar:
Projekt A4: „Alignment of Situation Models“ Dr. Gerd Rickheit Dr. Sven Wachsmuth Dr. Constanze Vorwerg Agnes Swadzba SFB-Kolloqium,
Voice eXtensible Markup Language Eine Projektarbeit von Manuel Egger Christian Eisendle Michael Szirch FH Joanneum SWD04.
Optische Kopfhaltungserkennung im Auto als Wissensquelle für multimodale Mensch-Maschine- Schnittstellen Chakib Bensajjay Erstgutachter: Prof. Dr. Dr.
Spärliche Kodierung von Videos natürlicher Szenen Vortragender: Christian Fischer.
Semi-automatische Komposition von Dienstbenutzerschnittstellen auf mehreren Abstraktionsebenen Christian Jäckel Universität des Saarlandes Bachelor.
1. Betreuer: Prof. Dr. Jörg Striegnitz 2. Betreuer: Dr. Martin Schindler Kontextsensitive Autocompletion für Klassendiagramme in der UML/P Florian Leppers.
1 Lutz Ullrich SOA – serviceorientierte Architektur SOA – Was ist das?
Spracherkennung mit dynamisch geladenen, spezifischen Akustikmodellen
Hypertext 2015/2016.
 Präsentation transkript:

M u l t i m o d a l e S y s t e m e / M E Multimodale Systeme Joulavskaia Natalie Nikoulina Irina

M u l t i m o d a l e S y s t e m e / M E - Motivation Begriffsdefinitionen Eingabegeräte - Geschichteüberblick - Frühere multimodale Systeme Entwicklung des Eingabesystems - VIENA: offene Eingabe - CARE – Konzept - CARE und VIENA - VIENA/MEA - Multimodale Systeme/Ansätze Gliederung

M u l t i m o d a l e S y s t e m e / M E Modalität (oder Modus) Multimodalität Multimodale Systeme Multimodales Parsing/ Multimodales Generierung Motivation Definitionen

M u l t i m o d a l e S y s t e m e / M E Erfassung von Gesten - video-basiert - basiert auf Sensoren Erfassung von Blickrichtungen - Eyertracker Erfassung von der Sprache - Mikrophon - Tastatur Motivation Eingabegeräte

M u l t i m o d a l e S y s t e m e / M E SCHOLAR Tutorsystem Südafrika Put-That-There XTRA Interface, Steuerformularhilfe CUBRICON Militärisch, Karten AIMI Militärisches Interface ALFresco Bilder, Hypertext, NLP Edward Sinn & Zweck von M4K GEORAL Touristik, Karte Motivation Geschichteüberblick

M u l t i m o d a l e S y s t e m e / M E Frühere Systeme für Sprache & Gestik - SCHOLAR (Corbonell 70) - Put-That-There (Bolt 80) - XTRA (Allgayer et. Al. 1989) - CUBRICON (Neal/Shapiro 91) Merkmale - die Integration von Gesten erfolgt durch das Auftreten von sprachlichen Referenzausdrücken - kein allgemeiner wohldefinierter multimodaler Integrationsmechanismus - Beschränkung auf Zeigegesten Frühere multimodale Systeme Merkmale

M u l t i m o d a l e S y s t e m e / M E 1. Sequentielle Analyse/ Zusammenführung von Sprach- und Gesteneingaben [Put-That-There System (Bolt, 1980) CUBRICON (Neal & Skapira, 1991)] 2.Parallele Verarbeitung (Koors, Sparrell & Thorisson, 1993; Bos, Huls & Claasen, 1994; Nigay & Coutaz, 1995) 3.Offene Eingabe wurde von den früheren Ansätzen nicht benutzt/ keine Auflösung von Redundanzen und Inkonsistenzen Frühere multimodale Systeme Wie hat sich das Eingabesystem entwickelt?

M u l t i m o d a l e S y s t e m e / M E VIENA -Virtuelle Entwurfsumgebung und Agenten (Wachsmuth&Cao, 1995) Sprachlich-gestische interaktive Manipulation eines 3-d virtuellen Büroraums VIENA

M u l t i m o d a l e S y s t e m e / M E Manipulierbarer virtueller Raum im VIENA-Projekt VIENA

M u l t i m o d a l e S y s t e m e / M E VIENA: offene Eingabe Eingabearchitektur von VIENA

M u l t i m o d a l e S y s t e m e / M E Ziel der multimodalen Eingabearchitektur Entwicklung eines allgemeinen Verfahrens zur Integration Benutzereingaben VIENA: offene Eingabe Ziel der MEA

M u l t i m o d a l e S y s t e m e / M E CARE-Konzept : Entwicklung und Bewertung von den Aspekten der multimodalen Interaktion - CARE wurde entwickelt ca von Coutaz/ Nigay/ Salber am IMAG, Frankreich - Besteht aus einem theoretischen Framework und einer formalen Schreibweise - Bezieht sich auf Ein- und Ausgabe - Beschreibt Relationen zwischen Modalitäten -Die CARE-Properties 1. Komplementarität (Complementary) 2. Zuweisung (Assignment) 3. Redundanz (Redundancy) 4. Äquivalenz (Equivalence) CARE Beschreibung

M u l t i m o d a l e S y s t e m e / M E äquivalente Modalitäten bezüglich eines Zielzustandes CARE Formale Schreibweise

M u l t i m o d a l e S y s t e m e / M E - Welche Eigenschaft dient welchem Ziel? Beispiele: - schnelle Integration durch Äquivalenz ( Tastatur Sprache) - intuitive Bedienung durch Redundanz - VIENA analysiert mit den CARE-Properties CARE Beispiele

M u l t i m o d a l e S y s t e m e / M E CARE Grafische Notation

M u l t i m o d a l e S y s t e m e / M E CARE Die von MEA-unterstützten Eigenschaften(Beispiele)

M u l t i m o d a l e S y s t e m e / M E CARE CARE & Integrationsverfahren

M u l t i m o d a l e S y s t e m e / M E Universität Bielefeld AG Wissensbasierte Systeme (Wachsmuth&Fröhlich) Forschungsfokus – Gestenerkennung für Mensch-Maschine-Schnittstellen - multimodale Integration von Gestik und Sprache Problem: zeitliche Kopplung der Modalitäten Verzögerungen bei der Vorverarbeitung – zeitlich gestreut rhythmische Natur menschlicher Kommunikation neuartige Methode zur Konzeption eines MES Basis – zeitgetaktete Multiagentensystem mit Integration der Sensordaten in einer multimodaler EDS

M u l t i m o d a l e S y s t e m e / M E Gesteneingabe – Nintendo-Datenhandschuh Spracheingabe – Mikrofon Dragon Dictate (Version 1.2b) Spracherkenner VIENA

M u l t i m o d a l e S y s t e m e / M E Instruktionen werden mit gesprochener Sprache eingegeben und durch Zeigegesten ergänzt VIENA

M u l t i m o d a l e S y s t e m e / M E put | this | computer | on | that | table Zeigegeste werden durch Handschuhzeigen auf Objekte oder Positionen eingegeben VIENA

M u l t i m o d a l e S y s t e m e / M E Realisierung der Aufnahme und Verarbeitung der Eingabeinformationen durch multiple Software-Agenten Agent – autonomer Berechnungsprozess Agentur VIENA / MEA

M u l t i m o d a l e S y s t e m e / M E sense-compute-act-Zyklus sense – Aufnahme von Nachrichtendaten compute – Berechnung der jeweiligen Funktion act – Senden technischer Kommandos Das Verarbeitungsmodell von Agentensystemen ist ereignisgetrieben Agentensystem

M u l t i m o d a l e S y s t e m e / M E Architektur der VIENA-System VIENA / Architektur

M u l t i m o d a l e S y s t e m e / M E multimodale Eingabe-Agentur listener (speech, type, gesture) Parser Koordinator Architektur / MEA

M u l t i m o d a l e S y s t e m e / M E Probleme bei der Koordinieren und Integrieren der perzipierten Sprach- und Gesteneingaben Segmentierungsproblem: Wie sind die Prozesseinheiten zu determinieren, die das System in einem Zyklus verarbeitet? Korrespondenzproblem: Wie sind die Querbezüge zwischen den Modalitäten zu determinieren? Integrationsprobleme

M u l t i m o d a l e S y s t e m e / M E Segmentierung 3-Zustands-Rhythmus-Modell (swing-subside-wait) Segmentierung

M u l t i m o d a l e S y s t e m e / M E Segmentierungsprozess 4 Schritte: sense – registriert Nachrichten von listener- Agenten buffer – extrahiert und akkumuliert sie in EDS compute – interpretiert in EDS akkumulierten Daten act – bestimmt Agenten und übergibt die Aufgaben an sie Sense und buffer im Wechsel bis der Zeitzyklus abgeschlossen ist Compute und act – am Ende jeden Zeitzyklus Segmentierung

M u l t i m o d a l e S y s t e m e / M E Korrespondenz compute – Auflösung der Korrespondenzen zwischen verbaler und gestischer Information in der EDS und eine Gesamtaufgabenbeschreibung 2 Fälle: Zeitzyklus-interne Interpretation Zeitzyklusüberspannende Interpretation separate Analyse der Sprach- und Gestenmodalität Berechnung wahrscheinlichsten Korrespondenzen Überprüfung der resultierenden Repräsentation auf Vollständigkeit Korrespondenz

M u l t i m o d a l e S y s t e m e / M E Tatsächliche multimodale Integration – Herstellung der Korrespondenzen zwischen Gestenperzepten und Gestenplätzen innerhalb des 2 sek. Intervals Gestenplatz – zeitgestempelter Informationsplatzhalter, die Spracheingabe ergänzen bilden Ankerpunkte für den Aufbau von Querreferenzen zw. Sprach- und Gestikereignissen zwei Gestenplätze – ein Gestenperzept: die Auflösung durch zeitliche Nähe und den Vergleich der Ambiguitätswerten Integration

M u l t i m o d a l e S y s t e m e / M E Multimodale Benutzung adaptiver Kfz-Bordsysteme zunehmende Komplexität moderner Kfz-Bordsysteme Bedarf an verbesserten MMS Komplexität der Bordsysteme verbergen einfache und intuitive Bedingung ermöglichen Kfz-Bordsystem

M u l t i m o d a l e S y s t e m e / M E Inhalt des Handbuchs in multimedialer Form präsentiert Abfragen von Nachrichten unterschiedlicher Art die Funktionen des Bordsystems sollen mittels Sprache, Gestik und mechanischem Bedienelement angesprochen werden können Kfz-Bordsystem

M u l t i m o d a l e S y s t e m e / M E Statische Einhand-Gesten Ausführung horizontal über den Mittelkonsole Kfz-Bordsystem

M u l t i m o d a l e S y s t e m e / M E Multimodale Systeme/ Ansätze