Optische Kopfhaltungserkennung im Auto als Wissensquelle für multimodale Mensch-Maschine- Schnittstellen Chakib Bensajjay Erstgutachter: Prof. Dr. Dr.

Slides:



Advertisements
Ähnliche Präsentationen
Der Kopf und das Gesicht
Advertisements

E-Commerce Shop System
Fakultät für Elektrotechnik und Informationstechnik Fachbereich Elektronische Schaltungen und Systeme Technische Universität Ilmenau Jet-Extraktion für.
Aufbau des Internets Überblick Prof. Dr. T. Hildebrandt
Inhaltlich orientierter Zugriff auf unstrukturierte Daten
8 Behandlung von Begriffen 8.1 Grundlagen aus Logik und Psychologie
Arbeitsbereich Technische Aspekte Multimodaler Systeme Universität Hamburg Fachbereich Informatik Oberseminar TAMS Grundlagen omnidirektionaler Sichtsysteme.
Christian A. Kopf Institut für Informatik FU Berlin Episode Recognizer Framework - Rahmenwerk zur Episodenerkennung.
Grundlagen der Geometrie
Anwendungsverteilung und räumliche Ausdehnung
FB Informatik Prof. Dr. R.Nitsch Programmieren 2 Future Car Projekt Reiner Nitsch
Web Usability Ein Internetauftritt muss bestimmten Anforderungen gerecht werden, um für den Betrachter benutzerfreundlich zu sein. Die Darbietung der Inhalte.
FH-Hof Effizienz - Grundlagen Richard Göbel. FH-Hof Inhalt Einführung Aufwand für Anfragen ohne Indexierung Indexstrukturen für Anfragen an eine Tabelle.
FH-Hof Georeferenzieren Richard Göbel. FH-Hof Geographische Positionen in Bilddaten Bilddaten werden von Kameras (Sensoren): auf Flugzeugen oder auf Satelliten.
Indoor Navigation Performance Analysis
Vorlesung: Betriebssysteme © 2002 Prof. Dr. G. Hellberg 1 Studiengang Informatik FHDW Vorlesung Betriebssysteme 3. Quartal 2002.
Erkennung von Gesichtsausdrücken anhand von Bildbewegungen (Irfan Essa & Alex Pentland) Hauptseminar Smart Environments Joachim Biggel
Projekt A4: Alignment of Situation Models Gert Rickheit Sven Wachsmuth Constanze Vorwerg Agnes Swadzba SFB-Kolloqium,
Sonne, Mond und Erde – Wo kein Licht ist, da ist Schatten
Dieter Bergmann, Lichtenfels
Übung zum Thema Architektur
Arbeitsberatung der ITG Fachgruppe Dirk Albrecht Ilmenau, Fakultät für Elektrotechnik und Informationstechnik Fachbereich Elektronische.
Forschungszentrum Informatik, Karlsruhe Objektorientierte Systeme unter der Lupe Markus Bauer Oliver Ciupke.
Seminar: Informationstechnik in der Medizin Universität Dortmund Skin Detection Fakultät für Elektrotechnik und Informationstechnik Lehrstuhl für Kommunikationstechnik.
Semantic Media Showcase – Universität Potsdam
SEP Mimikerkennung in Videobildern
Topologische Navigation: Der Routengraph
Evaluierung des ITU-T.124 Telekonferenzstandards
Antragspaket Außenbereichsrobotik Folie 1 Prof. Dr.-Ing. B. Wagner Umgebungsmodelle mit dynamischer Annotation auf der Basis von in Echtzeit erfassten.
Spezifikation von Anforderungen
Lommy® SAFE Individuelles Überwachen von Fahrzeugen und Gütern.
Vortrag D. Braun, Praktikum. Übersicht Pleopatra API Pleopatra Tools Twitter Demonstration Ausblick.
Person Tracking A Multiple Hypothesis Approach Michael Huber.
Unified Modeling Language Repetition / Einführung zu UML
Wissensmanagement der Firma BIRO
Minh Bui 14. März 2013 Mobile Visualization in SenseDroid Diplomarbeit Minh Bui, # 1 of 16 Aufgabensteller: Prof. Dr. Andreas Butz Betreuer:
Aichinger Christian, Strasser Jürgen. Inhalt JSF EJB Praxis - Integration.
Project Perseus Der volle Projektname lautet Perseus Digital Library Project. Das Projekt begann in 1985 als Experiment zur Digitalisierung von Bibliotheken.
Modellieren dynamischer Prozesse
Allgemeines zu Datenbanken
Silvia Schlagnitweit Betreuer: a. Univ.-Prof. Dr. Franz Hackl
Leitprojekt e³-Produktion
Replikation und Synchronisation
Ein Überblick über verschiedene Verfahren
Boga Abschlusspräsentation
Entwurf eines sicheren Fernwartsystems für Automobilsoftware Philip Weber Stefan Trienen.
Klassifikation und Regression mittels neuronaler Netze
Autoren Folie 1 ObjectTracer Abschlussprojekt der Vorlesung Virtuelle Realität an der Fachhochschule Heilbronn im Wintersemester 2003/04 Laszlo Szabo
Multimediapraktikum SS07 Vision-Based Motion Analysis Handgestenerkennung.
Die Management-Tools von Z&H COACH beinhalten zentrale Hilfsmittel für ein Management-System. Sorgfältig angewendet führen diese Tools Ihr Unternehmen.
Der Ablauf eines Motion Capture - Prozesses
2. April 2015Solveigh Matthies BioRem als FESA3-Klasse BioRem-Ansteuerung mit einer FESA3- Klasse Sinn&Zweck Funktionialit ä t Implementierung.
Möglichkeiten der Visualisierung
Eingereicht von:Michael Schrank Betreuung:o.Univ.-Prof. Dr. Hanspeter Mössenböck Mitbetreuung:Dipl.-Ing. Wolfgang Beer CyberStudent A Multiuser Awareness.
Gesichtsdetektion in digitalen Einzelbilder
ArcView als SDE - Client SDE Client inklusive! ArcViewGIS: ArcView GIS: Michael Jacobi ESRI GmbH ESRI EUROPEAN USER CONFERENCE.
Positioning in mobile Ad-Hoc Networks Analysis of Quantization-Effects in Distributed Positioning-Algorithms in Mobile Ad-Hoc Networks Semester Arbeit.
Entwurf eines sicheren Fernwartsystems für Automobilsoftware Stefan Trienen Philip Weber.
Prof. Dr. Ludwig Nastansky University of Paderborn Wirtschaftsinformatik 2 – FB 5 Prof. Dr. Ludwig Nastansky Warburger Straße 100, Paderborn Tel.:
DaimlerChrysler Workshop Architektur HyperbolicModeler  Notes Client  Notes native Java Klassen  Mehr Informationen über Design  Zugriff auf Dokumente.
- Studienarbeit - Entwurf und Umsetzung von kombinierten Anfragen für die Ähnlichkeitssuche auf digitalen Bilder auf der Basis von Regionen und Features.
Projekt A4: „Alignment of Situation Models“ Dr. Gerd Rickheit Dr. Sven Wachsmuth Dr. Constanze Vorwerg Agnes Swadzba SFB-Kolloqium,
Ab jetzt können Sie kreuzweise … Wolfsburg, Michael Rother.
Bachelorkolloquium – Thema:
EIN NEUES ENSEMBLE- KLASSIFIKATIONSVERFAHREN Tim Schneider Rotation Forest.
Technische Universität München, Informatik XI Angewandte Informatik / Kooperative Systeme Praktikum Mobile Web 2.0 – 2.Teil Wolfgang Wörndl, Robert Eigner.
Rechen- und Kommunikationszentrum (RZ) Entwicklung einer Web- Oberfläche mit Apache Wicket am Beispiel des IdentityAdmins Seminarvortrag Melanie.
Ein Projekt in Zusammenarbeit des Mechatronics Engineering Labors und des Studiengangs Technik Management Ein Projekt in Zusammenarbeit des Mechatronics.
1. Betreuer: Prof. Dr. Jörg Striegnitz 2. Betreuer: Dr. Martin Schindler Kontextsensitive Autocompletion für Klassendiagramme in der UML/P Florian Leppers.
Motion Capture Systeme
 Präsentation transkript:

Optische Kopfhaltungserkennung im Auto als Wissensquelle für multimodale Mensch-Maschine- Schnittstellen Chakib Bensajjay Erstgutachter: Prof. Dr. Dr. h.c. mult. Wolfgang Wahlster Zweitgutachter: Dr.-Ing. Christian Müller Betreuer: Dipl.-Inform. Michael Feld

1 Einführung 3 Wiss. Fragestellung 2 Adaptive Systeme 6 Bildakquisition (Framework) 7 Evaluation 5 Kopfhaltungsanalyse Optische Kopfhaltungserkennung im Auto als Wissensquelle für multimodale Mensch-Maschine-Schnittstellen 8 Zusammenfassung 4 Kamera basierte Verfahren

1 Einführung 3 Wiss. Fragestellung 6 Bildakquisition (Framework) 7 Evaluation 5 Kopfhaltungsanalyse Optische Kopfhaltungserkennung im Auto als Wissensquelle für multimodale Mensch-Maschine-Schnittstellen 8 Zusammenfassung 4 Kamera basierte Verfahren 2 Adaptive Systeme

1 Einführung 2 Adaptive Systeme 6 Bildakquisition (Framework) 7 Evaluation 5 Kopfhaltungsanalyse Optische Kopfhaltungserkennung im Auto als Wissensquelle für multimodale Mensch-Maschine-Schnittstellen 8 Zusammenfassung 4 Kamera basierte Verfahren 3 Wiss. Fragestellung

1 Einführung 3 Wiss. Fragestellung 2 Adaptive Systeme 6 Bildakquisition (Framework) 7 Evaluation 5 Kopfhaltungsanalyse Optische Kopfhaltungserkennung im Auto als Wissensquelle für multimodale Mensch-Maschine-Schnittstellen 8 Zusammenfassung 4 Kamera basierte Verfahren

1 Einführung 3 Wiss. Fragestellung 2 Adaptive Systeme 6 Bildakquisition (Framework) 7 Evaluation Optische Kopfhaltungserkennung im Auto als Wissensquelle für multimodale Mensch-Maschine-Schnittstellen 8 Zusammenfassung 4 Kamera basierte Verfahren 5 Kopfhaltungsanalyse

1 Einführung 3 Wiss. Fragestellung 2 Adaptive Systeme7 Evaluation 5 Kopfhaltungsanalyse Optische Kopfhaltungserkennung im Auto als Wissensquelle für multimodale Mensch-Maschine-Schnittstellen 8 Zusammenfassung 4 Kamera basierte Verfahren 6 Bildakquisition (Framework )

1 Einführung 3 Wiss. Fragestellung 2 Adaptive Systeme 6 Bildakquisition (Framework) 5 Kopfhaltungsanalyse Optische Kopfhaltungserkennung im Auto als Wissensquelle für multimodale Mensch-Maschine-Schnittstellen 8 Zusammenfassung 4 Kamera basierte Verfahren 7 Evaluation

1 Einführung 3 Wiss. Fragestellung 2 Adaptive Systeme 6 Bildakquisition (Framework) 7 Evaluation 5 Kopfhaltungsanalyse Optische Kopfhaltungserkennung im Auto als Wissensquelle für multimodale Mensch-Maschine-Schnittstellen 4 Kamera basierte Verfahren 8 Zusammenfassung

 Forschungsziele: Verbesserte Sicherheit und Komfort im Automobilbereich  Mensch-Maschine-Interaktion  Adaptive Systeme  Sensoren als Wissensquelle  Kameras

 Indikator für Aufmerksamkeit  Blickrichtung  Nicht-intrusive Akquisition  Speicherung in zentraler Wissensbasis  ADAPTION Als Eingabemodalität ◦ Blickgesteuerte Interaktion

 Möglichst viele Bildinformationen Sammeln  Bildanalyse und Anforderung  Abhängigkeit von:  Kameraeigenschaften  Vorwissen  System für Kamera Ansteuerung  Bildsequenz und Informationen über Kameras für die Analyse zur Verfügung stellen.

1 Einführung 3 Wiss. Fragestellung 6 Bildakquisition (Framework) 7 Evaluation 5 Kopfhaltungsanalyse Optische Kopfhaltungserkennung im Auto als Wissensquelle für multimodale Mensch-Maschine-Schnittstellen 8 Zusammenfassung 4 Kamera basierte Verfahren 2 Adaptive Systeme

 Von adaptierbaren zu adaptiven Systeme  System kann selbständig an neue Bedingungen angepasst werden.  bessere Szeneninterpretation  Wissen über den Benutzer sammeln  Benutzermodell aufbauen  Adaption

System Mimik Sprache Gestik Graphics Audio-Signal

Benutzer-Kontext Fahrer dreht sich nach rechts Interaktions-Kontext Der Zustand dauert für bestimmtes Zeitintervall !! System-Aktion Warnsignal wird ausgelöst

Benutzer-Kontext Der Beifahrer schaut zum Fenster Interaktions-Kontext Momentan ist ein touristisches Denkmal zu sehen System-Aktion Informationen über das Denkmal werden ausgegeben

Benutzer-Kontext Der Fahrer gibt einen Sprachbefehl: „Fenster schließen“ Interaktion-Kontext Der Fahrer schaut nach rechts System Aktion Fenster rechts wird geschlossen Fenster schließen

1 Einführung 2 Adaptive Systeme 6 Bildakquisition (Framework) 7 Evaluation 5 Kopfhaltungsanalyse Optische Kopfhaltungserkennung im Auto als Wissensquelle für multimodale Mensch-Maschine-Schnittstellen 8 Zusammenfassung 4 Kamera basierte Verfahren 3 Wiss. Fragestellung

 Welche kamera-basierten Verfahren sind zur Erfassung wesentlicher Zustandseigenschaften des Fahrers geeignet?  Wie gut lässt sich die Kopfhaltung des Fahrers/Benutzers bestimmen?  Wie kann eine universelle Architektur zur Ansteuerung von Kameras im Fahrzeug aussehen?

1 Einführung 3 Wiss. Fragestellung 2 Adaptive Systeme 6 Bildakquisition (Framework) 7 Evaluation 5 Kopfhaltungsanalyse Optische Kopfhaltungserkennung im Auto als Wissensquelle für multimodale Mensch-Maschine-Schnittstellen 8 Zusammenfassung 4 Kamera basierte Verfahren

Aktueller Zustand. Frontalansicht. Seitenansicht. Augenzustand (auf/zu). Mund (auf/zu/ Form) Schlussfolgerung.Blickrichtung.Ablenkung.Müdigkeit.Wachsamkeit.Emotion Bildanalyse (Merkmalsextraktion)

Müdigkeit

Lidschlagrate

Müdigkeit Lidschlagrate Augenzustand (zu / Auf)

Müdigkeit Lidschlagrate Augenzustand (zu / Auf) Augenbereich lokalisieren

Müdigkeit Lidschlagrate Augenzustand (zu / Auf) Augenbereich lokalisieren Gesicht lokalisieren

Müdigkeit Lidschlagrate Augenzustand (zu / Auf) Augenbereich lokalisieren Gesicht lokalisieren Bild

Müdigkeit Lidschlagrate Augenzustand (zu / Auf) Augenbereich lokalisieren Gesicht lokalisieren Bild Vorwissen

Müdigkeit Lidschlagrate Augenzustand (zu / Auf) Augenbereich lokalisieren Gesicht lokalisieren Bild Vorwissen Merkmale

Müdigkeit Lidschlagrate Augenzustand (zu / Auf) Augenbereich lokalisieren Gesicht lokalisieren Bild Vorwissen Merkmale

 Nicht-intrusive Analyse  Intrusive Analyse

Holistische und analytische Verfahren  Holistische Verfahren  Bild wird als Ganzes betrachtet  Vortrainierte Daten zur Erstellung von Klassifikatoren  Adaboost  Support Vector Machine  Neural Network  Meistens für die Wiedererkennung des Gesichts oder relevante Bildregionen verwendbar  Aufwändige Datenvorbereitung

 Analytische Verfahren ( Merkmalsbasierte Verfahren)  Extraktion relevanter Merkmale zur Gesichtsfindung  Kanten  Farbe  Position der Augen  Mund  Nase  Augenbrauen  Landmarken

1 Einführung 3 Wiss. Fragestellung 2 Adaptive Systeme 6 Bildakquisition (Framework) 7 Evaluation Optische Kopfhaltungserkennung im Auto als Wissensquelle für multimodale Mensch-Maschine-Schnittstellen 8 Zusammenfassung 4 Kamera basierte Verfahren 5 Kopfhaltungsanalyse

Erkennung der Kopfhaltung Augenbereich lokalisieren Gesicht lokalisieren Bild  Kodierung möglicher Kopfhaltungen (statische Analyse)  3D Modell erstellen (Geometrie des Gesichts)

 Grobe Schätzung der Kopfhaltung  Information über die Richtung der Kopfhaltung ( nach links/rechts, nach oben/unten)  Berechnung der Kopfhaltungswinkel  horizontaler / vertikaler Drehwinkel

Kopfhaltung Berechnung der Kopfhaltungswinkel Neue Merkmalen statt Augenerkennung Gesichtsfindung Bild Grobe Schätzung der Kopfhaltung

 Welche relevante Merkmale kann man extrahieren ?  Geometrie des Gesichts  Hautfarbe  Gesichtsregionen (Augen, Mund, Nase …)

 Welche relevante Merkmale kann man extrahieren ?  Geometrie des Gesichts  Hautfarbe  Gesichtsregionen (Augen, Mund, Nase.. )  Aufwändig ( höherer Rechenaufwand )

 Farbmodell  RGB, Ycbcr, HSV  Welches Threshold-Intervall ist zur Hautsegmentierung und Hintergrundextrahierung geeignet ?

H Darstellung CR Darstellung V Darstellung

H Darstellung CR Darstellung V Darstellung Gesichtsdetail bewahren

H Darstellung CR Darstellung V Darstellung Hintergrund entfernen Gesichtsdetail bewahren

H Darstellung CR Darstellung V Darstellung Hintergrund entfernen Gesichtsdetail bewahren Suche nach Hautfarbe Region

H Darstellung CR Darstellung V Darstellung Hintergrund entfernen Gesichtsdetail bewahren Suche nach dem gesamten Gesicht Suche nach Hautfarbe Region

Extraktion der Hautregion Gesichtsfindung

Extraktion der Hautregion

Gesichtsfindung Startpunkt für die Suche nach der Gesichtskontur

Kopfhaltung Berechnung der Kopfhaltungswinkel Neue Merkmalen statt Augenerkennung Gesichtsfindung Bild Grobe Schätzung der Kopfhaltung

 Kann man die Richtung der Kopfhaltung direkt aus der Geometrie des Gesichts ableiten ?

Gesicht durch Rechtecke modellieren Position des Gesichts Seitenverhältnis Position (x, y)

Horizontale Drehung Position X

Vertikale Drehung Position Y

Kopfhaltung Berechnung der Kopfhaltungswinkel Neue Merkmale statt Augenberereich Gesichtsfindung Bild Grobe Schätzung der Kopfhaltung (X,Y)

 Vorhandene Modelle  Kodierung der unterschiedlichen Kopfhaltungen  Verwendung von Gesichtsmerkmalen  Augen/Mund/Nase

 Abstandspunkte- statt Augenerkennung. Abstandspunkte

Horizontaler Winkel Vertikaler Winkel

1 Einführung 3 Wiss. Fragestellung 2 Adaptive Systeme7 Evaluation 5 Kopfhaltungsanalyse Optische Kopfhaltungserkennung im Auto als Wissensquelle für multimodale Mensch-Maschine-Schnittstellen 8 Zusammenfassung 4 Kamera basierte Verfahren 6 Bildakquisition (Framework )

 Client/ Server Modell ◦ Bilddaten im Netzwerk für verschiedenen Bildanalyse zur Verfügung stellen ◦ Information über an das System angeschlossene Kameras  Zugriff auf Kameras ◦ Java Media Framework (JMF)  Datenübertragung  TCP  Steuerungskanal  Datenkanal

1 Einführung 3 Wiss. Fragestellung 2 Adaptive Systeme 6 Bildakquisition (Framework) 5 Kopfhaltungsanalyse Optische Kopfhaltungserkennung im Auto als Wissensquelle für multimodale Mensch-Maschine-Schnittstellen 8 Zusammenfassung 4 Kamera basierte Verfahren 7 Evaluation

 Gesichtserkennung ◦ Farbe ◦ Helligkeit, Schatten, Autoumgebung.  Erkennung der Abstandspunkte ◦ Verdeckung (Occlusion)  Modell zur Berechnung der Winkel ◦ Geometrie des Gesichts.

 Gesichtserkennung ◦ Farbe ◦ Helligkeit, schatten, Auto Umgebung.  Erkennung der Abstandspunkte ◦ Verdeckung (Occlusion)  Modell zur Berechnung der Winkel ◦ Geometrie des Gesichts.

 Testdurchführung  Helligkeit und Schatten  In Autoumgebung (Fahrersitzplatz, Rücksitzplatz)  Kameraplatzierung (frontale Aufnahme)  3 Bildsequenzen:  Bildsequenzen 1 und 2: Höhere und niedrige Helligkeit  Bildsequenz 3: Schatten vorhanden

( 3,-72°) (0,-45° ) (0°, 0°) (0,34°) (-8°,45°) (34°,U)

(0°,-75° ) (0°,-64°) (0°, 0°) (18°,20) (25°,46°) (90°,0°)

 Abweichung zur tatsächlicher Kopfhaltung  Testdaten: ◦ (110) Bilder aus Datensatz (Pointing 04 Database) ◦ 2 Klassen :  Horizontaler Drehungswinkel  {-90, -75,-60,-45,-30,-15, 0,15, 30, 45, 60,75,90 }  Vertikaler Drehungswinkel  { -90,-60,-30,-15, 0,15,30, 60, 90 }

 Gut  <15°  Fast 15°-20 °  Fehlerhaft  >20°

1 Einführung 3 Wiss. Fragestellung 2 Adaptive Systeme 6 videBildakquisition (Framework) 7 Evaluation 5 Kopfhaltungsanalyse Optische Kopfhaltungserkennung im Auto als Wissensquelle für multimodale Mensch-Maschine-Schnittstellen 4 Kamera basierte Verfahren 8 Zusammenfassung

 Kameraeinsatz in Fahrzeugen  Einsatz der Kopfhaltung in multimodalen und adaptiven Systeme  Kopfhaltungsanalyse ◦ Gesichtsfindung (Hautfarbe ) ◦ Manipulation der Hue-und Chrominanzfarben ◦ Neue Merkmale und Modell zur Berechnung der Drehwinkel (Abstandspunkte)  Framework für Bild- und Videoakquisition

Vielen Dank für Ihre Aufmerksamkeit !