Heinrich Hertz Institut für Nachrichtentechnik Berlin

Slides:



Advertisements
Ähnliche Präsentationen
Google Text & Tabellen - Anleitung
Advertisements

Matrixmultiplikation
Objektbewegungsdetektion in Bildfolgen
1. 2 Untersuchungsdesign Zielgruppe:Bevölkerung ab 14 Jahre Befragungsgebiet:Land Brandenburg Stichprobe:Soll:3.000 Befragte Ist:3.052 Befragte Auswahl:telefonische.
Routing – Routing Protokolle
Webseitenranking für Suchanfragen anhand von Linkgraphen
B-Bäume.
Arbeitsbereich Technische Aspekte Multimodaler Systeme Universität Hamburg Fachbereich Informatik Oberseminar TAMS Grundlagen omnidirektionaler Sichtsysteme.
Untersuchung und szenariobasierte Entwicklung von Websites zur Orientierung in Universitätsstudiengängen unter Berücksichtigung von Prinzipien des Web.
Der Stellenmarkt im Focus
D. Köhn Institut für Geowissenschaften (Abteilung Geophysik), CAU Kiel
Visuell-motorische Adaption unter optischen Transformationen
Lehrstuhl Informatik III: Datenbanksysteme Achim Landschoof 28. April 2009 Strukturierte P2P Systeme 1 Achim Landschoof Betreuerin: Dipl.-Inf. Jessica.
Sortierverfahren Richard Göbel.
Bilder und Rasterdaten
WS Algorithmentheorie 01 – Divide and Conquer (Segmentschnitt) Prof. Dr. Th. Ottmann.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (19 - Analyse natürlicher Bäume) Prof. Th. Ottmann.
Geometrisches Divide and Conquer
Berechnen Sie den Output Vektor wenn der Input Vektor (1,1,-1,-1) ist.
Imperative Programmierung
Erkennung von Gesichtsausdrücken anhand von Bildbewegungen (Irfan Essa & Alex Pentland) Hauptseminar Smart Environments Joachim Biggel
Institut für Kartographie und Geoinformation Diskrete Mathematik I Vorlesung Bäume-
= 4x x nach links, Zahl nach rechts! -2x 4x -2x + 52x – 2x x -2x = 2x – 2x x Zahl 2x= = 2x -15 x = - 10 = 4x + 52x -15 Beispiel.
Thorsten Jost INF-M2 – AW1 – Sommersemester Mai 2008
Datenmanagement in Sensornetzen PRESTO - Feedback gesteuertes Datenmanagement - SS 2007 Sören Wenzlaff.
Wie mache ich Text und Grafiken beweglich?
Intelligentes Crawling im WWW mit Hilfe intuitiver Suchbedingungen
Christian Steinle, Joachim Gläß, Reinhard Männer
Ralf KüstersDagstuhl 2008/11/30 2 Ralf KüstersDagstuhl 2008/11/30 3.
Seminar: Informationstechnik in der Medizin Universität Dortmund Skin Detection Fakultät für Elektrotechnik und Informationstechnik Lehrstuhl für Kommunikationstechnik.
Integration virtueller und realer Objekte Proseminar: Anwendungen für Augmented Reality.
Zeit, Ort und Weg Geschwindigkeit Beschleunigung
Einführung in die Informatik für Naturwissenschaftler und Ingenieure (alias Einführung in die Programmierung) (Vorlesung) Prof. Dr. Günter Rudolph Fachbereich.
Abschlussvortrag zur Studienarbeit
THE NEUROPHYSIOLOGY OF IMITATION AND INTERSUBJECTIVITY
1. Verhalten der Objekte: Operationen Werden in den Klassen definiert Werden (i.d.R.) auf einem Objekt aufgerufen Wird das Empfängerobjekt genannt Weitere.
X y Bild I.
Polynome und schnelle Fourier-Transformation
Prototypical And Immersive Navigator
Apertur-Blende, Linsen und Strahlen
Einführung in die Informatik für Naturwissenschaftler und Ingenieure (alias Einführung in die Programmierung) (Vorlesung) Prof. Dr. Günter Rudolph Fakultät.
Snellius-Brechungsgesetz Die Apertur
Die „Wurfparabel“.
Institut für Hochenergiephysik der Österreichischen Akademie der Wissenschaften 16. December December 2003 Das Experiment CMS am Large Hadron.
Teil 1: Einführung Matlab/Simulink
Vorlesung Mai 2000 Konstruktion des Voronoi-Diagramms II
MOBILE AUGMENTED REALITY
Ein Überblick über verschiedene Verfahren
LOD Levels of Detail Oliver Gassner Christian Troger.
Beleuchtungsmodelle, Schattierungsmodelle
Getting started: das Weltfenster von Kara
1 Zukunftsfaktor Wissen Perspektiven für wissensintensive Unternehmen und hoch qualifizierte Fachkräfte in der Region Osnabrück-Emsland Pressegespräch.
Integration oberflächenbestimmender Objekte ins DGM Seminar GIS IV SS
Augmented Reality mit korrekter Beleuchtung Thorsten Grosch
01-1-Anfang. 01a-1-Vortrag-Inhalt 14-4-Gründe-Masterplan.
Der Ablauf eines Motion Capture - Prozesses
Reusable Content SS 2013 Einstimmung Manfred Thaller Köln, 11. April 2013.
Massenmittelpunkt, „Schwerpunkt“
Roboter-Fußball: Die RoboCup- Initiative Prof. Dr. Raúl Rojas Freie Universität Berlin mit freundlicher Unterstützung von Prof. Bernhard Nebel Albert-Ludwigs-Universität.
Vom Neuron bis zur Boltzmann Maschine Miguel Domingo & Marco Block Seminar : Maschinelles Lernen und Markov KettenSommersemester 2002.
Grundlagen der Positionsbestimmung mit Partikelfiltern
der WKW Erste Schritte im Datenbank-Infosystem (DBIS)
Datamining Ähnlichkeitssuche auf Zeitreihen Bernd Puchinger FernUniversität in Hagen.
Niko Zenker1 Besondere Aspekte in Multimedia-Datenbanken Methoden zur iterativen Anfrageverfeinerung (Relevanz Feedback)
Zusammenfassung. Ebenen der Modellierung Geoobjekte und ihre Modellierung II Ebenen der Modellierung Konzeptionelle Modellierung –Entity-Relationship.
Spärliche Kodierung von Videos natürlicher Szenen Vortragender: Christian Fischer.
SEMINARVORTRAG, AACHEN, RUBEN SCHWARZWALD Grundlagen der Kameragestützten Objekterkennung in Echtzeit Betreuer: Prof. Dr. Walter Hillen Dipl.-Ing.
1 © 2012 SOASTA. All rights reserved. Webinar. 2 © 2012 SOASTA. All rights reserved. Erste Schritte mit CloudTest Lite 1.CloudTest Lite einrichten 4GB.
iem.kug.ac.at Konzepte für virtuelle Akustik Theoretische Betrachtungen Alois Sontacchi Institute of Electronic Music and Acoustics at the University.
 Präsentation transkript:

Schneller hybrider Disparitätsschätzer für ein 3D-Echtzeit-Videokonferenzsystem Heinrich Hertz Institut für Nachrichtentechnik Berlin Nicole Brandenburg and Serap Askar

Überblick 3D-Echtzeit-Videokonferenzsystem Konzept der Disparitätsschätzung Struktur des schnellen hybriden Disparitätsschätzers Nachverarbeitung Ergebnisse Zusammenfassung

Steuerung der virtuellen Kamerabewegung durch Head Tracking 3D Echtzeit-Videokonferenzsystem Konferenzteilnehmer an verschiedenen Orten Virtuelle Kamera Bewegungs-Parallaxe Steuerung der virtuellen Kamerabewegung durch Head Tracking Virtual Scene Display produce an accurate and correct perspective view of the presented conferee This slide shows the idea of a 3-way video conferencing system The three conferees in the virtual scene are placed around a round table. In contrast to the slide I showed at the beginning, there is only one local conferee which sits in front of the display and two remote conferees which appear in the display. The position of the virtual camera shows the viewpoint of the local conferee. If the local conferee moves his head the virtual camera changes and the virtual scene and the two remote conferees are viewed from a different angle. This so called motion parallax gives the impression of a 3D scene though it is a 2D display. The calculation of the virtual views of the remote conferees is an important task in the VIRTUE project. I now want to show a mock-up of the VIRTUE demonstrator.

3D Echtzeit-Videokonferenzsystem Synthese einer virtuellen Ansicht ?

Hautfarben-Segmentierung Konzept der Disparitätsschätzung linkes Bild rechtes Bild Rektifikation Rektifikation Hautfarben-Segmentierung Hybrider rekusiver Disparitätschätzer Konsistenztest Segmentgestützte Nachverarbeitung Segmentgestützte Nachverarbeitung Segmentgestützte Interpolation Segmentgestützte Interpolation L -> R Disparität R -> L Disparität

Struktur des hybriden Disparitätsschätzers Update- Vektor Pixel-rekursion Auswahl der besten Disparität Disparitäts-vektor Start-Vektor linkes Bild Block-rekursion Disparitäts-speicher rechtes Bild 3 Kandidaten

Block-Rekursion 3 Kandidaten werden getestet vertikal zeitlich horizontal Vorgängerbild aktuelles Bild Keine Definition eines Suchbereichs um die Kandidaten Auswahl des besten Kandidaten mittels DBD

Struktur des hybriden Disparitätsschätzers Update- Vektor Pixel-rekursion Auswahl der besten Disparität Disparitäts-vektor Start-Vektor linkes Bild Block-rekursion Disparitäts-speicher rechtes Bild 3 Kandidaten

Pixel-Rekursion Initialisierung von zwei pixel-rekursiven Prozessen Berechnung der Update-Vektoren mit Hilfe des optischen Flusses Auswahl des besten Update-Vektors anhand der DPD update vector d incremental update initial vector d Start-Vektor

Struktur des hybriden Disparitätsschätzers Update- Vektor Pixel-rekursion Auswahl der besten Disparität Disparitäts-vektor Start-Vektor linkes Bild Block-rekursion Disparitäts-speicher rechtes Bild 3 Kandidaten

Ergebnisse des HRM Große Verdeckungen ! Falsche Disparitäten ! Originalbilder Falsche Disparitäten ! L->R R->L Disparitäten

Konsistenztest Vergleich der L->R und R->L Disparitäten Ersetzen der unzuverlässigen Disparitäten Hier die schlechte Interpolation überblenden

Segmentierung der Hände mittels Hautfarbe Segmentierung innerhalb der Bounding Boxen Tracking der Bounding Boxen Unterabtastung Hautfarbensegmentierung mit Region Growing Tracken der Bounding Boxen Bounding Boxen

Segmentgestützte Nachverarbeitung Verwendung von Disparitäten des gleichen Objekts Disparitäten Handmaske Disparitäten Handmaske Disparitätssprünge bleiben erhalten Handmasken + gute Interpolation

Dense Field Interpolation Segmentgestütztes Interpolieren der Disparitäten sparse field 4x4 dense field

Experimentelle Ergebnisse ohne Nachverarbeitung Einfache Nachverarbeitung Segmentgestützte Nachverarbeitung

Experimentelle Ergebnisse ohne Nachverarbeitung einfache Nachverarbeitung segmentgestützte Nachverarbeitung

Rechenzeiten für ITU-Rec. 601, 25 Hz, 1:1 Pentium III, 700 MHz Rastergröße aktuell Ziel 4x4 87 ms < 40 ms 8x8 22 ms ---- Zeiten enthalten: a) unabhängige L  R and R  L Schätzung b) Konsistenztest c) Interpolation der unzuverlässigen Disparitäten The VIRTUE (VIRtual Team User Environment) consortium consists of two leading industry corporations, two internationally renowned research institutes, and two Universities with highly respected research capabilities.

Zusammenfassung Schneller hybrider Disparitätsschätzer Blockrekursion : Auswahl aus drei Kandidaten Pixelrekursion : Nutzung des optischen Flusses Nachverarbeitung Verwerfen unzuverlässiger Disparitäten Segmentgestütztes Füllen der Löcher Segmentgestützte Dense Field Berechnung Echtzeitfähigkeit Echtzeitfähig für ein 8x8 Grid, optimierbar für 4x4

Ende