Einführung in die Objekterkennung im dreidimensionalen Raum

Slides:

Advertisements

Ähnliche Präsentationen

Algorithmen und Datenstrukturen

Advertisements

Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil3.

Einführung in die Informatik: Programmierung und Software-Entwicklung

Vorteile der Online-Produkte

CPCP Institute of Clinical Pharmacology AGAH Annual Meeting, 29. Februar 2004, Berlin, Praktischer Umgang mit den Genehmigungsanträgen gemäß 12. AMG Novelle.

Genetische Algorithmen für die Variogrammanpassung

Modelle und Methoden der Linearen und Nichtlinearen Optimierung (Ausgewählte Methoden und Fallstudien) U N I V E R S I T Ä T H A M B U R G November 2011.

Modelle und Methoden der Linearen und Nichtlinearen Optimierung (Ausgewählte Methoden und Fallstudien) U N I V E R S I T Ä T H A M B U R G November 2011.

Arbeitsbereich Technische Aspekte Multimodaler Systeme Universität Hamburg Fachbereich Informatik Oberseminar TAMS Grundlagen omnidirektionaler Sichtsysteme.

Kombinatorische Topologie in der 3d Geomodellierung

-17 Konjunkturerwartung Europa September 2013 Indikator > +20 Indikator 0 a +20 Indikator 0 a -20 Indikator < -20 Europäische Union gesamt: +6 Indikator.

Scratch Der Einstieg in das Programmieren. Scatch: Entwicklungsumgebung Prof. Dr. Haftendorn, Leuphana Universität Lüneburg,

Dynamik komplexer Systeme

WS Algorithmentheorie 02 - Polynomprodukt und Fast Fourier Transformation Prof. Dr. Th. Ottmann.

© 2006 W. Oberschelp, G. Vossen Rechneraufbau & Rechnerstrukturen, Folie 2.1.

Grundkurs Theoretische Informatik, Folie 2.1 © 2006 G. Vossen,K.-U. Witt Grundkurs Theoretische Informatik Kapitel 2 Gottfried Vossen Kurt-Ulrich Witt.

Theorie soziotechnischer Systeme – 11 Thomas Herrmann Informatik und Gesellschaft FB Informatik Universität Dortmund iundg.cs.uni-dortmund.de.

Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil2.

Vererbung Spezialisierung von Klassen in JAVA möglich durch

PKJ 2005/1 Stefan Dissmann Rückblick auf 2005 Was zuletzt in 2005 vorgestellt wurde: Klassen mit Attributen, Methoden und Konstruktoren Referenzen auf.

PKJ 2005/1 Stefan Dissmann Zusammenfassung Bisher im Kurs erarbeitete Konzepte(1): Umgang mit einfachen Datentypen Umgang mit Feldern Umgang mit Referenzen.

Betreuerin: Kathleen Jerchel

Astronomisch, Physikalische und Mathematische Geodäsie II

Das Keplerproblem (Teil 2)

Das freie Randwertproblem von Stokes

Thorsten Jost INF-M2 – AW1 – Sommersemester Mai 2008

Dieter Bergmann, Lichtenfels

Grundschutztools

Rechneraufbau & Rechnerstrukturen, Folie 12.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 12.

1. 2 Schreibprojekt Zeitung 3 Überblick 1. Vorstellung ComputerLernWerkstatt 2. Schreibprojekt: Zeitung 2.1 Konzeption des Kurses 2.2 Projektverlauf.

Bild 1.1 Copyright © Alfred Mertins | Signaltheorie, 2. Auflage Vieweg+Teubner PLUS Zusatzmaterialien Vieweg+Teubner Verlag | Wiesbaden.

Gebäudeverschneidung 4

SK / , , in Hochkössen und der Wildschönau flow Ski- und Snowboardschule Intersport Menzel.

1 Fachtagung am Seniorenorientiertes Design und Marketing ThyssenKrupp Immobilien Design for all - Anpassungen im Wohnungsbestand 1.Demographie.

in der medizinischen Bildverarbeitung

Gleichungen und Gleichungssysteme

Geg.: Zeichnungsdaten, O Ges.: F´, O´, Strahlengang

NEU! 1 2. Wo kommt diese Art von Rezeptor im Körper vor?

… oder wie finde ich den Weg

Analyse von Ablaufdiagrammen

HORIZONT 1 XINFO ® Das IT - Informationssystem PL/1 Scanner HORIZONT Software für Rechenzentren Garmischer Str. 8 D München Tel ++49(0)89 / 540.

PROCAM Score Alter (Jahre)

Vorlesung Mai 2000 Konstruktion des Voronoi-Diagramms II

Symmetrische Blockchiffren DES – der Data Encryption Standard

PARTENARIAT ÉDUCATIF GRUNDTVIG PARTENARIAT ÉDUCATIF GRUNDTVIG REPERES KULTURELLER ZUSAMMENHALT UND AUSDEHNUNG DER IDEEN AUF EUROPÄISCHEM.

Das IT - Informationssystem

Großer Altersunterschied bei Paaren fällt nicht auf!

Zahlentheorie und Zahlenspiele Hartmut Menzer, Ingo Althöfer ISBN: © 2014 Oldenbourg Wissenschaftsverlag GmbH Abbildungsübersicht / List.

MINDREADER Ein magisch - interaktives Erlebnis mit ENZO PAOLO

Ein Überblick über verschiedene Verfahren

LOD Levels of Detail Oliver Gassner Christian Troger.

1 (C)2006, Hermann Knoll, HTW Chur, FHO Quadratische Reste Definitionen: Quadratischer Rest Quadratwurzel Anwendungen.

Analyseprodukte numerischer Modelle

Pigmentierte Läsionen der Haut

Schutzvermerk nach DIN 34 beachten 20/05/14 Seite 1 Grundlagen XSoft Lösung :Logische Grundschaltung IEC-Grundlagen und logische Verknüpfungen.

Einführung in die Astronomie und Astrophysik I Kapitel III: Das Planetensystem 1 Kapitel III: Das Planetensystem.

Vortrag von Rechtsanwältin Verena Nedden, Fachanwältin für Steuerrecht zur Veranstaltung Wege zum bedingungslosen Grundeinkommen der Piratenpartei Rhein-Hessen.

1 Mathematical Programming Nichtlineare Programmierung.

Ertragsteuern, 5. Auflage Christiana Djanani, Gernot Brähler, Christian Lösel, Andreas Krenzin © UVK Verlagsgesellschaft mbH, Konstanz und München 2012.

Bildergalerie PRESEASON CAMP Juni 2014 Romanshorn Get ready for the Season!

Es war einmal ein Haus

Kompetenztraining Jura Martin Zwickel / Eva Julia Lohse / Matthias Schmid ISBN: © 2014 Walter de Gruyter GmbH, Berlin/Boston Abbildungsübersicht.

1 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt Wie.

Technische Kommunikation

Das IT - Informationssystem

1 Medienpädagogischer Forschungsverbund Südwest KIM-Studie 2014 Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.

Monatsbericht Ausgleichsenergiemarkt Gas – Oktober

Monatsbericht Ausgleichsenergiemarkt Gas – November

CL Tree MW 31.1 Business Intelligence Wintersemester 2015 / 2016 Stanislav Prokupetz.

Präsentation transkript:

Einführung in die Objekterkennung im dreidimensionalen Raum Sind Objektrepräsentation und Segmentierung trennbar? Matthias Krause nach Ruzena Bajcsy, Franc Solina, Alok Gupta

Definition der Vorverarbeitung Jeder geometrische Signalverarbeitungsalgorithmus, der die Daten eines Sensors in eine anwendungsoptimierte Form übersetzt Frühverarbeitungsalgorithmen partitionieren oder segmentieren idealerweise die Rohdaten in geometrische Grundformen, so dass jeder Bilddatenpunkt zu einer geometrisch gedeuteten Gruppe gehört Ziel: Rauschen entfernen, Geometrie erhalten

Range Images - Tiefenbilder

Oberflächengeometrie Vorverarbeitung: Glätten und Entfernen von irrelevanten Daten.

Glättungsverfahren: Mittelwertglättung – linear oder nichtlinear Gute Rauschunterdrückung Abschwächung hoher Ortsfrequenzen Verwischen von Kanten Nichtlinearer Medianfilter Keine Kantenverwischung Rechenaufwand K-nearest-neighbor-Glättung Gute Alternative bei K=5 zur 3x3 Mittelwertglättung

Glättungsverfahren(2) Jede Aufnahme benötigt andere Verfahren Verfahren nicht vergleichbar -> individuell anpassen Bestrebung, von möglichst wenigen Parametern abhängig zu sein

Objekterkennung Beobachtung Modellierung Objekt Objekt Teile Teile Features Features Daten Daten

Objekterkennung – Aufgaben ALV – autonome Land-Fahrzeuge Viele, wahrscheinlich unbekannte Objekte der Natur Industrielle Roboter-Bilderkennung Wenige Objekte an einem Zeitpunkt Dennoch bis zu 150.000 verschiedene Bauteile im Repertoire Industrielle Inspektion Fehlerentdeckung Weltraumanwendungen On Board – gut beschrieben Planetenerforschung Heim- und Dienstroboter Komplexe Umgebung, komplexe Objekte Warenhausroboter Flexible Routen

Objekterkennung – Dimensionen Zahl der Objekte Variabilität der Modelle Komplexität des Hintergrundes Berechnungskomplexität

Einführung 1. Was sind die geometrischen Grundformen, die (möglicherweise eindeutig) die Daten beschreiben? 2. Welche Prozesse ermöglichen die Dekomposition? 3. Was ist die grundlegende Kontrollstrategie, um die gemessenen Daten zu erklären?

Die Rolle von Grundformen Die Welt ist zu komplex, um sie digital zu repräsentieren. Daher muss der visuelle Input auf ein Niveau reduziert werden, welches den jeweiligen Anforderungen genügt. Vereinfachung bedeutet, Bilder in Entitäten zu teilen, die den entsprechenden realen Objekten anwendungsgenügend entsprechen (Prinzip der Sparsamkeit).

Die Rolle von Grundformen (2) müssen Formanalyse ermöglichen Polyeder Kugeln verallgemeinerte Zylinder Superquadriken

Polyeder http://mathworld.wolfram.com/Polyhedron.html

Kugeln http://mathworld.wolfram.com/Sphere.html

Verallgemeinerte Zylinder http://mathworld.wolfram.com/GeneralizedCylinder.html

Superquadriken

Superquadriken(2) Zum Ausprobieren: http://www.gamedev.net/reference/programming/features/superquadric/superquadric.zip

Wahl der Grundform Eine Grundform: einfacher Segmentierungsprozess, aber nicht natürlich Bsp: Eine Gerade aus Kreisstücken darstellen oder umgekehrt Natürliche Grundformwahl: Kombinatorische Explosion -> Limitierung der Anzahl von Grundformen

Einflussfaktoren Manchmal möglich, zu wissen, dass eine bestimmte Klasse von geometrischen Modellen genügt, um die Welt zu beschreiben Lagerverwaltung – aus Kisten, also Quadern Weiß man die Komplexität der Szene, ist eine Vereinfachung der Kontrollstruktur möglich, da das Wissen um die Dimension der Objekte die Wahl des Formmodells vereinfacht

Einflussfaktoren(2) Unterschiedliche Ziele aufsteigender Komplexität Objektvermeidung Objektmanipulation Objektidentifikation

Repräsentationsarten Volumetrische Repräsentation Formbasierte Repräsentation Grenzenbasierte Repräsentation

Volumetrische Repräsentation Liefert umfassende Eigenschaften Gesamtform Klassifizierung der Grundformen nach Länglich, flach, rund, zugespitzt, gebogen oder verdreht

Formbasierte Repräsentation Liefert Details über Oberflächen, die Teile von größeren Volumenkörpern sind Differenziert zwischen flachen oder gebogenen, konkaven gegen konvexe, glatten gegen raue Oberflächen

Grenzenbasierte Repräsentation Repräsentiert die Oberfläche und Biegung nahe der Grenzen Trennt Objekte vom Hintergrund -> definiert dadurch das Objekt

Vereinfachen der Wahl Statt kombinatorischer Suche: Aus den Daten bestimmen, wo welches Modell eingesetzt werden sollte Möglicherweise eine “grob zu fein”-Strategie Ein umfassendes System sollte alle Grundformarten beinhalten

Kriterien der Auswahl von Grundformen Dreidimensional: Superquadriken Zweidimensional: Oberflächengrundformen Eindimensional: Konturgrundformen

Konturgrundformen Nachteile: Vorteile: Zu lokal, um Zusammenhänge zu erkennen Störungsempfindlich gegenüber lokalen Veränderungen Vorteile: Erkennen Konturdetails Beschreiben die globale Form Teilen Objekte auf

Oberflächengrundformen Unstetigkeiten werden als Begrenzungen gezählt Menschliche Wahrnehmung definiert Objekte als Ansammlung von Oberflächen werden Unstetigkeiten als Falten wahrgenommen, sind bessere Objektbeschreibungen möglich

Volumengrundformen Parametrische Modelle sehr beliebt Kompakte Beschreibung (wenige Parameter) komplexer Formen Vorteile von Superquadriken Überall differenzierbar Enthalten eine große Bandbreite von natürlichen Formen Einfach lösbare Parameter

Der Segmentierungsprozess Entscheidung, was zur Segmentierung benötigt wird Zwei Basisstrategien: Grob zu fein, Fein zu grob Beide vor- und nachteilbehaftet, beide benötigt Einteilung nach Repräsentationen ebenfalls möglich

Grob zu Fein Schnelle Abschätzung über Volumen/Grenzen/Oberflächen des Objekts Weitere Verfeinerung bis zum gewünschten Detailgrad Aber: die detektierbaren Details oft nur durch Repräsentationsänderung ermittelbar

Grundidee: Progressives blurring der Bilder klärt die Grobstruktur Details beeinflussen nicht die Grobstruktur, daher kein Backtracking erforderlich

Scale-Space Tiefpassfilter auf verschiedenen Auflösungen erzeugt einen Skalen-Raum Niedrige Skalen beschreiben Details Hohe Skalen beschreiben homogene Regionen

Fein zu Grob Einige Details können beim Klassifizierungsprozess helfen, da sie Objekte ausschließen können Zuviele Details enden in kombinatorischer Explosion

Segmentierung durch volumenbasierte Repräsentanten Binford und Nevatia: Basis = verallgemeinerte Zylinder Solina: Basis = Superquadriken

Solina Gegeben: Tiefenbild Fasse alle Objektpunkte in einem Elipsoid zusammen Minimierung des Ellipsoids: Beziehe rekursiv die Objektpunkte mit ein und finde Parameter, damit die Form die Objektpunkte schneidet oder nahe der Oberfläche ist Problem: mehrere Objekte nicht separierbar

Segmentierung durch Informationen über die Grenzen Basiert auf der Erkennung von Unstetigkeiten in Tiefenwerten und Orientierung Objektpunkte mit ähnlichen Eigenschaften werden verschmolzen Kurvenannäherung kann durchgeführt werden (Splines, etc)

Segmentierung durch Informationen über die Grenzen(2) Verdeckungen (und Unterbrechungen) erkennbar durch Weiterführung der Kurven Ramachandran zeigt: uneindeutige Oberflächeninformationen können durch die Kanteninformationen gelöst werden

Segmentierung durch Oberflächengrundformen Sehr beliebt, da einfacher handhabbar als Volumenkörper Der Prozess beginnt bei lokalen Nachbarschaften und wird ausgedehnt Wasserscheiden-Verfahren Problem: unwichtige lokale Minima Für den Gesamtkontext volumetrische Modelle besser geeignet

Kontrollstruktur Wie sollen die drei Strukturen verwoben werden? Zwei Extrema Parallele Abarbeitung Auftauchen von Konfliktsituationen, die gelöst werden müssen Sequenzielle Abarbeitung Bei Erreichen von „falschen Fährten“ wäre Backtracking nötig

Kontrollstruktur (2) Menschliche Erkennung kann Kanten ergänzen Ziel: Rechnerbasiert muss ein System ebenfalls anpassungsfähig sein

Vorschlag Paralleles Abarbeiten von volumen- und grenzbasierter Segmentierung da gegensätzlich Interaktion zwischen den Methoden zur Kontrolle und Präzisierung von Grenzen/Körpern Oberflächenanalyse für Details Konflikt-Lösungsmöglichkeit für „unsichtbare Kanten“ -> Ermittlung der Unstetigkeitstellen

Kontrollstruktur (3) Muss Verlässlichkeit der Informationen feststellen Muss Teil/Ganzes-Beziehungen entscheiden Braucht viele Parameter -> vorfestgelegt oder im Prozess ermittelt Z.B. Größe(-nbereich) der lokalen Nachbarschaften Größe(-nbereich) der volumetrischen Modelle Anzahl (oder Bereich) der erwarteten Einheiten Schwellenwerte für Partitionierung und Zusammenführung Detailgrad

Zusammenfassung Bei der Bilderkennung gibt es zwei grundlegende Verfahren Objektrepräsentation und Segmentierung Diese sollten zusammen angewendet werden, da sie einander ergänzen können Ein Vorschlag zur Zusammenarbeit wurde vorgestellt: Das Finden von Volumenkörpern wird einschränkend unterstützt durch Kantenfindung Feinere Details werden mittels Oberflächenrepräsentierung gefunden

Quellen: Objekte: Webquellen vom 27.7.2004 EarlyProcessing – EP discussion group Segmentation versus object representation - are they separable? Ruzena Bajcsy, Franc Solina, Alok Gupta Superquadriken http://www.gamedev.net/reference/articles/article1172.asp http://graphics.tu-bs.de/lvcg01-02/Vorlesung1/Superquadriken.pdf Skalenräume http://cyvision.if.sc.usp.br/msskeletons/ http://www.isip.uni-luebeck.de/~metzler/pdf/bvm99-metzler.pdf Segmentierung mit Superquadriken http://www.cs.caltech.edu/~arvo/papers/GenMod.pdf Objekte: http://mathworld.wolfram.com Webquellen vom 27.7.2004