Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
Veröffentlicht von:Adelheit Lange Geändert vor über 10 Jahren
1
Einführung in die Objekterkennung im dreidimensionalen Raum
Sind Objektrepräsentation und Segmentierung trennbar? Matthias Krause nach Ruzena Bajcsy, Franc Solina, Alok Gupta
2
Definition der Vorverarbeitung
Jeder geometrische Signalverarbeitungsalgorithmus, der die Daten eines Sensors in eine anwendungsoptimierte Form übersetzt Frühverarbeitungsalgorithmen partitionieren oder segmentieren idealerweise die Rohdaten in geometrische Grundformen, so dass jeder Bilddatenpunkt zu einer geometrisch gedeuteten Gruppe gehört Ziel: Rauschen entfernen, Geometrie erhalten
3
Range Images - Tiefenbilder
4
Oberflächengeometrie
Vorverarbeitung: Glätten und Entfernen von irrelevanten Daten.
5
Glättungsverfahren: Mittelwertglättung – linear oder nichtlinear
Gute Rauschunterdrückung Abschwächung hoher Ortsfrequenzen Verwischen von Kanten Nichtlinearer Medianfilter Keine Kantenverwischung Rechenaufwand K-nearest-neighbor-Glättung Gute Alternative bei K=5 zur 3x3 Mittelwertglättung
6
Glättungsverfahren(2)
Jede Aufnahme benötigt andere Verfahren Verfahren nicht vergleichbar -> individuell anpassen Bestrebung, von möglichst wenigen Parametern abhängig zu sein
7
Objekterkennung Beobachtung Modellierung Objekt Objekt Teile Teile
Features Features Daten Daten
8
Objekterkennung – Aufgaben
ALV – autonome Land-Fahrzeuge Viele, wahrscheinlich unbekannte Objekte der Natur Industrielle Roboter-Bilderkennung Wenige Objekte an einem Zeitpunkt Dennoch bis zu verschiedene Bauteile im Repertoire Industrielle Inspektion Fehlerentdeckung Weltraumanwendungen On Board – gut beschrieben Planetenerforschung Heim- und Dienstroboter Komplexe Umgebung, komplexe Objekte Warenhausroboter Flexible Routen
9
Objekterkennung – Dimensionen
Zahl der Objekte Variabilität der Modelle Komplexität des Hintergrundes Berechnungskomplexität
10
Einführung 1. Was sind die geometrischen Grundformen, die (möglicherweise eindeutig) die Daten beschreiben? 2. Welche Prozesse ermöglichen die Dekomposition? 3. Was ist die grundlegende Kontrollstrategie, um die gemessenen Daten zu erklären?
11
Die Rolle von Grundformen
Die Welt ist zu komplex, um sie digital zu repräsentieren. Daher muss der visuelle Input auf ein Niveau reduziert werden, welches den jeweiligen Anforderungen genügt. Vereinfachung bedeutet, Bilder in Entitäten zu teilen, die den entsprechenden realen Objekten anwendungsgenügend entsprechen (Prinzip der Sparsamkeit).
12
Die Rolle von Grundformen (2)
müssen Formanalyse ermöglichen Polyeder Kugeln verallgemeinerte Zylinder Superquadriken
13
Polyeder
14
Kugeln
15
Verallgemeinerte Zylinder
16
Superquadriken
17
Superquadriken(2) Zum Ausprobieren:
18
Wahl der Grundform Eine Grundform: einfacher Segmentierungsprozess, aber nicht natürlich Bsp: Eine Gerade aus Kreisstücken darstellen oder umgekehrt Natürliche Grundformwahl: Kombinatorische Explosion -> Limitierung der Anzahl von Grundformen
19
Einflussfaktoren Manchmal möglich, zu wissen, dass eine bestimmte Klasse von geometrischen Modellen genügt, um die Welt zu beschreiben Lagerverwaltung – aus Kisten, also Quadern Weiß man die Komplexität der Szene, ist eine Vereinfachung der Kontrollstruktur möglich, da das Wissen um die Dimension der Objekte die Wahl des Formmodells vereinfacht
20
Einflussfaktoren(2) Unterschiedliche Ziele aufsteigender Komplexität
Objektvermeidung Objektmanipulation Objektidentifikation
21
Repräsentationsarten
Volumetrische Repräsentation Formbasierte Repräsentation Grenzenbasierte Repräsentation
22
Volumetrische Repräsentation
Liefert umfassende Eigenschaften Gesamtform Klassifizierung der Grundformen nach Länglich, flach, rund, zugespitzt, gebogen oder verdreht
23
Formbasierte Repräsentation
Liefert Details über Oberflächen, die Teile von größeren Volumenkörpern sind Differenziert zwischen flachen oder gebogenen, konkaven gegen konvexe, glatten gegen raue Oberflächen
24
Grenzenbasierte Repräsentation
Repräsentiert die Oberfläche und Biegung nahe der Grenzen Trennt Objekte vom Hintergrund -> definiert dadurch das Objekt
25
Vereinfachen der Wahl Statt kombinatorischer Suche:
Aus den Daten bestimmen, wo welches Modell eingesetzt werden sollte Möglicherweise eine “grob zu fein”-Strategie Ein umfassendes System sollte alle Grundformarten beinhalten
26
Kriterien der Auswahl von Grundformen
Dreidimensional: Superquadriken Zweidimensional: Oberflächengrundformen Eindimensional: Konturgrundformen
27
Konturgrundformen Nachteile: Vorteile:
Zu lokal, um Zusammenhänge zu erkennen Störungsempfindlich gegenüber lokalen Veränderungen Vorteile: Erkennen Konturdetails Beschreiben die globale Form Teilen Objekte auf
28
Oberflächengrundformen
Unstetigkeiten werden als Begrenzungen gezählt Menschliche Wahrnehmung definiert Objekte als Ansammlung von Oberflächen werden Unstetigkeiten als Falten wahrgenommen, sind bessere Objektbeschreibungen möglich
29
Volumengrundformen Parametrische Modelle sehr beliebt
Kompakte Beschreibung (wenige Parameter) komplexer Formen Vorteile von Superquadriken Überall differenzierbar Enthalten eine große Bandbreite von natürlichen Formen Einfach lösbare Parameter
30
Der Segmentierungsprozess
Entscheidung, was zur Segmentierung benötigt wird Zwei Basisstrategien: Grob zu fein, Fein zu grob Beide vor- und nachteilbehaftet, beide benötigt Einteilung nach Repräsentationen ebenfalls möglich
31
Grob zu Fein Schnelle Abschätzung über Volumen/Grenzen/Oberflächen des Objekts Weitere Verfeinerung bis zum gewünschten Detailgrad Aber: die detektierbaren Details oft nur durch Repräsentationsänderung ermittelbar
32
Grundidee: Progressives blurring der Bilder klärt die Grobstruktur
Details beeinflussen nicht die Grobstruktur, daher kein Backtracking erforderlich
33
Scale-Space Tiefpassfilter auf verschiedenen Auflösungen erzeugt einen Skalen-Raum Niedrige Skalen beschreiben Details Hohe Skalen beschreiben homogene Regionen
34
Fein zu Grob Einige Details können beim Klassifizierungsprozess helfen, da sie Objekte ausschließen können Zuviele Details enden in kombinatorischer Explosion
35
Segmentierung durch volumenbasierte Repräsentanten
Binford und Nevatia: Basis = verallgemeinerte Zylinder Solina: Basis = Superquadriken
36
Solina Gegeben: Tiefenbild
Fasse alle Objektpunkte in einem Elipsoid zusammen Minimierung des Ellipsoids: Beziehe rekursiv die Objektpunkte mit ein und finde Parameter, damit die Form die Objektpunkte schneidet oder nahe der Oberfläche ist Problem: mehrere Objekte nicht separierbar
37
Segmentierung durch Informationen über die Grenzen
Basiert auf der Erkennung von Unstetigkeiten in Tiefenwerten und Orientierung Objektpunkte mit ähnlichen Eigenschaften werden verschmolzen Kurvenannäherung kann durchgeführt werden (Splines, etc)
38
Segmentierung durch Informationen über die Grenzen(2)
Verdeckungen (und Unterbrechungen) erkennbar durch Weiterführung der Kurven Ramachandran zeigt: uneindeutige Oberflächeninformationen können durch die Kanteninformationen gelöst werden
39
Segmentierung durch Oberflächengrundformen
Sehr beliebt, da einfacher handhabbar als Volumenkörper Der Prozess beginnt bei lokalen Nachbarschaften und wird ausgedehnt Wasserscheiden-Verfahren Problem: unwichtige lokale Minima Für den Gesamtkontext volumetrische Modelle besser geeignet
40
Kontrollstruktur Wie sollen die drei Strukturen verwoben werden?
Zwei Extrema Parallele Abarbeitung Auftauchen von Konfliktsituationen, die gelöst werden müssen Sequenzielle Abarbeitung Bei Erreichen von „falschen Fährten“ wäre Backtracking nötig
41
Kontrollstruktur (2) Menschliche Erkennung kann Kanten ergänzen
Ziel: Rechnerbasiert muss ein System ebenfalls anpassungsfähig sein
42
Vorschlag Paralleles Abarbeiten von volumen- und grenzbasierter Segmentierung da gegensätzlich Interaktion zwischen den Methoden zur Kontrolle und Präzisierung von Grenzen/Körpern Oberflächenanalyse für Details Konflikt-Lösungsmöglichkeit für „unsichtbare Kanten“ -> Ermittlung der Unstetigkeitstellen
43
Kontrollstruktur (3) Muss Verlässlichkeit der Informationen feststellen Muss Teil/Ganzes-Beziehungen entscheiden Braucht viele Parameter -> vorfestgelegt oder im Prozess ermittelt Z.B. Größe(-nbereich) der lokalen Nachbarschaften Größe(-nbereich) der volumetrischen Modelle Anzahl (oder Bereich) der erwarteten Einheiten Schwellenwerte für Partitionierung und Zusammenführung Detailgrad
44
Zusammenfassung Bei der Bilderkennung gibt es zwei grundlegende Verfahren Objektrepräsentation und Segmentierung Diese sollten zusammen angewendet werden, da sie einander ergänzen können Ein Vorschlag zur Zusammenarbeit wurde vorgestellt: Das Finden von Volumenkörpern wird einschränkend unterstützt durch Kantenfindung Feinere Details werden mittels Oberflächenrepräsentierung gefunden
45
Quellen: Objekte: Webquellen vom 27.7.2004
EarlyProcessing – EP discussion group Segmentation versus object representation - are they separable? Ruzena Bajcsy, Franc Solina, Alok Gupta Superquadriken Skalenräume Segmentierung mit Superquadriken Objekte: Webquellen vom
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.