Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Wahrn TEIL 1.ppt1 WAHRNEHMUNG Wie werden Objekte, Lebewesen etc. erkannt ? Frage der Identität (wahrgenommene Welt-wirkliche Welt) objektive Welt in uns.

Ähnliche Präsentationen


Präsentation zum Thema: "Wahrn TEIL 1.ppt1 WAHRNEHMUNG Wie werden Objekte, Lebewesen etc. erkannt ? Frage der Identität (wahrgenommene Welt-wirkliche Welt) objektive Welt in uns."—  Präsentation transkript:

1 Wahrn TEIL 1.ppt1 WAHRNEHMUNG Wie werden Objekte, Lebewesen etc. erkannt ? Frage der Identität (wahrgenommene Welt-wirkliche Welt) objektive Welt in uns repräsentiert subjektive Repräsentation subjektive Repräsentation = objektive Wirklichkeit ??? Dagegen, z.B.: Wahrnehmungstäuschungen, z.B. Müller-Lyer Dreieckstäuschung Wasserfalltäuschung Bewegung im Film Blinder Fleck

2 2 Müller-Lyer (1889)

3 3

4 4 Poggendorf (1860)

5 5 Blinder Fleck - z.B. from: Glynn: An anatomy of thought (1999)

6 6 Trotz der Wahrnehmungstäuschungen: Übereinstimmung zwischen Realität und subjektiver Repräsentation muss hoch sein, sonst wäre Überleben ernstlich gefährdet _____________________________________________________

7 7 spezielle Literatur zur Wahrnehmung: Bruce,V., Green, P.R & Georgeson, M.A..: Visual Perception. 4th ed. Hove and London: Erlbaum, 2003 Schiffman,H.R.: Sensation and Perception: An integrated approach. 5 th ed. New York: Wiley, 2000 LINKS:

8 8 VORSCHAU (Aus Zeitgründen Beschränkung auf visuelle Wahrnehmung) Entdeckung von Einfachen Signalen 1 (klassische) Psychophysik 2 Signalentdeckungstheorie ( Spada, 2006, Kap.2.3.1) Tiefenwahrnehmung 1 Monokulare Hinweisreize 2 binokulare Hinweisreize 3 Hinweisreize aus der Eigenbewegung 4 Kombination von Hinweisreizen Erkennen von Objekten Eysenck & Keane Kap 2 & 3

9 9 Erkennen von Objekten 1 Gestaltpsychologie 2 Mustererkennen ( Pattern Recognition ) 2.1 Schablonentheorien - Template theories 2.2 Merkmalsanalyse - Feature Theories 2.3 Strukturbeschreibung - Structural Description 3 Computationale Theorie der Visuellen Wahrnehmung 3.1 Grundsätzliche Überlegungen zum Wahrnehmungsprozess 3.2 Basisprozesse 3.3 Objekterkennung

10 10 Ziel Aneignung von Grundwissen zur Wahrnehmung Die wichtigsten theoretischen Ansätze und ihren empirischen Status kennen Erkennen der Komplexität bereits der einfachen Reizwahrnehmung

11 11 ENTDECKUNG VON EINFACHEN SIGNALEN 1 (KLASSISCHE) PSYCHOPHYSIK Fechner (1860) Elemente der Psychophysik physikalischer Reiz (Stimulus) Sinnessystem Transformierung der Stimulusenergie in neurale Ereignisse Entdeckung des Signales subj. Intensität des wahrgenommenen Stimulus

12 12 Grundproblem : Verhältnis: physikalische Stimulusintensität - subjektive Empfindung z.B. wahrgenommenes Gewicht wahrgenommene Länge von Strecken wahrgenommene Süsse wahrgenommene Lautstärke subjektiver Geldwert

13 13 FECHNER: Wie stark muss ein Reiz sein (über obj. Nullpunkt), damit er überhaupt wahrgenommen wird? Absolutschwelle – eben merkliche Empfindung Wie gross muss der Mindestunterschied zwischen zwei Reizen sein, damit sie als verschieden wahrgenommen werden? Unterschiedsschwelle - "eben merklicher Unterschied" jnd - just noticeable difference Bestimmung der Schwellenwerte: 3 Methoden Herstellungsmethode (Reize gleich machen) Grenzmethode (auf-absteigende Serien, ab wann) Konstanzmethode (zufällige Abfolge, ja/nein)

14 14 Hypothese über Verhältnis: physikalische Stimulusintensität - subjektive Empfindung historisch: Fechnersches-Gesetz (Weber-Fechnersches-Gesetz) Aktuell: POWER LAW Stevens (1961) (Potenzgesetz) S = k I b S... subj Empfindungsstärke/ subj.Grösse I... physik. Stimulusintensität /obj. Grösse k... Konstante b... Exponent, konstant für: Sinnesdimension Person Exponent b: >, <, oder = 1

15 15 Beispiel: obj. Geldbetrag - subj.Wert W = a G b mit a=1 und b=0.5: W = G.5 ( x 0.5 = x )

16 16 Berechnung von b aus bekannten objektiven und subjektiven Werten

17 17 Exponent b > 1, b < 1, b = 1 (willkürliche Einheiten) b > 1 b < 1 b = 1

18 18 Table 2.5 aus: Schiffman (1982): Representative exponents of the power functions relating psychological magnitude to stimulus magnitude Measured Continuum Exponent Stimulus Condition Loudness0.6Binaural Loudness0.54Monaural Brightness0.335º1 target, dark-adapted eye Brightness0.5Very brief flash Smell0.55Coffee Smell0.6Heptane Taste1.3Sucrose, human subjects Taste1.3Salt Temperature1.0Cold on arm Temperature1.6Warmth on arm

19 19 Fortsetzung Measured Continuum Exponent Stimulus Condition Vibration Hz on finger Vibration Hz on finger Duration1.1White noise stimuli Finger span1.3Thickness of blocks Pressure on palm 1.1Static force on ski Heaviness1.45Lifted weights Force of handgrip 1.7 Hand dynamometer Electric shock3.5Current through fingers Tactual roughness 1.5Rubbing emery cloths Tactual hardness0.8Squeezing rubber Visual length1.0Projected line Visual area0.7Projected square

20 20 Vorteil der Exponentialfunktion des Power-Laws: Verhältnis zweier Signale, z.B. Verhältnis gedruckter Buchstabe - Papier, bleibt unverändert bei unterschiedlichen Beleuchtungsbedingungen! Beweis siehe Ylmaz (1967)

21 21 2 SIGNALENTDECKUNGSTHEORIE Swets & Tanner (1961) Überblick: Spada Schiffman Entdeckung eines schwachen Signals (geringe Intensität) Signal vermischt mit Störsignalen (Rauschen)

22 22 Reaktion des Beobachters nicht nur von Reizintensität abhängig d.h. es gibt keine konstante Schwelle i.S der Psychophysik notwendige UNTERSCHEIDUNG: Beobachter als Sensor als Entscheider Wahrnehmungsschwelle - Reaktionsschwelle klassische Psychophysik untersucht nur Reaktionsschwelle

23 23 Reaktion des Beobachters abhängig von 1 objektive Signalstärke: objektives Verhältnis Signal-Rauschen 2 Beobachter: (1) Sensitivität (Beobachter als Sensor) (2) Erwartung des Beobachter z.B.: heute viele Vögel auf Radarschirm, weil Flugzeit weint mein Kind häufig? ist der Brandalarm so eingestellt, dass er sehr leicht anspricht (3) Bewertung der Konsequenzen Ist das Signal wichtig für mich ist es schlimm, wenn ich es übersehe

24 24 KONSEQUENZENMATRIX: REAKTION DES BEOBACHTERS

25 25 im Labor: subj Wert der Konsequenzen und Erwartung leicht variierbar Beispiel: Variationen des subj Wertes der Konsequenzen (z.B. durch Geld Belohnung oder Strafe) Reaktion des Beob Ja Nein Signal vorh. Signal nicht vorh. _____________________________________ Signal _____________________________________ kein Signal _____________________________________

26 26 Reaktion des Beob Ja Nein Signal vorh. Signal nicht vorh. ____________________________________ Signal ____________________________________ kein Signal ____________________________________ Konsequenzen begünstigen JA-Reaktion

27 27 Reaktion des Beob Ja Nein Signal vorh. Signal nicht vorh. ____________________________________ Signal ____________________________________ kein Signal ____________________________________ Konsequenzen begünstigen NEIN-Reaktion

28 28 Generell: Ergebnisse der Signalentdeckungstheorie gut bestätigt: Wahrsch für Signaldetektion (d.h. Reaktion "ja") steigt mit Sensitivität Erwartung: subj Wahrsch für Auftreten Konsequenzen: in Abhängigkeit davon, welche Konsequenz belohnt/bestraft wird Anwendung signalentdeckunstheoretischer Ideen z.B.: Gedächtnispsychologie Diagnostik Rechtssprechung

29 29 Wichtige Konsequenz der Resultate der Signalentdeckungstheorie Bereits bei elementaren Signalentdeckungsaufgaben: kognitive und motivationale Komponenten Problem: Elementare Signalentdeckungsaufgaben behandeln nur Detail des Wahrnehmungsprozesses. Ihre Untersuchung trägt kaum etwas bei zur Klärung der Frage: Wie werden Objekte, Lebewesen etc. erkannt ?

30 30 TIEFENWAHRNEHMUNG Netzhautbild allein kann über Form, Lage, Grösse und Entfernung von Gegenständen keine eindeutige Antwort geben. Relevant für Objekterkennung - von mehreren Faktoren determiniert

31 31 Daher: andere Grundlagen der Raumwahrnehmung notwendig. 3 Typen von Hinweisreizen (cues) für die Wahrnehmung von Tiefe Monokulare Hinweisreize Binokulare Hinweisreize Hinweisreize aus der Eigenbewegung Kombination von Hinweisreizen

32 32 1 MONOKULARE HINWEISREIZE z.B. Überlappung/Verdeckung Nahe Objekte verdecken oft fernere Objekte. Schattierung Dreidimensionale Formen meist nicht überall gleich beleuchtet.

33 33 Lineare Perspektive Fluchtpunkt, systematisches Kleinerwerden nach hinten Textur insbes. Gibson (1950) viele Oberflächen haben Feinstruktur (=Textur), z.B.: Fell, Stoff, Rinde, Baumkrone, Gras Elemente der Textur rücken mit wachsender Entfernung näher zu- sammen & werden kleiner

34 34

35 35 relative Grösse

36 36 2 BINOKULARE HINWEISREIZE optische Achsen der zwei Augen treffen sich im Fixationspunkt Fovea centralis (empfindlichster Bereich in Netzhaut, die meisten Sehzellen, schärfstes Sehen) Augen werden auf Fixationspunkt so eingestellt, dass Bild auf fovea centralis projiziert wird Bilder auf Netzhaut verschieden

37 37 Konvergenzwinkel verändert sich mit Entfernung zum Fixationspunkt je näher, desto grösser ("Schielen") jedoch: Konvergenzwinkel erlaubt nur sehr grobe Bestimmung der Entfernung (nah-fern)

38 38 Steropsis Querdisparation (binoculare Parallaxe) Augenabstand ca cm (beim Menschen) daher: Augen liefern leicht verschiedene Bilder aus dieser Differenz auch Info über Entfernung

39 39 3 HINWEISREIZE AUS DER EIGENBEWEGUNG Verschiebung Bilder aus verschiedenen Standpunkten liefern räumliche Info (analog zur Querdisparation) optisches Flussmuster / Fliessmuster (Gibson, 1950, 1982) mit Bewegung des Betrachters entstehen Muster von kontinuierlichen Veränderungen (Flussmuster) daraus auch räumliche Info ableitbar Fliessmuster abhängig von 1 Richtung und Geschwindigkeit der Eigenbewegung 2 Lage des Fixationspunktes 3 räumliche Verteilung der Oberflächen relativ zur Blicklinie

40 40 Eigenbewegung

41 41 Eigenbewegung

42 42 Eigenbewegung

43 43 Eigenbewegung

44 44 Eigenbewegung

45 45 KOMBINATION von HINWEISREIZEN Additive Verknüpfung oder Selektion? Experimente von Bruno & Cutting (1988) legen nahe, dass meist additiv verknüpft wird ( hilft, Fehler zu minimieren)

46 Wahrn TEIL 2.ppt46 1 Gestaltpsychologie 2 Mustererkennen ( Pattern Recognition ) 3 Computationale Theorie der Visuellen Wahrnehmung GESTALTPSYCHOLOGIE ca Max Wertheimer, Wolfang Köhler, Kurt Koffka Zwei Phänomene der Wahrnehmung müssen erklärt werden: Formkonstanz Grössenkonstanz ERKENNEN VON OBJEKTEN

47 47 Formkonstanz Wahrgenommene Form eines Objektes ändert sich nicht, auch wenn sich Netzhautbild ändert (z.B. bei Änderung des Blickwinkels) Grössenkonstanz Wahrgenommene Grösse eines Objektes ändert sich nicht, auch wenn sich die Grösse des Netzhautbildes ändert (z.B. bei zunehmender Entfernung) Annahme der Gestaltpsychologie: Elementare Reize im Wahrnehmungsfeld werden durch Organisationsgesetze (= Gestaltgesetze) strukturiert.

48 48 Einige wichtige Regeln: Figur und Grund Im Wahrnehmungsfeld heben sich bestimmte Teile von anderen ab. Teil, der sich mit scharfen Umgrenzungen und bestimmter Form abhebt, ist Figur, der Rest ist Grund.

49 49 Binnengliederung Übereinandergelegte Figuren werden in der Regel in möglichst einfache Figuren zerlegt

50 50 Prägnanzprinzip (Prinzip der guten Gestalt) Wichtiges Gliederungsprinzip der Gestalttheorie Wenn mehrere alternative Strukturierungen möglich: es setzt sich diejenige durch, welche die einfachste, einheitlichste, "beste" Gestalt ergibt.

51 51 z.B. Prinzip der Nähe: Reize, die einander nahe sind, werden als zusammengehörig betrachtet Probleme der Gestaltpsychologie Keine Erklärung, wie natürliche Objekte erkannt werden Die explizite Annahme (zumind. frühe Gestaltpsych), dass nur Reizkonfiguration für Wahrnehmungsinhalt verantwortlich, nicht haltbar Für jedes Gestaltgesetz Gegenbeispiele, daher immer neue Annahmen notwendig

52 52... lt. Gesetz der Nähe gehören diese beiden Punkte zusammen, trotzdem werden sie als zu den beiden verschiedenen Balken des Y gehörend wahrgenommen

53 53 2 MUSTERERKENNEN ( Pattern Recognition ) Hauptsächlich mit zweidimensionalen Stimuli erforscht (z.B.: Buchstaben) Schablonentheorie Merkmalsanalyse Strukturbeschreibung

54 SCHABLONENTHEORIEN - Template theory Schablone: mentale Kopie des wahrgenommenen Objektes die im LZG gespeichert ist Stimuli Schablonen A B C … R E A S

55 55 ABRABR R E A S Schablonen: A B C …

56 56 Probleme mit Drehung, kursiv, Grösse,... durch Transformation lösbar

57 57 Probleme: unsaubere Buchstaben verkehrte, unvollständige Buchstaben Kontext-Effekte

58 58

59 59 Hauptkritik an Schablonenvergleich-Theorie 1 Verzerrungen bei realistischem 3-dimensionalem Input nicht durch einfache Transformation umkehrbar 2 Schablonenvergleich funktioniert nur bei klar isolierten zweidimensionalen Wahrnehmungsobjekten (z.B. Buchstaben auf Papier) 3 Schon bei einfachen zweidimensionalen Stimuli treten Probleme auf, die zeigen, dass die Schablonentheorie nicht stimmen kann

60 MERKMALSANALYSE - Feature Theories - einzelne Merkmale (z.B.) von Buchstaben analysisert - Mini-Schablonen für einfache geometrische Merkmale z.B.: A H

61 61 Was spricht für die Merkmalsanalyse ? 1 Neurophysiologie neurale Detektoren für Kanten, Striche, etc. ( Hubel & Wiesel, 1963 ) auf höherer Ebene unabhängig von der Lokation auf Retina 2 Fehleranalyse beim Erkennen von Buchstaben Vorhersage von mehr Fehlern je mehr gemeinsame Merkmale z.B. 250 Paare von Buchstaben präsentiert E F 39 Verwechslungen T I 22 Verwechslungen E W 3 Verwechslungen T O 0 Verwechslungen

62 62 Probleme der Merkmalsanalyse 1Minischablonen für natürliche Formen? z.B.: Pferd [globale Merkmale (Kopf) unbrauchbar] 2räumliche Beziehung zwischen Merkmalen unberücksichtigt ( nur Art und Zahl ) A oder 33-dimensionale Objekte

63 STRUKTURBESCHREIBUNG - Structural Description Bruce & Green (1990) Berücksichtigt Relationen zwischen Merkmalen Strukturbeschreibungen aus elementaren Propositionen (Aussagen) Beschreibt Komponenten einer Konfiguration und deren Anordnung

64 64 z. B.: Strukturbeschreibung eines T Es gibt zwei Teile Ein Teil ist eine horizontale Linie Ein Teil ist eine vertikale Linie Die vertikale Linie trägt die horizontale Die vertikale Linie halbiert die horizontale

65 65 Probleme der Strukturbeschreibung 1Strukturbeschreibung für natürliche Formen? 23-dimensionale Objekte

66 66 3 COMPUTATIONALE THEORIE DER VISUELLEN WAHRNEHMUNG Marr, D.: Vision. San Francisco: Freeman, 1982 Zwei fundamentale Probleme der traditionellen Ansätze 1 Keine klare Abgrenzung von Perzeption und Kognition z.B.: Erkennen des Quadrates ist unabhängig von der Art, wie Begrenzung identifiziert wird Begrenzung kann gesehen werden, ohne dass Figur erkannt zu werden braucht d.h. diese Prozesse (Identifikation von Begrenzungen, Erkennen von Formen) sind unabhängig voneinander

67 67 a a a a a a a a a a a erkennbar: Form unabhängig von Begrenzung Begrenzung unabhängig von Form

68 68 Zwei fundamentale Probleme der traditionellen Ansätze 2Keine klare Problemanalyse d.h. es wird nicht spezifiziert, was man durch die Theorie erreichen will welcher Prozess soll erklärt werden welcher Input, welches Ergebnis

69 GRUNDSÄTZLICHE ÜBERLEGUNGEN ZUM WAHRNEHMUNGSPROZESS Aufgabe des Wahrnehmungsprozesses: Dreidimensionale Wirklichkeit muss aus zweidimensionalem Netzhautbild rekonstruiert werden dabei Schwierigkeiten, z.B. Teile des Gegenstandes können auf Netzhautbild verdeckt sein Gegenstände verschieden scharf Schatten, Spiegelungen, Oberflächenstrukturen,...

70 70 Unterscheidung von zwei globalen Verarbeitungsstufen: Basisprozesse (visuelle Perzeption) eher von Sinnesdaten und allgemeinen Verarbeitungsprinzipien bestimmt Prozess der Extraktion von Informationen aus Daten, ohne spezielle Annahmen über wahrgenommene Objekte Eher datengetrieben (bottom-up) Objekterkennung (visuelle Kognition) Prozess der Erkennung Information aus den Basisprozessen mit der im Gedächtnis gespeicherten Information verglichen eher erwartungsgetrieben (top-down), d.h.: spezielle Annahmen und spezielles Wissen über wahrgenommene Objekte einbezogen

71 71 Annahme Marrs: Wahrnehmungsprozess beinhaltet eine Serie von Repräsentationen unserer visuellen Umwelt, die zunehmend detailliertere Informationen enthält. bei Marr 3 Haupttypen der Repräsentation: Erstskizze (Primal sketch) 2 1/2-D Skizze Repräsentation in Form eines 3-D Modelles

72 72 Erstskizze (Primal sketch) 2-dimensionale Beschreibung von Änderungen der Licht-Intensität im visuellen Input, dazu Information über Kanten, Konturen und Flecken beobachterzentriert 2 1/2-D Skizze Beschreibung der sichtbaren Oberflächen, ihre Tiefe (Entfernung) und Orientierung (unter Ausnutzung der Hinweisreize zur Tiefenwahrnehmung) beobachterzentriert Repräsentation in Form eines 3-D Modelles Beschreibt 3-dimensional Form und relative Position von Objekten Unabhängig vom Beobachterstandpunkt!

73 BASISPROZESSE ERSTSKIZZE (Primal sketch) Roh-Erstskizze (Raw Primal sketch) Information über Lichtintensität Voll-Erstskizze (Full Primal sketch) Linienrepräsentation von Umrissen, Kanten Oft: Änderung der Lichtintensität an Kanten des Objektes aber: z.B. Schatten, Spiegelungen, Textur Daher nur Änderung der Lichtintensität nicht ausreichend

74 74 Zerlegung der Bildfläche in kleine Elemente: Pixels. Problem: Lichtintensität auf jedem Pixel fluktuiert ständig, dadurch könnte die Roh-Erstskizze verzerrt werden. Lösung: Zusammenfassung (Durchschnitt) der Lichtintensität benachbarter Pixels, das führt aber zur Vergöberung (Verschwimmen - blurring) der Bildauflösung. Daher: Mehrere Analysen des Bildes mit unterschiedlichen Graden von Vergröberung. Information aus diesen mehrfachen Analysen wird zur Roh-Erstskizze verarbeitet.

75 75 Ergebnis: einfache Elemente wie Kanten, Balken, Flecken, Enden Voll-Erstskizze: Gruppierung derartiger Elemente zu grösseren Einheiten Gruppierungsprinzipien: Nähe Ausrichtung iterativer Prozess

76 76 nach neueren Ergebnissen: Vermutlich Gruppierung nicht nur im zweidimensionalen Raum Endergebnis der Erstskizze: Linienrepräsentation enthält aber auch irrelevante Linien beobachterzentriert Abbildung (Bild 110 aus Frisby [1979])

77 77

78 78 2 1/2 D-SKIZZE Beschreibung der sichtbaren Oberflächen, ihre Tiefe (Entfernung) und Orientierung Ausgangspunkt: Bild- "Zellen" Jede Zelle entspricht einem Bildausschnitt aus der Sicht des Betrachters Information aus Zellen wird zusammengefasst. Verwendete Information: Tiefeninformation aus monokularen/binokularen Hinweisreizen etc. 2 1/2D-Skizze enthält Information über die sichtbaren Oberflächen beobachterzentriert

79 79 Siehe Abbildung ( Marr, 1982)

80 80 2 1/2 D-Skizze ermöglicht nicht Vergleich mit Gedächtnisinhalt: 1Nur sichtbare Oberflächen repräsentiert 2Alles nur aus einem speziellen Blickwinkel d.h. alle Distanzen und Orientierungen relativ zum momentanen Blickpunkt Ändert sich Standpunkt des Betrachters, ändert sich auch die Repräsentation 3Objekte und ihre Teile nicht explizit abgegrenzt

81 81 Neuropsychologische Hinweise, die als Bestätigung für Annahme einer 2 1/2 D-Skizze interpretiert werden können: Wenn nur Prozess der Konstruktion der 2 1/2 D-Skizze geschädigt: Patient kann Helligkeitsunterschiede, Bewegung kleiner Objekte erkennen (Leistung der Erstskizze) Patient kann Objekte mithilfe anderer Sinnesmodalitäten erkennen (z.B. Tasten, Hören) Patient kann Objekt nur mithilfe visueller Information nicht erkennen Benson & Greenberg (1969)

82 OBJEKTERKENNUNG Marr (1982) Biederman (1987) Kosslyn et al. (1990) ( Konnektionistische Ansätze ) MARR (1982), Marr & Nishihara (1978) 3-dim Modell aus Komponenten konstruiert Basiselemente: Zylinder mit Hauptachse Hierarchische Organisation: Grobform+Orientierung Details (Hauptachse des globalen Objektes stimmt oft nicht überein mit Hauptachsen von Details) 3-D Modell wird mit Modellen im Gedächtnis verglichen (dazu Identifikation der Hauptachse notwendig)

83 83 hierarchische Struktur des menschl Körpers Marr & Nishihara (1978)

84 84 Orientierung der Hand unterschiedlich bei Bewegung von Schulter und Ellenbogen Orientierung der Hand auf Retina unterschiedlich relative Lage von Hand und Unterarm gleich

85 85 BIEDERMAN (1987, etc.): Recognition-by-components-theory Objekte aus Basiskomponenten (geons) zusammengesetzt: Block Zylinder Kugel Bogen Keil etc. insgesamt 36 geons (Analogie zu Wörtern aus Lauten)

86 86

87 87 Verlauf der Objekt-Erkennung nach Biederman Determination der Geons und ihrer Relationen Vergleich mit Gedächtnisrepräsentationen (Geon-Beschreibungen von Objekten) Kanten-Extraktion Identifikation von nicht- zufälligen Eigenschaften Zerlegung des Objektes

88 88 Zerlegung des Objektes (Parsing of regions of concavity) basiert auf geometrischer Regularität: Wenn Objekt aus zwei Teilen gebildet, an der Verbindgsstelle üblicherweise konkave (nach innen ins Objekt gerichtete) Diskontinuität Baum

89 89 Detektion von relevanten (nicht-zufälligen) Eigenschaften (Detection of non-accidental properties) Charakteristiken, die aus wechselnden Blickwinkeln unverändert bleiben Werden durch Analyse der Kanten identifiziert: Kurvatur einer Kante Parallele Kanten Kanten mit gemeinsamen Endpunkt Symmetrische Kanten Gerade Kanten Geons aus diesen Invarianten konstruiert Annahme: nicht-zufällige Merkmale in der Repräsentation entsprechen nicht-zufälligen Merkmalen in der Wirklichkeit

90 90 Warum können Objekte auch unter suboptimalen Bedingungen erkannt werden (schlechte Beleuchtung, Teilverdeckung)? 1 Invariante Merkmale bleiben oft auch unter suboptimalen Bedingungen erhalten 2 Fehlende Teile können ergänzt werden (sofern Konkavität erhalten bleibt) 3 üblicherweise Redundanz

91 91 Empirischer Status +Biederman, Ju & Clapper (1985): Erkennen auch unvollständiger komplexer Objekte ( 90%) Biederman (1987): Erkennen unvollständiger Objekte schwieriger, wenn Information über Konkavität fehlt. Erkennen von Objekten wird durch Farbe nicht gefördert (nicht einmal dort, wo Farbe wichtig ist - Banane) -Komplexe Objekte werden oft zunächst global verarbeitet (z.B. Kimchi, 1992) (wie bei Marr). Zentrale theoretische Annahmen (derzeit) nicht direkt prüfbar (36 geons).

92 92 intakte FigurInfo über Struktur erhalten Info über Struktur nicht erhalten Biederman (1987)

93 93 Hauptproblem der Theorien von Marr und Biederman: Behandeln relativ einfache/grobe Erkennungsaufgaben (z.B.: Hund oder Kuh), nicht differenzierte Unterscheidungen (z.B.: bestimmter Schäferhund Rex) Rolle anderer Hinweisreize (ausser den Kanten) noch zu wenig untersucht (z.B. Farbe) Vorteile Bisher einzige Theorie des Objekterkennens auch Kontexteffekte können wenigstens Teilweise erklärt werden (Reihenfolge der Gedächtnissuche),


Herunterladen ppt "Wahrn TEIL 1.ppt1 WAHRNEHMUNG Wie werden Objekte, Lebewesen etc. erkannt ? Frage der Identität (wahrgenommene Welt-wirkliche Welt) objektive Welt in uns."

Ähnliche Präsentationen


Google-Anzeigen