subjektive Repräsentation = objektive Wirklichkeit ???

Slides:



Advertisements
Ähnliche Präsentationen
Anzahl der ausgefüllten und eingesandten Fragebögen: 211
Advertisements

Elternfragebogen 2009 Die Auswertung ist da mit super Ergebnissen!
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil3.
Die Projektgruppe heißt Sie herzlichst willkommen
Normalverteilte Zufallsvariablen
LS 2 / Informatik Datenstrukturen, Algorithmen und Programmierung 2 (DAP2)
Wahrnehmung Perzeption
Telefonnummer.
Modelle und Methoden der Linearen und Nichtlinearen Optimierung (Ausgewählte Methoden und Fallstudien) U N I V E R S I T Ä T H A M B U R G November 2011.
1 JIM-Studie 2010 Jugend, Information, (Multi-)Media Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.
= = = = 47 = 47 = 48 = =
Statistiken und Tabellen
Lagebeziehungen Eigenschaften von Gegenständen
Texturwahrnehmung von Bela Julesz
Formwahrnehmung aus Schattierung Seminar: Visuelle Wahrnehmung Dozent: Dipl. Psych. Kai Hamburger  Referentin: Anna Lapteva.
Pattern sensitivity Campbell & Robson (1968).
2D but not 3D: Pictorial Deficits in a case of visual Agnosia
Rechneraufbau & Rechnerstrukturen, Folie 2.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 2.
Internet facts 2008-II Graphiken zu dem Berichtsband AGOF e.V. September 2008.
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil2.
Differentielles Paar UIN rds gm UIN
Prof. Dr. Bernhard Wasmayr
Wahrnehmung der räumlichen Tiefe von Objekten
Studienverlauf im Ausländerstudium
Dieter Bergmann, Lichtenfels
Datenstrukturen, Algorithmen und Programmierung 2 (DAP2)
Prof. Dr. Bernhard Wasmayr VWL 2. Semester
Effects of 3-D complexity on the perception of 2-D depictions of objects (Flip Phillips, Colin H Thomson, Martin G Voshell, 2004) Seminar: Bildwahrnehmung.
AWA 2007 Natur und Umwelt Natürlich Leben
Rechneraufbau & Rechnerstrukturen, Folie 12.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 12.
Prof. Dr. Günter Gerhardinger Soziale Arbeit mit Einzelnen und Familien Übersicht über die Lehrveranstaltung Grundlegende Bestimmungsfaktoren der Praxis.
20:00.
Zusatzfolien zu B-Bäumen
WIRTSCHAFTSLAGE NOCH SCHWIERIG
Eine Einführung in die CD-ROM
GBI Genios Wiso wiso bietet Ihnen das umfassendste Angebot deutsch- und englischsprachiger Literatur für die Wirtschafts- und Sozialwissenschaften. Wir.
Dokumentation der Umfrage
Where Europe does business Lück, JDZB | Seite © GfW NRW 252 a.
Kinder- und Jugenddorf Klinge Qualitätsentwicklung Januar 2005 Auswertung der Fragebögen für die Fachkräfte in den Jugendämtern.
Computational Thinking Online Algorithmen [Was ist es wert, die Zukunft zu kennen?] Kurt Mehlhorn Konstantinos Panagiotou.
Wir üben die Malsätzchen
Syntaxanalyse Bottom-Up und LR(0)
Der Ablauf eines Clear Rex Klärzyklus
PROCAM Score Alter (Jahre)
Ertragsteuern, 5. Auflage Christiana Djanani, Gernot Brähler, Christian Lösel, Andreas Krenzin © UVK Verlagsgesellschaft mbH, Konstanz und München 2012.
Geometrische Aufgaben
Vorlesung Mai 2000 Konstruktion des Voronoi-Diagramms II
Symmetrische Blockchiffren DES – der Data Encryption Standard
Retuschen.ppt Die folgende Schau zeigt die Möglichkeiten, mit PhotoDraw Digitalbilder zu retuschieren. Vergleichen Sie jeweils zwei Bildpaare durch fleissiges.
Szenisches Lernen Wie Theaterelemente den Unterricht bereichern
Zahlentheorie und Zahlenspiele Hartmut Menzer, Ingo Althöfer ISBN: © 2014 Oldenbourg Wissenschaftsverlag GmbH Abbildungsübersicht / List.
MINDREADER Ein magisch - interaktives Erlebnis mit ENZO PAOLO
1 (C)2006, Hermann Knoll, HTW Chur, FHO Quadratische Reste Definitionen: Quadratischer Rest Quadratwurzel Anwendungen.
Wahrnehmung Christopher Frank
Stundenbild Unterrichtsstd. für eine 7. Klasse
Schutzvermerk nach DIN 34 beachten 20/05/14 Seite 1 Grundlagen XSoft Lösung :Logische Grundschaltung IEC-Grundlagen und logische Verknüpfungen.
Folie Beispiel für eine Einzelauswertung der Gemeindedaten (fiktive Daten)
Dokumentation der Umfrage BR P2.t Ergebnisse in Prozent n= 502 telefonische CATI-Interviews, repräsentativ für die Linzer Bevölkerung ab 18 Jahre;
Unternehmensbewertung Thomas Hering ISBN: © 2014 Oldenbourg Wissenschaftsverlag GmbH Abbildungsübersicht / List of Figures Tabellenübersicht.
Forschungsprojekt Statistik 2013 „Jugend zählt“ – Folie 1 Statistik 2013 „Jugend zählt“: Daten zur Arbeit mit Kindern und Jugendlichen.
Folie Einzelauswertung der Gemeindedaten
ÖGB BÜRO CHANCEN NUTZEN
Negative Nacheffekte in der visuellen Wahrnehmung
Datum:17. Dezember 2014 Thema:IFRS Update zum Jahresende – die Neuerungen im Überblick Referent:Eberhard Grötzner, EMA ® Anlass:12. Arbeitskreis Internationale.
Sehen, Hören, Schmecken: wenn uns unsere Sinne täuschen
1 Medienpädagogischer Forschungsverbund Südwest KIM-Studie 2014 Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.
Organisation von Wahrnehmung
Sind die beiden Bilder auf den ersten Blick gleich, welche Frau ist hässlich/schön?? Wer erkennt den Star? (Madonna) Nach einer Drehung von 180 Grad werden.
Die Gestaltpsychologie
Spärliche Kodierung von Videos natürlicher Szenen Vortragender: Christian Fischer.
 Präsentation transkript:

subjektive Repräsentation = objektive Wirklichkeit ??? WAHRNEHMUNG Wie werden Objekte, Lebewesen etc. erkannt ? Frage der Identität (wahrgenommene Welt-wirkliche Welt) objektive Welt in uns repräsentiert  subjektive Repräsentation subjektive Repräsentation = objektive Wirklichkeit ??? Dagegen, z.B.: Wahrnehmungstäuschungen , z.B. Müller-Lyer Dreieckstäuschung Wasserfalltäuschung Bewegung im Film Blinder Fleck Wahrn TEIL 1.ppt

Müller-Lyer (1889)

Poggendorf (1860)

Blinder Fleck - z.B. from: Glynn: An anatomy of thought (1999)

Trotz der Wahrnehmungstäuschungen: Übereinstimmung zwischen Realität und subjektiver Repräsentation muss hoch sein, sonst wäre Überleben ernstlich gefährdet _____________________________________________________

http://www.yorku.ca/eye/ http://Krantzj.hanover.edu/krantz/art/ spezielle Literatur zur Wahrnehmung: Bruce,V., Green, P.R & Georgeson, M.A. .: Visual Perception. 4th ed. Hove and London: Erlbaum, 2003 Schiffman,H.R.: Sensation and Perception: An integrated approach. 5th ed. New York: Wiley, 2000 LINKS: http://www.yorku.ca/eye/ http://Krantzj.hanover.edu/krantz/art/ http://psychlab1.hanover.edu/classes/Sensation/

VORSCHAU (Aus Zeitgründen Beschränkung auf visuelle Wahrnehmung) Entdeckung von Einfachen Signalen 1 (klassische) Psychophysik 2 Signalentdeckungstheorie ( Spada, 2006, Kap.2.3.1) Tiefenwahrnehmung 1 Monokulare Hinweisreize 2 binokulare Hinweisreize 3 Hinweisreize aus der Eigenbewegung 4 Kombination von Hinweisreizen Erkennen von Objekten Eysenck & Keane Kap 2 & 3

Erkennen von Objekten 1 Gestaltpsychologie 2 Mustererkennen ( Pattern Recognition ) 2.1 Schablonentheorien - Template theories 2.2 Merkmalsanalyse - Feature Theories 2.3 Strukturbeschreibung - Structural Description 3 Computationale Theorie der Visuellen Wahrnehmung 3.1 Grundsätzliche Überlegungen zum Wahrnehmungsprozess 3.2 Basisprozesse 3.3 Objekterkennung

Ziel Aneignung von Grundwissen zur Wahrnehmung Die wichtigsten theoretischen Ansätze und ihren empirischen Status kennen Erkennen der Komplexität bereits der einfachen Reizwahrnehmung

ENTDECKUNG VON EINFACHEN SIGNALEN 1 (KLASSISCHE) PSYCHOPHYSIK Fechner (1860) Elemente der Psychophysik physikalischer Reiz (Stimulus)  Sinnessystem Transformierung der Stimulusenergie in neurale Ereignisse Entdeckung des Signales subj. Intensität des wahrgenommenen Stimulus

Grundproblem : Verhältnis: physikalische Stimulusintensität - subjektive Empfindung z.B. wahrgenommenes Gewicht wahrgenommene Länge von Strecken wahrgenommene Süsse wahrgenommene Lautstärke subjektiver Geldwert

FECHNER: Wie stark muss ein Reiz sein (über obj. Nullpunkt) , damit er überhaupt wahrgenommen wird? Absolutschwelle – “eben merkliche Empfindung” Wie gross muss der Mindestunterschied zwischen zwei Reizen sein, damit sie als verschieden wahrgenommen werden? Unterschiedsschwelle - "eben merklicher Unterschied" jnd - just noticeable difference Bestimmung der Schwellenwerte: 3 Methoden  Herstellungsmethode (Reize gleich machen)  Grenzmethode (auf-absteigende Serien, ab wann)  Konstanzmethode (zufällige Abfolge, ja/nein)

Hypothese über Verhältnis: physikalische Stimulusintensität - subjektive Empfindung historisch: Fechnersches-Gesetz (Weber-Fechnersches-Gesetz) Aktuell: POWER LAW Stevens (1961) (Potenzgesetz) S = k Ib S ... subj Empfindungsstärke/ subj.Grösse I ... physik. Stimulusintensität /obj. Grösse k ... Konstante b ... Exponent, konstant für: Sinnesdimension Person Exponent b: >, <, oder = 1

Beispiel: obj. Geldbetrag - subj.Wert W = aGb mit a=1 und b=0.5: W = G.5 ( x0.5 = x )

Berechnung von b aus bekannten objektiven und subjektiven Werten

Exponent b > 1, b < 1, b = 1 (willkürliche Einheiten) b > 1 b < 1 b = 1

Table 2.5 aus: Schiffman (1982): Representative exponents of the power functions relating psychological magnitude to stimulus magnitude Measured Continuum Exponent Stimulus Condition Loudness 0.6 Binaural Loudness 0.54 Monaural Brightness 0.33 5º1 target, dark-adapted eye Brightness 0.5 Very brief flash Smell 0.55 Coffee Smell 0.6 Heptane Taste 1.3 Sucrose, human subjects Taste 1.3 Salt Temperature 1.0 Cold on arm Temperature 1.6 Warmth on arm

Continuum Exponent Stimulus Condition Vibration 0.95 60 Hz on finger Fortsetzung Measured Continuum Exponent Stimulus Condition Vibration 0.95 60 Hz on finger Vibration 0.6 250 Hz on finger Duration 1.1 White noise stimuli Finger span 1.3 Thickness of blocks Pressure on palm 1.1 Static force on ski Heaviness 1.45 Lifted weights Force of handgrip 1.7 Hand dynamometer Electric shock 3.5 Current through fingers Tactual roughness 1.5 Rubbing emery cloths Tactual hardness 0.8 Squeezing rubber Visual length 1.0 Projected line Visual area 0.7 Projected square

Vorteil der Exponentialfunktion des Power-Laws: Verhältnis zweier Signale, z.B. Verhältnis gedruckter Buchstabe - Papier, bleibt unverändert bei unterschiedlichen Beleuchtungsbedingungen! Beweis siehe Ylmaz (1967)

2 SIGNALENTDECKUNGSTHEORIE Swets & Tanner (1961) Überblick: Spada Schiffman Entdeckung eines schwachen Signals (geringe Intensität) Signal vermischt mit Störsignalen (Rauschen)

Reaktion des Beobachters nicht nur von Reizintensität abhängig d.h. es gibt keine konstante Schwelle i.S der Psychophysik notwendige UNTERSCHEIDUNG: Beobachter Beobachter als Sensor als Entscheider   Wahrnehmungsschwelle - Reaktionsschwelle klassische Psychophysik untersucht nur Reaktionsschwelle

Reaktion des Beobachters abhängig von 1 objektive Signalstärke: objektives Verhältnis Signal-Rauschen 2 Beobachter: (1) Sensitivität (Beobachter als Sensor) (2) Erwartung des Beobachter z.B.: heute viele Vögel auf Radarschirm, weil Flugzeit weint mein Kind häufig? ist der Brandalarm so eingestellt, dass er sehr leicht anspricht (3) Bewertung der Konsequenzen Ist das Signal wichtig für mich ist es schlimm, wenn ich es übersehe

KONSEQUENZENMATRIX: REAKTION DES BEOBACHTERS

im Labor: subj Wert der Konsequenzen und Erwartung leicht variierbar Beispiel: Variationen des subj Wertes der Konsequenzen (z.B. durch Geld Belohnung oder Strafe) Reaktion des Beob Ja Nein Signal vorh. Signal nicht vorh. _____________________________________ Signal +5 -5 kein Signal -5 +5

Reaktion des Beob Ja Nein Signal vorh. Signal nicht vorh. ____________________________________ Signal +25 -8 kein Signal -5 +7 Konsequenzen begünstigen JA-Reaktion

Reaktion des Beob Ja Nein Signal vorh. Signal nicht vorh. ____________________________________ Signal +5 -5 kein Signal -50 +5 Konsequenzen begünstigen NEIN-Reaktion

Generell: Ergebnisse der Signalentdeckungstheorie gut bestätigt: Wahrsch für Signaldetektion (d.h. Reaktion "ja") steigt mit Sensitivität Erwartung: subj Wahrsch für Auftreten Konsequenzen: in Abhängigkeit davon, welche Konsequenz belohnt/bestraft wird Anwendung signalentdeckunstheoretischer Ideen z.B.: Gedächtnispsychologie Diagnostik Rechtssprechung

Wichtige Konsequenz der Resultate der Signalentdeckungstheorie Bereits bei elementaren Signalentdeckungsaufgaben: kognitive und motivationale Komponenten Problem: Elementare Signalentdeckungsaufgaben behandeln nur Detail des Wahrnehmungsprozesses. Ihre Untersuchung trägt kaum etwas bei zur Klärung der Frage: Wie werden Objekte, Lebewesen etc. erkannt ?

TIEFENWAHRNEHMUNG Relevant für Objekterkennung - von mehreren Faktoren determiniert Netzhautbild allein kann über Form, Lage, Grösse und Entfernung von Gegenständen keine eindeutige Antwort geben.

Daher: andere Grundlagen der Raumwahrnehmung notwendig. 3 Typen von Hinweisreizen (cues) für die Wahrnehmung von Tiefe Monokulare Hinweisreize Binokulare Hinweisreize Hinweisreize aus der Eigenbewegung Kombination von Hinweisreizen

1 MONOKULARE HINWEISREIZE z.B. Überlappung/Verdeckung Nahe Objekte verdecken oft fernere Objekte. Schattierung Dreidimensionale Formen meist nicht überall gleich beleuchtet.

Lineare Perspektive Fluchtpunkt, systematisches Kleinerwerden nach hinten Textur insbes. Gibson (1950) viele Oberflächen haben Feinstruktur (=Textur), z.B.: Fell, Stoff, Rinde, Baumkrone, Gras  Elemente der Textur rücken mit wachsender Entfernung näher zu- sammen & werden kleiner

relative Grösse

2 BINOKULARE HINWEISREIZE optische Achsen der zwei Augen treffen sich im Fixationspunkt Fovea centralis (empfindlichster Bereich in Netzhaut, die meisten Sehzellen, schärfstes Sehen) Augen werden auf Fixationspunkt so eingestellt, dass Bild auf fovea centralis projiziert wird Bilder auf Netzhaut verschieden

Konvergenzwinkel verändert sich mit Entfernung zum Fixationspunkt je näher, desto grösser ("Schielen")  jedoch: Konvergenzwinkel erlaubt nur sehr grobe Bestimmung der Entfernung (nah-fern)

Steropsis Querdisparation (binoculare Parallaxe) Augenabstand ca. 5 - 7.6 cm (beim Menschen) daher: Augen liefern leicht verschiedene Bilder aus dieser Differenz auch Info über Entfernung

3 HINWEISREIZE AUS DER EIGENBEWEGUNG Verschiebung Bilder aus verschiedenen Standpunkten liefern räumliche Info (analog zur Querdisparation) optisches Flussmuster / Fliessmuster (Gibson, 1950, 1982) mit Bewegung des Betrachters entstehen Muster von kontinuierlichen Veränderungen (Flussmuster) daraus auch räumliche Info ableitbar Fliessmuster abhängig von 1 Richtung und Geschwindigkeit der Eigenbewegung 2 Lage des Fixationspunktes 3 räumliche Verteilung der Oberflächen relativ zur Blicklinie

Eigenbewegung

Eigenbewegung

Eigenbewegung

Eigenbewegung

Eigenbewegung

KOMBINATION von HINWEISREIZEN Additive Verknüpfung oder Selektion? Experimente von Bruno & Cutting (1988) legen nahe, dass meist additiv verknüpft wird ( hilft, Fehler zu minimieren)

ERKENNEN VON OBJEKTEN GESTALTPSYCHOLOGIE 1 Gestaltpsychologie 2 Mustererkennen ( Pattern Recognition ) 3 Computationale Theorie der Visuellen Wahrnehmung GESTALTPSYCHOLOGIE ca. 1890-1920 Max Wertheimer, Wolfang Köhler, Kurt Koffka Zwei Phänomene der Wahrnehmung müssen erklärt werden: Formkonstanz Grössenkonstanz Wahrn TEIL 2.ppt

Formkonstanz Wahrgenommene Form eines Objektes ändert sich nicht, auch wenn sich Netzhautbild ändert (z.B. bei Änderung des Blickwinkels) Grössenkonstanz Wahrgenommene Grösse eines Objektes ändert sich nicht, auch wenn sich die Grösse des Netzhautbildes ändert (z.B. bei zunehmender Entfernung) Annahme der Gestaltpsychologie: Elementare Reize im Wahrnehmungsfeld werden durch Organisationsgesetze (= Gestaltgesetze) strukturiert.

Einige wichtige Regeln: Figur und Grund Im Wahrnehmungsfeld heben sich bestimmte Teile von anderen ab. Teil, der sich mit scharfen Umgrenzungen und bestimmter Form abhebt, ist Figur, der Rest ist Grund.

Binnengliederung Übereinandergelegte Figuren werden in der Regel in möglichst einfache Figuren zerlegt

Prägnanzprinzip (Prinzip der guten Gestalt) Wichtiges Gliederungsprinzip der Gestalttheorie Wenn mehrere alternative Strukturierungen möglich: es setzt sich diejenige durch, welche die einfachste, einheitlichste, "beste" Gestalt ergibt.

Probleme der Gestaltpsychologie Keine Erklärung, wie natürliche Objekte erkannt werden Die explizite Annahme (zumind. frühe Gestaltpsych), dass nur Reizkonfiguration für Wahrnehmungsinhalt verantwortlich, nicht haltbar Für jedes Gestaltgesetz Gegenbeispiele, daher immer neue Annahmen notwendig z.B. Prinzip der Nähe: Reize, die einander nahe sind, werden als zusammengehörig betrachtet . . . . .. .. .. ..

. . . . . . . . .. .  lt. Gesetz der Nähe gehören diese beiden Punkte zusammen, trotzdem werden sie als zu den beiden verschiedenen Balken des Y gehörend wahrgenommen

2 MUSTERERKENNEN ( Pattern Recognition ) Hauptsächlich mit zweidimensionalen Stimuli erforscht (z.B.: Buchstaben) Schablonentheorie Merkmalsanalyse Strukturbeschreibung

R E A S A B C … 2.1 SCHABLONENTHEORIEN - Template theory Schablone: mentale Kopie des wahrgenommenen Objektes die im LZG gespeichert ist  Schablonen A B C … R E A S  Stimuli

Schablonen: A B C … A B R R E A S

AFT F E Probleme mit Drehung, kursiv, Grösse,... durch Transformation lösbar AFT F E

Probleme: unsaubere Buchstaben verkehrte, unvollständige Buchstaben Kontext-Effekte

K A B R E T T E TER A

Hauptkritik an Schablonenvergleich-Theorie 1 Verzerrungen bei realistischem 3-dimensionalem Input nicht durch einfache Transformation umkehrbar 2 Schablonenvergleich funktioniert nur bei klar isolierten zweidimensionalen Wahrnehmungsobjekten (z.B. Buchstaben auf Papier) 3 Schon bei einfachen zweidimensionalen Stimuli treten Probleme auf, die zeigen, dass die Schablonentheorie nicht stimmen kann

2.2 MERKMALSANALYSE - Feature Theories - einzelne Merkmale (z.B.) von Buchstaben analysisert - Mini-Schablonen für einfache geometrische Merkmale z.B.: z.B.: A H

Was spricht für die Merkmalsanalyse ? 1 Neurophysiologie neurale Detektoren für Kanten, Striche, etc. ( Hubel & Wiesel, 1963 ) auf höherer Ebene unabhängig von der Lokation auf Retina 2 Fehleranalyse beim Erkennen von Buchstaben Vorhersage von mehr Fehlern je mehr gemeinsame Merkmale z.B. 250 Paare von Buchstaben präsentiert E F 39 Verwechslungen T I 22 Verwechslungen E W 3 Verwechslungen T O 0 Verwechslungen

Probleme der Merkmalsanalyse 1 Minischablonen für natürliche Formen? z.B.: Pferd [globale Merkmale (Kopf) unbrauchbar] 2 räumliche Beziehung zwischen Merkmalen unberücksichtigt ( nur Art und Zahl ) A oder  3 3-dimensionale Objekte

2.3 STRUKTURBESCHREIBUNG - Structural Description Bruce & Green (1990) Berücksichtigt Relationen zwischen Merkmalen Strukturbeschreibungen aus elementaren Propositionen (Aussagen) Beschreibt Komponenten einer Konfiguration und deren Anordnung

z. B.: Strukturbeschreibung eines T Es gibt zwei Teile Ein Teil ist eine horizontale Linie Ein Teil ist eine vertikale Linie Die vertikale Linie trägt die horizontale Die vertikale Linie halbiert die horizontale

Probleme der Strukturbeschreibung 1 Strukturbeschreibung für natürliche Formen? 2 3-dimensionale Objekte

3 COMPUTATIONALE THEORIE DER VISUELLEN WAHRNEHMUNG Marr, D.: Vision. San Francisco: Freeman, 1982 Zwei fundamentale Probleme der traditionellen Ansätze 1 Keine klare Abgrenzung von Perzeption und Kognition z.B.: Erkennen des Quadrates ist unabhängig von der Art, wie Begrenzung identifiziert wird Begrenzung kann gesehen werden, ohne dass Figur erkannt zu werden braucht d.h. diese Prozesse (Identifikation von Begrenzungen, Erkennen von Formen) sind unabhängig voneinander

Form unabhängig von Begrenzung erkennbar: Form unabhängig von Begrenzung Begrenzung unabhängig von Form a a a a a a a a a a a a         

Zwei fundamentale Probleme der traditionellen Ansätze 2 Keine klare Problemanalyse d.h. es wird nicht spezifiziert, was man durch die Theorie erreichen will welcher Prozess soll erklärt werden welcher Input, welches Ergebnis

3.1 GRUNDSÄTZLICHE ÜBERLEGUNGEN ZUM WAHRNEHMUNGSPROZESS Aufgabe des Wahrnehmungsprozesses: Dreidimensionale Wirklichkeit muss aus zweidimensionalem Netzhautbild rekonstruiert werden  dabei Schwierigkeiten, z.B. Teile des Gegenstandes können auf Netzhautbild verdeckt sein Gegenstände verschieden scharf Schatten, Spiegelungen, Oberflächenstrukturen, ...

Unterscheidung von zwei globalen Verarbeitungsstufen: Basisprozesse (visuelle Perzeption) eher von Sinnesdaten und allgemeinen Verarbeitungsprinzipien bestimmt Prozess der Extraktion von Informationen aus Daten, ohne spezielle Annahmen über wahrgenommene Objekte Eher datengetrieben (bottom-up) Objekterkennung (visuelle Kognition) Prozess der Erkennung Information aus den Basisprozessen mit der im Gedächtnis gespeicherten Information verglichen eher erwartungsgetrieben (top-down), d.h.: spezielle Annahmen und spezielles Wissen über wahrgenommene Objekte einbezogen

Annahme Marr’s: Wahrnehmungsprozess beinhaltet eine Serie von Repräsentationen unserer visuellen Umwelt, die zunehmend detailliertere Informationen enthält. bei Marr 3 Haupttypen der Repräsentation: Erstskizze (Primal sketch) 2 1/2-D Skizze Repräsentation in Form eines 3-D Modelles

Erstskizze (Primal sketch) 2-dimensionale Beschreibung von Änderungen der Licht-Intensität im visuellen Input, dazu Information über Kanten, Konturen und Flecken beobachterzentriert 2 1/2-D Skizze Beschreibung der sichtbaren Oberflächen, ihre Tiefe (Entfernung) und Orientierung (unter Ausnutzung der Hinweisreize zur Tiefenwahrnehmung) beobachterzentriert Repräsentation in Form eines 3-D Modelles Beschreibt 3-dimensional Form und relative Position von Objekten Unabhängig vom Beobachterstandpunkt!

3.3 BASISPROZESSE ERSTSKIZZE (Primal sketch) Roh-Erstskizze (Raw Primal sketch) Information über Lichtintensität Voll-Erstskizze (Full Primal sketch) Linienrepräsentation von Umrissen, Kanten Oft: Änderung der Lichtintensität an Kanten des Objektes aber: z.B. Schatten, Spiegelungen, Textur Daher nur Änderung der Lichtintensität nicht ausreichend

Zerlegung der Bildfläche in kleine Elemente: Pixels. Problem: Lichtintensität auf jedem Pixel fluktuiert ständig, dadurch könnte die Roh-Erstskizze verzerrt werden. Lösung: Zusammenfassung (Durchschnitt) der Lichtintensität benachbarter Pixels, das führt aber zur Vergöberung (Verschwimmen - blurring) der Bildauflösung. Daher: Mehrere Analysen des Bildes mit unterschiedlichen Graden von Vergröberung. Information aus diesen mehrfachen Analysen wird zur Roh-Erstskizze verarbeitet.

Ergebnis: einfache Elemente wie Kanten, Balken, Flecken, Enden Voll-Erstskizze: Gruppierung derartiger Elemente zu grösseren Einheiten Gruppierungsprinzipien: Nähe Ausrichtung iterativer Prozess

nach neueren Ergebnissen: Vermutlich Gruppierung nicht nur im zweidimensionalen Raum Endergebnis der Erstskizze: Linienrepräsentation enthält aber auch irrelevante Linien beobachterzentriert Abbildung (Bild 110 aus Frisby [1979])

2 1/2 D-SKIZZE Beschreibung der sichtbaren Oberflächen, ihre Tiefe (Entfernung) und Orientierung Ausgangspunkt: Bild- "Zellen" Jede Zelle entspricht einem Bildausschnitt aus der Sicht des Betrachters Information aus Zellen wird zusammengefasst. Verwendete Information: Tiefeninformation aus monokularen/binokularen Hinweisreizen etc. 2 1/2D-Skizze enthält Information über die sichtbaren Oberflächen beobachterzentriert

Siehe Abbildung ( Marr, 1982)

2 1/2 D-Skizze ermöglicht nicht Vergleich mit Gedächtnisinhalt: 1 Nur sichtbare Oberflächen repräsentiert 2 Alles nur aus einem speziellen Blickwinkel d.h. alle Distanzen und Orientierungen relativ zum momentanen Blickpunkt Ändert sich Standpunkt des Betrachters, ändert sich auch die Repräsentation 3 Objekte und ihre Teile nicht explizit abgegrenzt

Neuropsychologische Hinweise, die als Bestätigung für Annahme einer 2 1/2 D-Skizze interpretiert werden können: Wenn nur Prozess der Konstruktion der 2 1/2 D-Skizze geschädigt: Patient kann Helligkeitsunterschiede, Bewegung kleiner Objekte erkennen (Leistung der Erstskizze) Patient kann Objekte mithilfe anderer Sinnesmodalitäten erkennen (z.B. Tasten, Hören) Patient kann Objekt nur mithilfe visueller Information nicht erkennen Benson & Greenberg (1969)

3.4 OBJEKTERKENNUNG Marr (1982) Biederman (1987) Kosslyn et al. (1990) ( Konnektionistische Ansätze ) MARR (1982) , Marr & Nishihara (1978) 3-dim Modell aus Komponenten konstruiert Basiselemente: Zylinder mit Hauptachse Hierarchische Organisation: Grobform+Orientierung  Details (Hauptachse des globalen Objektes stimmt oft nicht überein mit Hauptachsen von Details) 3-D Modell wird mit Modellen im Gedächtnis verglichen (dazu Identifikation der Hauptachse notwendig)

hierarchische Struktur des menschl Körpers Marr & Nishihara (1978)

Orientierung der Hand auf Retina unterschiedlich relative Lage von Hand und Unterarm gleich Orientierung der Hand unterschiedlich bei Bewegung von Schulter und Ellenbogen

BIEDERMAN (1987, etc.): Recognition-by-components-theory Objekte aus Basiskomponenten (geons) zusammengesetzt: Block Zylinder Kugel Bogen Keil etc. insgesamt 36 geons (Analogie zu Wörtern aus Lauten)

Verlauf der Objekt-Erkennung nach Biederman Determination der Geons und ihrer Relationen Vergleich mit Gedächtnisrepräsentationen (Geon-Beschreibungen von Objekten) Kanten-Extraktion Identifikation von nicht-zufälligen Eigenschaften Zerlegung des Objektes

Zerlegung des Objektes (Parsing of regions of concavity) basiert auf geometrischer Regularität: Wenn Objekt aus zwei Teilen gebildet, an der Verbindgsstelle üblicherweise konkave (nach innen ins Objekt gerichtete) Diskontinuität Baum

Detektion von relevanten (nicht-zufälligen) Eigenschaften (Detection of non-accidental properties) Charakteristiken, die aus wechselnden Blickwinkeln unverändert bleiben Werden durch Analyse der Kanten identifiziert: Kurvatur einer Kante Parallele Kanten Kanten mit gemeinsamen Endpunkt Symmetrische Kanten Gerade Kanten Geons aus diesen Invarianten konstruiert Annahme: nicht-zufällige Merkmale in der Repräsentation entsprechen nicht-zufälligen Merkmalen in der Wirklichkeit

Warum können Objekte auch unter suboptimalen Bedingungen erkannt werden (schlechte Beleuchtung, Teilverdeckung)? 1 Invariante Merkmale bleiben oft auch unter suboptimalen Bedingungen erhalten 2 Fehlende Teile können ergänzt werden (sofern Konkavität erhalten bleibt) 3 üblicherweise Redundanz

Empirischer Status + Biederman, Ju & Clapper (1985): Erkennen auch unvollständiger komplexer Objekte ( 90%) Biederman (1987): Erkennen unvollständiger Objekte schwieriger, wenn Information über Konkavität fehlt. Erkennen von Objekten wird durch Farbe nicht gefördert (nicht einmal dort, wo Farbe wichtig ist - Banane) - Komplexe Objekte werden oft zunächst global verarbeitet (z.B. Kimchi, 1992) (wie bei Marr). Zentrale theoretische Annahmen (derzeit) nicht direkt prüfbar (36 geons).

Info über Struktur erhalten Info über Struktur nicht erhalten Biederman (1987) intakte Figur Info über Struktur erhalten Info über Struktur nicht erhalten

Hauptproblem der Theorien von Marr und Biederman: Behandeln relativ einfache/grobe Erkennungsaufgaben (z.B.: Hund oder Kuh), nicht differenzierte Unterscheidungen (z.B.: bestimmter Schäferhund Rex) Rolle anderer Hinweisreize (ausser den Kanten) noch zu wenig untersucht (z.B. Farbe) Vorteile Bisher einzige Theorie des Objekterkennens auch Kontexteffekte können wenigstens Teilweise erklärt werden (Reihenfolge der Gedächtnissuche),