Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Grundbegriffe der operanten Konditionierung

Ähnliche Präsentationen


Präsentation zum Thema: "Grundbegriffe der operanten Konditionierung"—  Präsentation transkript:

1 Grundbegriffe der operanten Konditionierung
Daniel Dietsch Shorena Metreveli Seminar Lerntheorien 2007

2 Operante Konditionierung
Überblick Unterschied zwischen operanter und klassischer Konditionierung 4 Phasen der operanten Konditionierung Verstärkung, Bestrafung und Hinweisreize Arten von Verstärkern Verstärkungspläne Latentes Lernen Verhaltensdifferenzierung und -verkettung Operante Konditionierung

3 Operante Konditionierung
Klassische Konditionierung Reiz-Reaktions-Lernen Zweigliedrige Kontingenzen (Stimulus Reaktion) Vorhergehende Reize sind Verhaltensbestimmend Mit Reaktionen sind unwillkürliche, biologische Reaktionen gemeint, welche durch die Darbietung eines bestimmten Stimulus auch ohne Lernerfahrung (reflexartig) ausgelöst werden können Der Organismus wird durch den Reiz kontorlliert Operante Konditionierung Lernen durch Konsequenzen Dreigliedrige Kontingenzen (Stimulus-Verhalten-Konsequenzen) Verhaltenssteuernd sind sowohl vorhergehende (diskriminative) Reize, wie auch nachfolgende Konsequenzen Mit Reaktionen ist ein Verhalten gemeint, welches absichtlich gezeigt wurde und auf welches eine Konsequenz folgt Der Organismus wirkt aktiv auf die Umwelt ein Operante Konditionierung

4 Operante Konditionierung
Edward Lee Thorndike amerikanischer Pädagoge und Psychologe „Trial and Error“ – Theorie Zusammenhang zwischen Verhalten und seinen Konsequenzen tritt in den Vordergrund Reiz Reaktion Verstärkung Gesetz des Effekts Operante Konditionierung

5 Operante Konditionierung
Burrhus F. Skinner Operante Konditionierung nach Skinner Verhalten und die Auftretenswahrscheinlichkeit einer Reaktion im Mittelpunkt verschieden Arten der Verstärkung als Konsequenz Skinner-Boxen Operante Konditionierung

6 Phasen einer operante Konditionierung
Die Bestimmung der Basisrate Wie oft tritt das gewünschte Verhalten ohne Konditionierung auf ? Trainingsphase Gewünschtes Verhalten wird gezielt verstärkt Löschung Verhalten wird nicht weiter verstärkt Spontanerholung Verhalten tritt nach einiger Zeit ohne Verstärkung wieder auf, wenn die experimentelle Situation unterbrochen und dann wieder hergestellt wird Operante Konditionierung

7 Verstärkung, Bestrafung, Hinweisreiz
Positive Verstärker Belohnungslernen Negative Verstärker Fluchtlernen Bestrafung Typ I Einem Verhalten folgt eine unangenehme Verhaltenskonsequenz, indem der Situation ein unangenehmer Reiz hinzugefügt wird Typ 2 Einem Verhalten folgt eine unangenehme Konsequenz, indem aus der Situation ein angenehmer Reiz entfernt wird Diskriminative Hinweisreize Operante Konditionierung

8 Operante Konditionierung
Arten von Verstärkern Primäre Verstärker Sie sind an die physiologischen Bedürfnisse gebunden ( Hunger, Durst ) und sind ohne vorhergehenden Lernprozeß wirksam. Sekundäre Verstärker Zuvor neutraler Reiz (Geräusch im Futtermagazin z.B.) wird durch Koppelung an primären Verstärker (Futter) zu einem sekundären Verstärker Generalisierte Verstärker Eine sekundäre Verstärker wird mit mehreren primären Verstärkern gekoppelt (Geld) Weitere Verstärker Personenverstärker Selbstverstärkung Fremdverstärkung Operante Konditionierung

9 Operante Konditionierung
Verstärkungspläne Abhängig von Art und Zusammenwirken von Verstärkern Kontinuierliche Verstärkung Intermittierende Verstärkung Operante Konditionierung

10 Operante Konditionierung
Verstärkungspläne Intermittierende Pläne werden weiter unterschieden Intervallplan Quotenplan Beide Pläne gibt es in zwei Ausprägungen Variabel Fix Operante Konditionierung

11 Verstärkungspläne Kontinuierliche Verstärkung
Intermittierende Verstärkung Intervallplan Quotenplan variabel fix Operante Konditionierung

12 Operante Konditionierung
Verstärkungspläne Höher Niedriger Lerngeschwindigkeit Kontinuierlich Intermittierend Löschungsresistenz Reaktionshäufigkeit Quotenpläne Intervallpläne Gleichmäßigkeit Variable Pläne Fixierte Pläne Operante Konditionierung

13 Operante Konditionierung
Verstärkungspläne Beispiel Wenn ein Kleinkind im Beisein der Eltern zum ersten Mal allein erfolgreich auf einen Stuhl klettert, dann ist dies für die Eltern Anlass zu Freude und Lob. Lob ist ein äußerst wirksamer Personenverstärker. Die Eltern werden eine Zeit lang noch jedes Mal, dann aber nur noch ab und zu durch Aufmerksamkeit und Lob verstärkend wirken, bis sie schließlich das Verhalten gar nicht mehr verstärken. Das aber bleibt nun ohne negative Konsequenzen für das Auftreten des Verhaltens, denn der Lernprozess ist erfolgreich abgeschlossen. Kontinuierliche Verstärkung zum Verhaltensaufbau Über langen Zeitraum abnehmende variable intermittierende Verstärkung zur Stabilisierung Operante Konditionierung

14 Operante Konditionierung
Verstärkungspläne Weitere Aspekte Zeitdiskrimination Nicht kontingente Verstärkungspläne Abergläubisches Verhalten Optimale Verstärkungspläne Bei fixen intermittierenden Plänen entwickelt sich eine Zeitdiskrimination Verstärkung unabhängig von Auftreten eines Verhaltens nach variablen oder fixiertem Intervallplan -> supersticious behavior (Skinner) Lernen am vorherigen Beispiel Operante Konditionierung

15 Operante Konditionierung
Verstärkungsmenge Negativer Kontrasteffekt Depressionseffekt Positiver Kontrasteffekt Versuch Crespi 1942 Ratten laufen durch 7m langen Gang, am Ende Futter, Zeit wird gemessen , 1x am Tag 3 Gruppen 10 / 7 / 7 16 / 64 / 256 Futtereinheiten am Ziel Alle gleiche Futtermenge über den Tag Operante Konditionierung

16 Operante Konditionierung
Latentes Lernen Ohne Verstärkung kann man auch Lernen Experiment von Tolman und Honzik Kompetenz-erwerb vs. Performance Tolman und Honzik 1930 3 Gruppen, 1 ohne Futter, 1 mit kont. , 1 mit kont. Ab dem 11. Tag Labyrinth (Fehler = Sackgasse) mit Zielkammer. Nach Erreichen Entfernung aus dem Labyrinth und Belohnung / Verstärkung Kritik: natürliche Exploration Operante Konditionierung

17 Einfluss des Zeitintervalls
je größer der Zeitabstand desto geringer der Lerneffekt Experimente Ratten (Grice) Tauben (Rachlin / Green) Beim Menschen Diskontierung (Verringerung des subjektiven Werts bei längerem Intervall) social traps Reizdiskrimination Grice: Ratten laufen Start -> Ziel, dazwischen Diskriminationskammer mit weissem Gang und schwarzem Gang und danach einstellbar langem grauen Gang 1. Lernen zum Ziel zu laufen in farblich neutralem Umfeld 2. Je nach Bedingung Verstärkung nach 0, 0,5 , 1,2 , 2, 5, 10sec 3. 10sec Gruppe lernte nicht (18 von 20 davon die letzten 10 korrekt) auch nach 1440 Durchgängen Rachlin / Green : Tauben picken auf farblich unterschiedliche Schalter (Lichter): bei rot sofort kleine Verstärkung, bei grün nach 4s große Operante Konditionierung

18 Diskrimination und Differenzierung
Reizdiskrimination Schrittweises Ausblenden (fading) Die lesende Taube (Reese) Tiere lernen wie man lernt (Medin, Reese) Verhaltensdifferenzierung Einzelne Aspekte werden verändert stufenweise Annäherung (shaping) RD: Reese: Bildschirm mit Wörtern, wenn „turn“ erscheint dreht sie sich wenn „peck“ erscheint pickt sie zuerst stark unterschiedliches Aussehen der WÖrter in Größe Form und Farbe, danach schrittweise Annäherung RD: Wenn Tiere solche Aufgaben öfter machen lernen sie das gewünschte Diskriminationsverhalten schneller (deutliche Unterschiede zwischen den Tierarten) VZ: Ratte mit kräftigem Hebeldruck: zuerst nur Drücken, danach nur noch kräftigeres Drücken, noch kräftigeres Drücken Kinder: Kopf wenden , Näher kommen, aktive Teilnahme Operante Konditionierung

19 Verhaltensverkettung
Training des letzten Teils der Verhaltenskette auf einen Hinweisreiz Ein neues Verhalten wird auf einen anderen Hinweisreiz konditioniert Der Hinweisreiz aus 1. wird als Verstärker bei 2. verwendet. Auch das Verhalten selbst kann der Verstärker werden Innere Reize werden zu Verstärkern Chaining Das Verhalten m wird auf einen diskriminanten Hinweisreiz n konditioniert, das Verhalten m-1 auf den Hinweisreiz n-1. Für die letzte Konditionierung dient nun der (geeignet gewählte) Hinweisreiz n als sekundärer Verstärker. Dies wird fortgeführt bis m=1 ist. Operante Konditionierung

20 Operante Konditionierung
Danke fürs Zuhören Operante Konditionierung

21 Operante Konditionierung
Quellen Spada, Operante Konditionierung in Lehrbuch Allemeine Psychologie, S , Huber-Verlag 2006 Kaup, Vorlesung Allgemeine Psychologie II, TU Berlin 2004 Bodenmann, Perrez, Schär, Trepp, Klassische Lerntheorien S , 2004 Operante Konditionierung


Herunterladen ppt "Grundbegriffe der operanten Konditionierung"

Ähnliche Präsentationen


Google-Anzeigen