Lernmodelle und Experimentelle Untersuchungen

Slides:



Advertisements
Ähnliche Präsentationen
Wissensanalyse von Aufgaben mit TKS Eine Methode zur Problemlösung
Advertisements

Gliederung der Ausführungen: Einleitung, Hauptteil, Schluss
Berg-Schlosser : VL : Vergleichende Politikwissenschaft Vergleichende Methoden Ausgangsbasis : Fälle: begrenzte Auswahl auf der Makro-Ebene, abhängig.
Das Modell «Hotelling»
Genetische Algorithmen für die Variogrammanpassung
Soziales Lernen und Persönlichkeitsentwicklung in realen und virtuellen Spiel- und Rollenspielwelten Spielerisch zu sozialer Kompetenz, emotionaler Intelligenz.
Eine gewagte These Wir können in und mit Spielen die Welt retten und besser machen und irgendwann wird sie funktionieren wie ein gutes Spiel …... nach.
Fragetechnik statt Sagetechnik
Genetische Algorithmen
Genetische Algorithmen
Heuristiken und Kontexteinflüsse
Erfahrungen aus Tests komplexer Systeme
Gewissheit-/ Ungewissheitsorientierung
Das Kontinuum-Modell von Fiske und Neuberg
Experiment 2 Unterscheidung verschiedener Vokalkategorien (mit Versuchsbegrenzung) Carola Mook Nach einem Artikel von Patricia K. Kuhl.
Was ist die artikulatorische Grundlage von Locus-Gleichungen? Hauptseminar: Modelle der Sprachproduktion & - perzeption Dozent: Prof. Dr. Jonathan Harrington.
Lernende Agenten Seminar Softwareagenten Wintersemester 2001/2002 Norman Neuhaus.
Konfidenzintervalle für Parameter
Modellvergleich.
Reinforcement Learning
Soziale Interaktion und Alltagsleben
Sozialisation 2. Vorlesungseinheit:
Modellbildung in der Geoökologie (G5, 103) SS 2004
Definition: Anlage - Umwelt
Theorie soziotechnischer Systeme – 12 Thomas Herrmann Informatik und Gesellschaft FB Informatik Universität Dortmund iundg.cs.uni-dortmund.de.
Was ist eigentlich Psychologie????
Wiederholung und Beispiele
Machine Learning Was wir alles nicht behandelt haben.
Grundzüge der Mikroökonomie
Modellierung der cerebralen CO 2 -Reaktivität Vortrag im Rahmen des Studentenseminars Physik in der Biologie am Linda Spindeler.
Entwicklung standardorientierter Aufgaben – am Beispiel naturwissenschaftliche Erkenntnisgewinnung Jürgen Mayer.
Bildungsstandards Pilotphase II Wimmer Bildungsstandards Wozu brauchen wir Bildungsstandards? Was ist Aufgabe der Pilotphase II?
Datenverteilung in Ad-hoc Netzen 1/24 Adaptive Datenverteilung in mobilen Ad-hoc Netzen unter Verwendung des Area Graph basierten Bewegungsmodells S. Bittner,
Universität Münster, Institut für industriewirtschaftliche Forschung Stefan Kooths Eric Ringhut KI-gestützte Konjunkturprognosen mit GENEFER Adaptive Fuzzy.
K. Meusburger & C. Alewel finanziert vom BAfU
Logistische Regression
©AHEAD executive consulting, 2007 STAY AHEAD! Auftragsorientierte Mitarbeiter- und Teamentwicklung für Mitarbeitende der Firma … AG.
Computational Thinking Online Algorithmen [Was ist es wert, die Zukunft zu kennen?] Kurt Mehlhorn Konstantinos Panagiotou.
Präsentation von Heinz Ernst Hauptsächliche Quelle:
Statistik: Mehr zur Regression.
“Talententwicklung und Führung”
Ein naturwissenschaftliches Projekt – in 3er Gruppen
Kompetenz -, Lern - und Prüfungsbereiche Anforderungsbereiche
CEF 2001, New Haven Genetic Neural Fuzzy Explorer GENEFER Konzeption, Technologien und Einsatzmöglichkeiten Eric Ringhut Muenster Institute for Computational.
Würden Sie darauf wetten,
Empirische Softwaretechnik
Eine Modellierungsaufgabe
Elternwerkstatt 4. Abend
One plus One Evolutionary Optimizer
KINSHIP BEHAVIOR Seminar aus angewandter Spieltheorie Christian Artner.
Modellbildung und Simulation
Wider den Methodenzwang
% +0,8% -7,9% -9,5% +1,1% +0,6% +1,5% +0,45% -5,5% -17,7% VRG 15-ORF -17,7% % -10,85% -2,4%
Klassifikation und Regression mittels neuronaler Netze
Modul 5 Berufsvorbereitung.
1 Strukturierung von Situationen (Strukturierung als Lernkomponente) Thomas Höpfel Seminar für Rechtstheorie und Rechtsinformatik WS 2004/05.
Georg Spitaler PS Interpretative Zugänge zu Popularkultur WS 2004/05.
10. KFKI-Seminar • • Bremerhaven
Wahlpflichtkurse im Schuljahr 2015/  eigenes Erleben und Verhalten sowie das der Anderen besser verstehen  erfahrungsorientiert und lebensnah.
Universität Karlsruhe (TH) Forschungsuniversität · gegründet 1825 Lehrstuhl für Programmiersysteme Fakultät für Informatik 1 Anforderungen und Probleme.
Modellbildung und Simulation
Methoden der Sozialwissenschaften
SS 2009Maschinelles Lernen und Neural Computation 133 Kapitel 7: Ensemble Methoden.
Die klassischen Methoden der historisch-vergleichenden Forschung Universität Zürich Soziologisches Institut Seminar: Methoden des internationalen Vergleichs.
C3: Strategische Interaktion und Anreize für nachhaltiges ökonomisches Handeln Page 1  Ziel: Untersuchung von Anreizproblemen, die nachhaltige Wertschöpfungsnetze.
 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.
Institut für Verkehrssystemtechnik Dipl.-Psych. David Käthner Telefon:0531 / Ein kognitives Fahrermodell:
Angewandter Glückskurs
 Präsentation transkript:

Lernmodelle und Experimentelle Untersuchungen Motivation Lernmodelle Tests der Lernmodelle in der Literatur Methodische Aspekte Test: Lernen im Gefangenendilemma Schlussbemerkungen Oktober 2004 Thomas Brenner

Motivation Wichtigkeit von Lernmodellen: Verhalten ändert sich / Umgebung ändert sich Verständnis für die Dynamik ökonomischen Verhaltens Experimentelle Untersuchung: Psychologie: keine „guten“ Modelle Direkte Untersuchung: Verallgemeinerung ? Test von Lernmodellen: welche Situation ? Viele Situationen: einheitliches Lernmodell ? 2

Lernprozesse Psychologisch: Verstärkungslernen (unbewusstes Lernen) Beobachtungslernen (regelbasiertes Lernen) Kognitives Lernen (verstehendes Lernen) Ökonomisch (modellorientiert): Erfahrungsorientiertes Lernen Erwartungsorientiertes Lernen 3

Erfahrungs- orientiert Erwartungs- orientiert Lernmodelle Erfahrungs- orientiert Erwartungs- orientiert Sonstige unbewusst Reinforcement learning (Roth/Erev vs. Bush/Mosteller) - regelbasiert Fictitious play Least-square learning (Bayesian learning) Genetic algorithms Learning direction theory Satisficing verstehend (Fictitious play) Bayesian learning Mentale Modelle Genetic programming

Untersuchungen in der Literatur I Einfache Situationen (Markt mit Gleichgewicht): Zufallsverhalten (zero-intelligence) führt bereits zu guter Übereinstimmung mit experimentellen Daten Andere Lernverhalten führen zu ähnlichen Prognosen Wiederholte strategische Interaktionen: Erwartungsorientiertes Lernen ist besser als erfahrungsorientiertes Lernen Beides ist in der Regel besser als Gleichgewicht Realität zwischen beiden 5

Untersuchungen in der Literatur II Komplexe Situationen: Genetische Algorithmen weisen einen gewissen Erfolg bei der Übereinstimmung mit Experimenten auf Interpretation von Zeit und Verhalten ist jedoch schwierig Andere Lernprozesse: Keine Tests zu Bayesian und least-square Lernen Learning direction theory wird in der Regel bestätigt, macht aber schwache Aussagen 6

Methodische Aspekte I Üblich: Vergleiche von Lernmodellen Eine Situation oder bestimmter Situationstyp Durchschnittliches Verhalten oder Wahrscheinlichkeit wird mit Vorhersage verglichen Erreichtes: Gewisse Lernprozesse besser für bestimmte Situationen Genetische Algorithmen oft geeignet Gründe und klare Klassifikation fehlen 7

Methodische Aspekte II Fragen: Gibt es ein einheitliches Lernmodell und ist es sinnvoll ? Populationsebene oder Individuum ? Wettlauf von Modellen oder Klassifikation von Umständen ? Parameteranpassungen ? Beschreibung oder Erklärung ? 8

Zeilenspieler / Spaltenspieler Gefangenendilemma Spiel: Zeilenspieler / Spaltenspieler A B 3 / 3 0 / 5 5 / 0 1 / 1 Interaktion: Feste Paare 25 wiederholte Interaktionen 9

Verstärkungslernen (Reinforcement learning) Idee: Erfolgreiche Aktionen werden in der Zukunft häufiger gewählt Erfolglose Aktionen werden in der Zukunft seltener gewählt Mathematik: pi(t+1) = pi(t) +  (t) (1-pi(t)) falls (t) > 0 pi(t+1) = pi(t) +  (t) pi(t) falls (t) < 0 10

Kognitives Lernmodell: Erwartungen 1. Ebene: Erwartung I: eigenes Verhalten beeinflusst Gegenüber nicht 2. Ebene: Erwartung E: Gegenüber kann ausgenutzt werden Erwartung C: Kooperation kann erreicht werden Erwartung D: Gegenüber wird immer defektieren 11

Kognitives Modell: Dynamik Entfernung von Erwartungen: Erwartungen verschwinden mit einer bestimmten Wahrscheinlichkeit, falls sie widerlegt werden Neue Erwartungen: Variation: Zufällig entstehen neue Erwartungen Kommunikation: hier nicht relevant Notwendigkeit: falls keine Erwartung übrig ist 12

Experimentelle Daten Experiment: London 10 Teilnehmer 30 Interaktionen Vollständige Information Analysierte Daten: 10 Verhaltenssequenzen von 25 Runden mit einem gegebenen Verhalten des Gegenübers 13

Analyse Modelltest: Jeder Teilnehmer getrennt Monte Carlo Ansatz für Parameter Likelihood der Übereinstimmung 14

Resultate: Likelihood-Werte Teilnehm. Kognives Lernen Reinforcement Trembling Hand 1 0,0217 0,000169 0,000000 2 0,0413 0,0446 0,0150 3 0,244 0,000002 4 0,000506 0,000940 5 0,164 0,0655 6 0,0327 0,000121 7 0,00213 0,000956 8 0,000005 0,000013 0,000001 9 10 0,000781 0,000739

Schlussbemerkungen Zusammenfassung: Verhalten durch Lernen geprägt Individuen verhalten sich unterschiedlich Experimente für Verständnis und Modellierung hilfreich Ausblick: Klassifikation von Situationen Weiterentwicklung von Modellen Beziehung zwischen Situationen und Modellen 16