Methoden der Psychologie

Slides:



Advertisements
Ähnliche Präsentationen
Korrektur Tutoratsaufgaben V
Advertisements

Thema der Stunde I. Einführung in die Varianzanalyse:
Einfaktorielle Varianzanalyse
Mixed Models Jonathan Harrington library(ez) library(lme4)
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Ein frohes und erfolgreiches Jahr
Effektgrößen, Kontraste & Post-hoc-Tests
Aufgabe Der Zusammenhang zwischen einem traumatischen Erlebnis und der Entstehung einer PTBS wird von mehreren Variablen …………….: Copingstrategien, Kontrollüberzeigung,
Tutorium
Tutorium
Vorlesung: ANOVA I
Deutsch als Zweitsprache: Experimentelle Methoden WS 2013/2014
Varianzanalyse IV: Messwiederholung
Multivariate Statistische Verfahren
Das Allgemeine Lineare Modell (ALM)
Multivariate Statistische Verfahren
Theorie psychometrischer Tests, II
Multivariate Statistische Verfahren
Soziale Urteilsbildung Lozo, Soziale Urteilsbildung, AE Sozialpsychologie, SS 2004 Laienhafte Inferenzstrategien oder „the intuitive psychologist“ 2: Urteilsheuristiken.
Thema der Stunde Varianzanalyse mit Messwiederholung
Geoinformationssysteme
Signifikanzprüfung Peter Wilhelm Herbstsemester 2015.
Statistische Auswertung und Darstellungsmöglichkeiten von Messdaten Seminarvortrag von Christian Gorgels im Studiengang Scientific Programming.
Außenhandelsbeziehungen zwischen China, USA, EU Makroökonometrie Vorlesung Dr. Oliver Bode.
Ein Dozent hat mittels eines Fragebogens die Körpergröße seiner Studenten festgestellt. Anhand der erfassten Daten weiß er, dass der kleinste Student 158.
Methoden der Psychologie
Betrachtung der Realität aus der Sicht der Statistik VARIABILITÄT
Die Varianzanalyse Jonathan Harrington library(ggplot2) library(ez)
7.2 Theoretische Kennwerte
Vom Stereotyp zur Diskriminierung
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
WS 2001/2002 Mehrbenutzerzugriff auf GIS-Daten
Einführung in die Diskriminanzanalyse
Einführung in die Wahrscheinlichkeitsrechnung
Transformationskurve und Opportunitätskosten
Abiturprüfung Mathematik 2017 Baden-Württemberg Allgemeinbildende Gymnasien Wahlteil Analysis A 1 Lösungen der Aufgaben A 1.1 und A 1.2
Transformationskurve und Opportunitätskosten
Abiturprüfung Mathematik 2015 Baden-Württemberg Allgemeinbildende Gymnasien Pflichtteil Lösungen
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Ökonometrie und Statistik Logistische Regression
Ökonometrie und Statistik Mehrfachregression
Fächerabwahl am Ende der Jahrgangsstufe Q2-1
KAMAGRA Halten Sie Ihre Hände
Kapitel 2: Testtheorie / Testmodelle
12 Das lineare Regressionsmodell
Forschungsstrategien Johannes Gutenberg Universität Mainz
Ausgewählte Folien für Lehreinheit C3
Ökonometrie und Statistik Prüfungsthemen
Einsatzmatrix 2.0.
Wahlteil 2009 – Geometrie II 1
Pflichtteil 2016 Aufgabe 6: Gegeben ist die Gerade
Kapitel 2: Testtheorie / Testmodelle
Die Varianzanalyse Jonathan Harrington library(ggplot2) library(dplyr)
Stochastik in der Sekundarstufe I Didaktische Bemerkungen
Abiturprüfung Mathematik 2015 Baden-Württemberg Allgemeinbildende Gymnasien Wahlteil Analytische Geometrie / Stochastik Aufgabe B 2.1 und B Lösungen.
Übersicht Etwas Mathematik (ganz ohne geht es nicht).
Konfidenzintervalle und Tests auf Normalverteilung
ANOVA für unabhängige Daten.
Zusammengesetzte Ereignisse
Johann D. Müller, Merlin Dwenger , Mats Böttrich
Fortgeschrittene statistische Methoden SS2020
Web-Mining Agents Planning
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Ökonometrie und Statistik Unabhängigkeitstest, c² - Test (Chi Quadrat Test) Dr. Bertram Wassermann.
RGB-LED Projekt INGOLSTADT.
 Präsentation transkript:

Methoden der Psychologie Teil 4: Versuchsplanung (II) Psychologisches Institut der Johann Gutenberg Universität Mainz Uwe Mortensen SoSe 2016 17.09.2018

Quantitative Methoden Inferenz Vergleich von mehr als zwei Mittelwerten: Varianzanalyse (ANOVA = Analysis of variance) Man möchte prüfen, ob sich die Studierenden verschiedener Fächer hinsichtlich Ihrer Neigung zur Prokrastinationvoneinander unterscheiden: 17.09.2018

Quantitative Methoden Inferenz Das ''Design'' (= der Versuchsplan) ist 2-faktoriell, dh es gibt zwei ''Faktoren'', (1) das Studienfach, (2) das Geschlecht. Für den Faktor Studienfach gibt es p ''Stufen'' (levels), für den Faktor Geschlecht gibt es zwei. Es gibt demnach, mit r = 2p, r(r-1)/2 mögliche Paare von Mittelwerten. Für p = 5 sind das 45 Paare! Das Problem: die Alpha-Inflation. Führt man 45 t-Tests durch, so gibt es Insgesamt 45 Möglichkeiten, die Nullhypothese fälschlich zurückzuweisen. Die Wahrscheinlichkeit mindestens einer Fehleintscheidung ist dann Gilt also die globale Nullhypothese: die Studierenden der verschiedenen Unterscheiden sich nicht hinsichtlich ihrer Neigung zur Prokrastination, So ist die Wahrscheinlichkeit, sich mindestens einmal für H1 zu entscheiden, Gleich .9! Man sieht Unterschiede, wo keine sind! 17.09.2018

Quantitative Methoden Inferenz Wie kann man derartige Fehlentscheidungen verhindern? Nahezu geniale Idee von Ronald Aylmer Fisher (1890 - 1962) Man zerlege die Gesamtvarianz der Daten! Illustration für den einfaktoriellen Fall (Mittelung über das Geschlecht der Studierenden). Grundannahme: 17.09.2018

Quantitative Methoden Inferenz 17.09.2018

Quantitative Methoden Inferenz F-Test: setzt Normalverteilung der Daten voraus und homogene Varianzen! 17.09.2018

Quantitative Methoden Inferenz Der zweifaktorielle Fall Strukturgeichung: Haupteffekte Wechselwirkungseffekte (nicht additiver Effekt) Allgemein: 17.09.2018

Quantitative Methoden Inferenz 17.09.2018

Quantitative Methoden Inferenz Komplett randomisierte Vpn-Gruppen oder Meßwiederholungen (replicated verus repeated measurements) Im komplett randomisierten Fall sind alle Messwerte unabhängig voneinander. Im Meßwiederholungsfall werden dieselben Vpn unter verschiedenen Bedingungen bezüglich der abhängigen Variablen gemessen. Die Messungen sind dann i.A. Korreliert → Problem, denn der F-Quotient Basiert auf der Annahme unabhängiger Messungen! Statistik-Programme benutzen verschiedene Algorithmen, → man muß angeben, welcher Fall vorliegt. 17.09.2018

Quantitative Methoden Inferenz Auswahl der Stufen: Fixed, Random und Mixed Models: Fixed model: die Stufen eines Faktors sind fest vorgegeben (zB weiblich, männlich) oder werden als „feste Stufen“ aufgefasst; der F-Test bezieht sich nur auf diese Stufen. Random model: die Stufen eines Faktors sind eine zufällige Auswahl aus Einer Menge von möglichen Stufen. Beispiel: Man will verschiedene Therapieformen miteinander vergleichen, die aber nicht alle an allen Krankenhäusern angewendet werden. Insgesamt gibt es viele Krankenhäuser, aus denen eine Stichprobe von Krankenhäusern ausgewählt wird. Der Faktor ''Krankenhaus'' ist ein Random Faktor. Da das Ergebnis auf auf alle Krankenhäuser verallgemeinert werden soll, muß ein Spezieller F-Test konstruiert werden, daher die Rede von einem Random Modell. 17.09.2018

Quantitative Methoden Inferenz Mixed model: ein einem Experiment kommen Faktoren mit festen Stufen und mit Random-Stufen vor; es entsteht ein Mixed Model. Die F-Tests für diesen Versuchsplan müssen den entstehenden Mischungen von fixed und random-Stufen entsprechen. Deshalb Hierarchische Versuchspläne: nicht alle Stufen eines Faktors Wird mit jeder Stufe eines anderen Faktors kombiniert: 17.09.2018

Quantitative Methoden Inferenz Zweifaktorieller hierarchischer Versuchsplan_ Bei derartigen Versuchplänen sind nicht mehr alle Interaktionen testbar; man muß also bei der Planung darauf achten, welche Interaktionen für den Test der Hypothese von Bedeutung sind! 17.09.2018

Quantitative Methoden Inferenz Veränderungshypothesen: Man will Lernverläufe, Therapieverläufe, Interventionen,allgemein Veränderungen von Merkmalen und/oder Verhaltensweisen im Laufe der Zeit untersuchen, wobei typischerweise der Effekt von einem oder Mehr Faktoren erfasst werden soll. Im Prinzip lassen sich zwei Arten von Untersuchungen unterscheiden: Querschnitt- und Längsschnittuntersuchungen. Bei der Querschnittsuntersuchung werden für jeden Zeitabschnitt Verschiedene Personen untersucht, zB Personen aus verschiedenen Altersgruppen. Vorteil: man kann die Untersuchung in einem Zeitraum durchführen. Nachteil: Die Unterschiede zwischen den Personen in den Stichproben erhöhen die ''Fehler''varianz → Reduktion der Sensitivität des Experiments. Personen gehören verschiedenen Generationen an, Konfundierende Effekte möglich (Entwicklungs- mit Generationseffekten Verwechselt). 17.09.2018

Quantitative Methoden Inferenz Bei der Längsschnittuntersuchung wird eine Gruppe von Personen über verschiedene Zeitabschnitte hinweg beobachtet. (Panel-Untersuchung einer Kohorte). Zu berücksichtigen: Messwiederholungen (korrelierte Messwerte!). Vorteil: Reduktion der Fehlervarianz durch Identität der Personen. Nachteil: sehr aufwändig, da Personen immer wieder ausfindig gemacht Werden müssen. Manche Personen gehen ''verloren''. Reaktionen auf Testinstrumente können sich im Laufe der Zeit ändern. Datenanalyse: ANOVA (Messwiederholungen), aber auch Korrelations- methoden (Kanonische Korrelation) 17.09.2018

Quantitative Methoden Inferenz Datenanalyse: ANOVA, Regressionsanalysen, etc A = Behandlung, B = keine Behandlung 17.09.2018

Quantitative Methoden Inferenz – Analyse von Häufigkeiten Bisher: Fokus auf der Analyse von Messungen → ANOVA. Aber was tun, Wenn nur Häufigkeiten zur Verfügung stehen? Man ist nicht nur an ''Haupteffekten'' interessiert (= Unteeschiede zwischen Randsummen), sondern an ''Wechselwirkungen'', - dh spzielle Beziehungen zwischen Körperbau und Erkrankung. 17.09.2018

Quantitative Methoden Inferenz – Analyse von Häufigkeiten Nullhypothese: es gibt keinen Zusammenhang, eventuelle Häufungen sind nur zufällig. Für die Konjunktionen Körperbau (A) und Erkrankung (B) heißt dies: P(A) und P(B) ergeben sich aus den Randsummen der Tabelle, jeweils Geteilt durch das Gesamt-N (Gesamtzahl aller Beobachtungen) Test der Nullhypothese: Vergleiche tatsächliche Häufigkeiten mit den auf der Basis der Nullhypothese vorhergesagten Häufigkeiten. 17.09.2018

Quantitative Methoden Inferenz – Analyse von Häufigkeiten 17.09.2018

Quantitative Methoden Inferenz – Analyse von Häufigkeiten Testvertilung ist die Chi-Quadrat-Verteilung: z-Werte standardnormalverteilt und stochastisch unabhängig. (Chi-Quadrat-Verteilung ist Verteilung der Stichprobenvarianz) Bilde für jede Zelle (i, j) (i-te Zeile, j-te Spalte) die Größe (Unter der Nullhypothese!) 17.09.2018

Quantitative Methoden Inferenz – Analyse von Häufigkeiten Der Chi-Quadrat-Test liefert Aussage zur Frage, ob überhaupt irgendwelche Abhängigkeiten existieren (analog zum F-Test bei der ANOVA) Aber wie ist es mit Einzelaussagen (a posteriori-Aussagen)? Vorsicht: keine ANOVA rechnen, da die Voraussetzungen bei Häufigkeits- Tabellen nicht erfüllt sind! Stattdessen: log-lineare Analyse Unabhängigkeit: (Nullhypothese) (Alternative 17.09.2018

Quantitative Methoden Inferenz – Analyse von Häufigkeiten repräsentiert Abhängigkeit! Höherdimensionale Tabellen: und 17.09.2018

Quantitative Methoden Inferenz – Analyse von Häufigkeiten Simpsons Paradox Schwarze werden in den USA häufiger zum Tode verurteilt als Weiße - ein Vorurteil? (Rachelet, M. (1981) Racial characteristics And impositoin of the death penalty. Amer. Sociol. Review, 46, 918-927) Diese Tabelle ist allerdings über die Dimension 'Farbe des Opfers' aggregiert worden: 17.09.2018

Quantitative Methoden Inferenz – Analyse von Häufigkeiten Simpsons Paradox Der Trend ist in der vollständigen Tabelle dem in der aggregierten Tabelle gerade entgegengesetzt! Es gibt einen Trend, Schwarze eher zum Tode zu verurteilen, der durch die konfudierende Variable 'Farbe des Opfers' verstärkt wird! 17.09.2018

Quantitative Methoden Inferenz – Analyse von Häufigkeiten Simpsons Paradox 1973 wurde die University of California Berkeley wegen ungerechter Zulassung von Frauen zum Studium verklagt: Auflösung: Frauen beworben sich eher auf Studiengänge mit mehr Bewerbern und damit mit höherer Ablehnungsquote. 17.09.2018

Quantitative Methoden Inferenz – Analyse von Häufigkeiten Deskriptive Modelle 17.09.2018

Quantitative Methoden Inferenz – Analyse von Häufigkeiten Trends bei Doktorgraden in den USA 17.09.2018

Quantitative Methoden Inferenz – Analyse von Häufigkeiten Kurve: Pareto-Kurve, sie würde auf gewisse Mechanismen in der Fächer- Wahl verweisen – passt aber nicht! 17.09.2018

Quantitative Methoden Inferenz – Analyse von Häufigkeiten Korrespondenzanalyse 17.09.2018

Quantitative Methoden Inferenz – Analyse von Häufigkeiten Selbstmorde in Deutschland 1974 – 1977, männlich 17.09.2018

Quantitative Methoden Inferenz – Analyse von Häufigkeiten Selbstmorde in Deutschland 1974 – 1977, weiblich 17.09.2018

Quantitative Methoden Inferenz – Analyse von Häufigkeiten Selbstmorde in Deutschland 1974 – 1977 Anzahl der Selbstmorde als Funktion des Alters, aggregiert über die Methoden 17.09.2018

Quantitative Methoden Inferenz – Analyse von Häufigkeiten Selbstmorde in Deutschland 1974 – 1977, Methode und Geschlecht 17.09.2018

Quantitative Methoden Inferenz – Analyse von Häufigkeiten Korrespondenzanalyse 17.09.2018

Quantitative Methoden Inferenz – Analyse von Häufigkeiten Klassifikation und Vorhersage: logistische Modelle Problem: Verhalten soll vorhergesagt werden, etwa Rückfälligkeit bei Sucht, kriminelles Verhalten, Infektion bei Operationen, Eignung zum Psychologiestudium, etc Sei H die Hypothese, dass das in Frage stehende Ereignis eintritt, und x Sei ein Satz von Daten, die als Basis für die Vorhersage dienen sollen. Nach Dem Satz von Bayes gilt ganz allgemein P(H) ist die a priori-Wahrscheinlichkeit, P(x|H) ist die Likelihood der Daten unter Bedingung, dass H wahr ist. 17.09.2018

Quantitative Methoden Inferenz – Analyse von Häufigkeiten 17.09.2018

Quantitative Methoden Inferenz – Analyse von Häufigkeiten Zur Erinnerung: (Logistische Funktion, Pierre Verhulst, 1804-1849) 17.09.2018

Quantitative Methoden Inferenz – Analyse von Häufigkeiten Wettchance Logit-Funktion 17.09.2018

Quantitative Methoden Inferenz – Analyse von Häufigkeiten Infektionsrisiko bei Kaiserschnittgeburten Kaiserschnitt: geplant oder ungeplant, Risikofaktor (RF): vorhanden, nicht vorhanden Haupteffektmodell – es gibt Keine Wechselwirkungen. 17.09.2018

Quantitative Methoden Inferenz – Analyse von Häufigkeiten Risiko einer Infektion beim Kaiserschnitt: 17.09.2018

Quantitative Methoden Inferenz – Analyse von Häufigkeiten Parameterschätzung (Maximum Likelihood, nicht Kleinste Quadrate) Dies ist die Analyse für das Hauptfaktormodell, es werden also keine Wechselwirkungen angenommen! Interpretation: gilt unter der Bedingung keiner Antibiotikagabe So wird das Risiko bei Antibiotikgabe um gesenkt. 17.09.2018

Quantitative Methoden Inferenz – Analyse von Häufigkeiten Nicht gepl. Kaisersch. erhöht Risiko um Faktor 2.92 RF erhöht Risiko um Faktor 7.6 Antibiotikum erniedrigt Risko um Faktor .039 Die Überprüfung eines Modells mit Interaktionen legt eine Interaktion zwischen der Nichtplanung des Kaiserschnitts und des Vorhandenseins eines Risikofaktors nahe. Allerdings enthält die Tabelle einige Nullen, die die entsprechenden Schätzungen verzerren, so dass die Daten nicht hinreichend sind, um die entsprechende Hypothese zu testen. 17.09.2018

Quantitative Methoden Klassifikation Diskrimination von Personen, Objekten, psychischen Zuständen etc Der Ansatz von Fisher (1936): Die Symptome (Indikatoren, Prädiktoren) müssen so gewichtet werden, dass die Zuordnung einer Person oder eines Objekts zu einer Klasse möglichst fehlerfrei ist. Dazu müssen die Personen/Objekte so auf einer noch zu konstruierenden Skala abgebildet werden, dass sie möglichst eng beieinander auf der Skala liegen, wenn sie zur gleichen Klasse gehören, und möglichst weit separiert werden, wenn sie zu verschiedenen Klassen gehören. Aufgabe: finde die optimalen Gewichte und die Skala oder die Skalen, die eine Klassifikation mit minimalem Fehler erlauben. 17.09.2018

Fishersche Diskriminanzanalyse (Y = Kanonische Variable, Diskriminanzfunktion) Illustration für p = 2: Maximale Diskriminierbarkeit bezüglich Y Zu bestimmende „Gewichte“ der Prädiktoren (hier: Intensität/Bildpunkt) Projektion auf maximal diskriminierende Skala Verteilungen der Profile auf der maximal diskriminierenden Skala 17.09.2018

Quantitative Methoden Klassifikation 17.09.2018

Quantitative Methoden Klassifikation 17.09.2018

Quantitative Methoden Klassifikation Intuitive Einführung: Erinnerung an die Varianzanalyse: Die Gesamtvarianz der Daten wird in eine Varianzkomponente „innerhalb“ der Gruppen und in eine Varianzkomponente „zwischen“ den Gruppen aufgeteilt. Beide Komponenten werden für eine Schätzung der Fehlervarianz herangezogen. Ist die Schätzung auf der Basis der „Zwischen“-Komponente zu groß, wird die Nullhypothese („Es gibt keine Effekte der experimentellen Variablen“) verworfen. Fishers Idee: Die Prädiktoren (entsprechend den unabhängigen Variablen der Varianzanalyse) werden so gewichtet, dass die Varianz „zwischen“ den Klassen relativ zu der „innerhalb“ der Klassen maximal wird. 17.09.2018

Quantitative Methoden Klassifikation Daten - Prädiktoren Kategorien, Gruppen 17.09.2018

Quantitative Methoden Klassifikation 17.09.2018

Quantitative Methoden Klassifikation Man findet mindestens eine Lösung u = (u1, u2, …, up) und bestimmt für jede dieser Lösungen die Yi; die verschiedenen Yi sind die Koordinaten für die ''Objekte'', in Bezug auf die die Objekte verschiedener Gruppen maximal separiert sind. Die Ellipsen repräsentieren die verschiedenen Gruppen/Kategorien, Sie werden durch Geraden voneinander Getrennt, die so gewählt sind, dass der Klassifikationsfehler minimal ist. 17.09.2018

Quantitative Methoden Klassifikation Beispiel 2: Klassifikation von Geweben (Cervix-Krebs) I Optical Coherence Tomography (OCT)-Bild Luminanzprofil 17.09.2018

Quantitative Methoden Klassifikation 17.09.2018

17.09.2018