Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
1
Methoden der Psychologie
Teil 4: Versuchsplanung (II) Psychologisches Institut der Johann Gutenberg Universität Mainz Uwe Mortensen SoSe 2016
2
Quantitative Methoden Inferenz
Vergleich von mehr als zwei Mittelwerten: Varianzanalyse (ANOVA = Analysis of variance) Man möchte prüfen, ob sich die Studierenden verschiedener Fächer hinsichtlich Ihrer Neigung zur Prokrastinationvoneinander unterscheiden:
3
Quantitative Methoden Inferenz
Das ''Design'' (= der Versuchsplan) ist 2-faktoriell, dh es gibt zwei ''Faktoren'', (1) das Studienfach, (2) das Geschlecht. Für den Faktor Studienfach gibt es p ''Stufen'' (levels), für den Faktor Geschlecht gibt es zwei. Es gibt demnach, mit r = 2p, r(r-1)/2 mögliche Paare von Mittelwerten. Für p = 5 sind das 45 Paare! Das Problem: die Alpha-Inflation. Führt man 45 t-Tests durch, so gibt es Insgesamt 45 Möglichkeiten, die Nullhypothese fälschlich zurückzuweisen. Die Wahrscheinlichkeit mindestens einer Fehleintscheidung ist dann Gilt also die globale Nullhypothese: die Studierenden der verschiedenen Unterscheiden sich nicht hinsichtlich ihrer Neigung zur Prokrastination, So ist die Wahrscheinlichkeit, sich mindestens einmal für H1 zu entscheiden, Gleich .9! Man sieht Unterschiede, wo keine sind!
4
Quantitative Methoden Inferenz
Wie kann man derartige Fehlentscheidungen verhindern? Nahezu geniale Idee von Ronald Aylmer Fisher ( ) Man zerlege die Gesamtvarianz der Daten! Illustration für den einfaktoriellen Fall (Mittelung über das Geschlecht der Studierenden). Grundannahme:
5
Quantitative Methoden Inferenz
6
Quantitative Methoden Inferenz
F-Test: setzt Normalverteilung der Daten voraus und homogene Varianzen!
7
Quantitative Methoden Inferenz
Der zweifaktorielle Fall Strukturgeichung: Haupteffekte Wechselwirkungseffekte (nicht additiver Effekt) Allgemein:
8
Quantitative Methoden Inferenz
9
Quantitative Methoden Inferenz
Komplett randomisierte Vpn-Gruppen oder Meßwiederholungen (replicated verus repeated measurements) Im komplett randomisierten Fall sind alle Messwerte unabhängig voneinander. Im Meßwiederholungsfall werden dieselben Vpn unter verschiedenen Bedingungen bezüglich der abhängigen Variablen gemessen. Die Messungen sind dann i.A. Korreliert → Problem, denn der F-Quotient Basiert auf der Annahme unabhängiger Messungen! Statistik-Programme benutzen verschiedene Algorithmen, → man muß angeben, welcher Fall vorliegt.
10
Quantitative Methoden Inferenz
Auswahl der Stufen: Fixed, Random und Mixed Models: Fixed model: die Stufen eines Faktors sind fest vorgegeben (zB weiblich, männlich) oder werden als „feste Stufen“ aufgefasst; der F-Test bezieht sich nur auf diese Stufen. Random model: die Stufen eines Faktors sind eine zufällige Auswahl aus Einer Menge von möglichen Stufen. Beispiel: Man will verschiedene Therapieformen miteinander vergleichen, die aber nicht alle an allen Krankenhäusern angewendet werden. Insgesamt gibt es viele Krankenhäuser, aus denen eine Stichprobe von Krankenhäusern ausgewählt wird. Der Faktor ''Krankenhaus'' ist ein Random Faktor. Da das Ergebnis auf auf alle Krankenhäuser verallgemeinert werden soll, muß ein Spezieller F-Test konstruiert werden, daher die Rede von einem Random Modell.
11
Quantitative Methoden Inferenz
Mixed model: ein einem Experiment kommen Faktoren mit festen Stufen und mit Random-Stufen vor; es entsteht ein Mixed Model. Die F-Tests für diesen Versuchsplan müssen den entstehenden Mischungen von fixed und random-Stufen entsprechen. Deshalb Hierarchische Versuchspläne: nicht alle Stufen eines Faktors Wird mit jeder Stufe eines anderen Faktors kombiniert:
12
Quantitative Methoden Inferenz
Zweifaktorieller hierarchischer Versuchsplan_ Bei derartigen Versuchplänen sind nicht mehr alle Interaktionen testbar; man muß also bei der Planung darauf achten, welche Interaktionen für den Test der Hypothese von Bedeutung sind!
13
Quantitative Methoden Inferenz
Veränderungshypothesen: Man will Lernverläufe, Therapieverläufe, Interventionen,allgemein Veränderungen von Merkmalen und/oder Verhaltensweisen im Laufe der Zeit untersuchen, wobei typischerweise der Effekt von einem oder Mehr Faktoren erfasst werden soll. Im Prinzip lassen sich zwei Arten von Untersuchungen unterscheiden: Querschnitt- und Längsschnittuntersuchungen. Bei der Querschnittsuntersuchung werden für jeden Zeitabschnitt Verschiedene Personen untersucht, zB Personen aus verschiedenen Altersgruppen. Vorteil: man kann die Untersuchung in einem Zeitraum durchführen. Nachteil: Die Unterschiede zwischen den Personen in den Stichproben erhöhen die ''Fehler''varianz → Reduktion der Sensitivität des Experiments. Personen gehören verschiedenen Generationen an, Konfundierende Effekte möglich (Entwicklungs- mit Generationseffekten Verwechselt).
14
Quantitative Methoden Inferenz
Bei der Längsschnittuntersuchung wird eine Gruppe von Personen über verschiedene Zeitabschnitte hinweg beobachtet. (Panel-Untersuchung einer Kohorte). Zu berücksichtigen: Messwiederholungen (korrelierte Messwerte!). Vorteil: Reduktion der Fehlervarianz durch Identität der Personen. Nachteil: sehr aufwändig, da Personen immer wieder ausfindig gemacht Werden müssen. Manche Personen gehen ''verloren''. Reaktionen auf Testinstrumente können sich im Laufe der Zeit ändern. Datenanalyse: ANOVA (Messwiederholungen), aber auch Korrelations- methoden (Kanonische Korrelation)
15
Quantitative Methoden Inferenz
Datenanalyse: ANOVA, Regressionsanalysen, etc A = Behandlung, B = keine Behandlung
16
Quantitative Methoden Inferenz – Analyse von Häufigkeiten
Bisher: Fokus auf der Analyse von Messungen → ANOVA. Aber was tun, Wenn nur Häufigkeiten zur Verfügung stehen? Man ist nicht nur an ''Haupteffekten'' interessiert (= Unteeschiede zwischen Randsummen), sondern an ''Wechselwirkungen'', - dh spzielle Beziehungen zwischen Körperbau und Erkrankung.
17
Quantitative Methoden Inferenz – Analyse von Häufigkeiten
Nullhypothese: es gibt keinen Zusammenhang, eventuelle Häufungen sind nur zufällig. Für die Konjunktionen Körperbau (A) und Erkrankung (B) heißt dies: P(A) und P(B) ergeben sich aus den Randsummen der Tabelle, jeweils Geteilt durch das Gesamt-N (Gesamtzahl aller Beobachtungen) Test der Nullhypothese: Vergleiche tatsächliche Häufigkeiten mit den auf der Basis der Nullhypothese vorhergesagten Häufigkeiten.
18
Quantitative Methoden Inferenz – Analyse von Häufigkeiten
19
Quantitative Methoden Inferenz – Analyse von Häufigkeiten
Testvertilung ist die Chi-Quadrat-Verteilung: z-Werte standardnormalverteilt und stochastisch unabhängig. (Chi-Quadrat-Verteilung ist Verteilung der Stichprobenvarianz) Bilde für jede Zelle (i, j) (i-te Zeile, j-te Spalte) die Größe (Unter der Nullhypothese!)
20
Quantitative Methoden Inferenz – Analyse von Häufigkeiten
Der Chi-Quadrat-Test liefert Aussage zur Frage, ob überhaupt irgendwelche Abhängigkeiten existieren (analog zum F-Test bei der ANOVA) Aber wie ist es mit Einzelaussagen (a posteriori-Aussagen)? Vorsicht: keine ANOVA rechnen, da die Voraussetzungen bei Häufigkeits- Tabellen nicht erfüllt sind! Stattdessen: log-lineare Analyse Unabhängigkeit: (Nullhypothese) (Alternative
21
Quantitative Methoden Inferenz – Analyse von Häufigkeiten
repräsentiert Abhängigkeit! Höherdimensionale Tabellen: und
22
Quantitative Methoden Inferenz – Analyse von Häufigkeiten
Simpsons Paradox Schwarze werden in den USA häufiger zum Tode verurteilt als Weiße - ein Vorurteil? (Rachelet, M. (1981) Racial characteristics And impositoin of the death penalty. Amer. Sociol. Review, 46, ) Diese Tabelle ist allerdings über die Dimension 'Farbe des Opfers' aggregiert worden:
23
Quantitative Methoden Inferenz – Analyse von Häufigkeiten
Simpsons Paradox Der Trend ist in der vollständigen Tabelle dem in der aggregierten Tabelle gerade entgegengesetzt! Es gibt einen Trend, Schwarze eher zum Tode zu verurteilen, der durch die konfudierende Variable 'Farbe des Opfers' verstärkt wird!
24
Quantitative Methoden Inferenz – Analyse von Häufigkeiten
Simpsons Paradox 1973 wurde die University of California Berkeley wegen ungerechter Zulassung von Frauen zum Studium verklagt: Auflösung: Frauen beworben sich eher auf Studiengänge mit mehr Bewerbern und damit mit höherer Ablehnungsquote.
25
Quantitative Methoden Inferenz – Analyse von Häufigkeiten
Deskriptive Modelle
26
Quantitative Methoden Inferenz – Analyse von Häufigkeiten
Trends bei Doktorgraden in den USA
27
Quantitative Methoden Inferenz – Analyse von Häufigkeiten
Kurve: Pareto-Kurve, sie würde auf gewisse Mechanismen in der Fächer- Wahl verweisen – passt aber nicht!
28
Quantitative Methoden Inferenz – Analyse von Häufigkeiten
Korrespondenzanalyse
29
Quantitative Methoden Inferenz – Analyse von Häufigkeiten
Selbstmorde in Deutschland 1974 – 1977, männlich
30
Quantitative Methoden Inferenz – Analyse von Häufigkeiten
Selbstmorde in Deutschland 1974 – 1977, weiblich
31
Quantitative Methoden Inferenz – Analyse von Häufigkeiten
Selbstmorde in Deutschland 1974 – 1977 Anzahl der Selbstmorde als Funktion des Alters, aggregiert über die Methoden
32
Quantitative Methoden Inferenz – Analyse von Häufigkeiten
Selbstmorde in Deutschland 1974 – 1977, Methode und Geschlecht
33
Quantitative Methoden Inferenz – Analyse von Häufigkeiten
Korrespondenzanalyse
34
Quantitative Methoden Inferenz – Analyse von Häufigkeiten
Klassifikation und Vorhersage: logistische Modelle Problem: Verhalten soll vorhergesagt werden, etwa Rückfälligkeit bei Sucht, kriminelles Verhalten, Infektion bei Operationen, Eignung zum Psychologiestudium, etc Sei H die Hypothese, dass das in Frage stehende Ereignis eintritt, und x Sei ein Satz von Daten, die als Basis für die Vorhersage dienen sollen. Nach Dem Satz von Bayes gilt ganz allgemein P(H) ist die a priori-Wahrscheinlichkeit, P(x|H) ist die Likelihood der Daten unter Bedingung, dass H wahr ist.
35
Quantitative Methoden Inferenz – Analyse von Häufigkeiten
36
Quantitative Methoden Inferenz – Analyse von Häufigkeiten
Zur Erinnerung: (Logistische Funktion, Pierre Verhulst, )
37
Quantitative Methoden Inferenz – Analyse von Häufigkeiten
Wettchance Logit-Funktion
38
Quantitative Methoden Inferenz – Analyse von Häufigkeiten
Infektionsrisiko bei Kaiserschnittgeburten Kaiserschnitt: geplant oder ungeplant, Risikofaktor (RF): vorhanden, nicht vorhanden Haupteffektmodell – es gibt Keine Wechselwirkungen.
39
Quantitative Methoden Inferenz – Analyse von Häufigkeiten
Risiko einer Infektion beim Kaiserschnitt:
40
Quantitative Methoden Inferenz – Analyse von Häufigkeiten
Parameterschätzung (Maximum Likelihood, nicht Kleinste Quadrate) Dies ist die Analyse für das Hauptfaktormodell, es werden also keine Wechselwirkungen angenommen! Interpretation: gilt unter der Bedingung keiner Antibiotikagabe So wird das Risiko bei Antibiotikgabe um gesenkt.
41
Quantitative Methoden Inferenz – Analyse von Häufigkeiten
Nicht gepl. Kaisersch. erhöht Risiko um Faktor 2.92 RF erhöht Risiko um Faktor 7.6 Antibiotikum erniedrigt Risko um Faktor .039 Die Überprüfung eines Modells mit Interaktionen legt eine Interaktion zwischen der Nichtplanung des Kaiserschnitts und des Vorhandenseins eines Risikofaktors nahe. Allerdings enthält die Tabelle einige Nullen, die die entsprechenden Schätzungen verzerren, so dass die Daten nicht hinreichend sind, um die entsprechende Hypothese zu testen.
42
Quantitative Methoden Klassifikation
Diskrimination von Personen, Objekten, psychischen Zuständen etc Der Ansatz von Fisher (1936): Die Symptome (Indikatoren, Prädiktoren) müssen so gewichtet werden, dass die Zuordnung einer Person oder eines Objekts zu einer Klasse möglichst fehlerfrei ist. Dazu müssen die Personen/Objekte so auf einer noch zu konstruierenden Skala abgebildet werden, dass sie möglichst eng beieinander auf der Skala liegen, wenn sie zur gleichen Klasse gehören, und möglichst weit separiert werden, wenn sie zu verschiedenen Klassen gehören. Aufgabe: finde die optimalen Gewichte und die Skala oder die Skalen, die eine Klassifikation mit minimalem Fehler erlauben.
43
Fishersche Diskriminanzanalyse
(Y = Kanonische Variable, Diskriminanzfunktion) Illustration für p = 2: Maximale Diskriminierbarkeit bezüglich Y Zu bestimmende „Gewichte“ der Prädiktoren (hier: Intensität/Bildpunkt) Projektion auf maximal diskriminierende Skala Verteilungen der Profile auf der maximal diskriminierenden Skala
44
Quantitative Methoden Klassifikation
45
Quantitative Methoden Klassifikation
46
Quantitative Methoden Klassifikation
Intuitive Einführung: Erinnerung an die Varianzanalyse: Die Gesamtvarianz der Daten wird in eine Varianzkomponente „innerhalb“ der Gruppen und in eine Varianzkomponente „zwischen“ den Gruppen aufgeteilt. Beide Komponenten werden für eine Schätzung der Fehlervarianz herangezogen. Ist die Schätzung auf der Basis der „Zwischen“-Komponente zu groß, wird die Nullhypothese („Es gibt keine Effekte der experimentellen Variablen“) verworfen. Fishers Idee: Die Prädiktoren (entsprechend den unabhängigen Variablen der Varianzanalyse) werden so gewichtet, dass die Varianz „zwischen“ den Klassen relativ zu der „innerhalb“ der Klassen maximal wird.
47
Quantitative Methoden Klassifikation
Daten - Prädiktoren Kategorien, Gruppen
48
Quantitative Methoden Klassifikation
49
Quantitative Methoden Klassifikation
Man findet mindestens eine Lösung u = (u1, u2, …, up) und bestimmt für jede dieser Lösungen die Yi; die verschiedenen Yi sind die Koordinaten für die ''Objekte'', in Bezug auf die die Objekte verschiedener Gruppen maximal separiert sind. Die Ellipsen repräsentieren die verschiedenen Gruppen/Kategorien, Sie werden durch Geraden voneinander Getrennt, die so gewählt sind, dass der Klassifikationsfehler minimal ist.
50
Quantitative Methoden Klassifikation
Beispiel 2: Klassifikation von Geweben (Cervix-Krebs) I Optical Coherence Tomography (OCT)-Bild Luminanzprofil
51
Quantitative Methoden Klassifikation
Ähnliche Präsentationen
© 2025 SlidePlayer.org Inc.
All rights reserved.