Varianzanalyse II: Einzelvergleiche

Slides:



Advertisements
Ähnliche Präsentationen
T - Test Prüfung des Mittelwerteunterschieds bei abhängigen und unabhängigen Stichproben.
Advertisements

T-Tests und Varianzanalysen
Tutorat Statistik II im SS 09 zweifaktorielle Varianzanalyse
Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse
Korrektur Tutoratsaufgaben V
Heute 1.F – Test zur Varianzhomogenität 2.Bartlett-Test zur Varianzhomogenität 3.Chi – Quadrat Tests für Häufigkeiten 4.Chi – Quadrat Tests zur Verteilungsanpassung.
Forschungsstrategien Johannes Gutenberg Universität Mainz
Thema der Stunde I. Einführung in die Varianzanalyse:
Lautbildungstest für Vorschulkinder
Klassische Hypothesenprüfung
EmPra Der Einfluss und die Verarbeitung von emotionalen Reizen
Einfaktorielle Varianzanalyse
Gliederung Vertrauensintervalle Arten von Hypothesen
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.
Forschungsstatistik II
Heute Prüfung der Produkt-Moment Korrelation
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
A-Priori Kontraste Prüfung des Mittelwerteunterschieds von Faktorstufen bzw. Kombinationen von Faktorstufen: z.B.: oder.
Der Binomialtest Man habe einen wahren Anteil P.
Hypothesen testen: Grundidee
Prüfung statistischer Hypothesen
Effektgrößen, Kontraste & Post-hoc-Tests
Aufgabe Der Zusammenhang zwischen einem traumatischen Erlebnis und der Entstehung einer PTBS wird von mehreren Variablen …………….: Copingstrategien, Kontrollüberzeigung,
Fragen Was wird mit der Alphafehler-Kumulierung bzw. –inflation bezeichnet? Wie hoch ist die Wahrscheinlichkeit bei einer Untersuchung mit 4 Gruppen einen.
Nachholung der Vorlesung vom Freitag
Konfidenzintervalle Intervallschätzung
Kolmogorov-Smirnov-Test. A. N. Kolmogorov Geboren in Tambov, Russland. Begründer der modernen Wahrscheinlichkeitstheorie.
Achtung Vorlesung am Montag, den 21. Juni Zeit: Uhr Ort: Kiste.
Test auf Normalverteilung
Biometrie III Datenbeispiel zum Thema Permutationstests Wiebke Rygulla.
Tutorium
Tutorium
Tutorium
Tutorium
Tutorium Aufgabe 1 a) E(eIX)= 0 E(eIX)= E(Y-E(YIX)IX) = E(YIX)- E (E(YIX)IX) = E(YIX)- E(YIX) = 0 Im Mittel macht man mit seiner Schätzung keinen.
Unser zehntes Tutorium Materialien unter:
Vorlesung: ANOVA I
Vorlesung: ANOVA II.
Multikollinearität Wann spricht man von Multikollinearität?
Deutsch als Zweitsprache: Experimentelle Methoden WS 2013/2014
Varianzanalyse IV: Messwiederholung
Spiegelzahlen.
Vergleich der 3 Arten des t-Tests Testergebnisse berichten
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Chi Quadrat Test Tamara Katschnig.
Seminar: Datenerhebung
Wahrscheinlichkeitsrechnung
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Varianzanalyse III: Zweifaktorielle Varianzanalyse
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Einfaktorielle Varianzanalyse (ANOVA)
Das Allgemeine Lineare Modell (ALM)
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
STATISIK LV Nr.: 1375 SS März 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
Modul Statistische Datenanalyse
Mehr zum Testen von Hypothesen
Die einfache/multiple lineare Regression
Deskriptive Statistik, Korrelationen, Mittelwertvergleiche, Graphiken
Varianzanalyse Teststatistik: F – Test -> vergleich zweier Varianzen -> Grundlage der Varianzanalyse Welche „Varianzen“ werden miteinander verglichen?
Die einfache/multiple lineare Regression
STATISIK LV Nr.: 1375 SS März 2005.
Prüft ebenfalls die Annahme der Varianzhomogenität (exakter)
Signifikanzprüfung Peter Wilhelm Herbstsemester 2015.
 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.
Die einfache/multiple lineare Regression
Johann D. Müller, Merlin Dwenger , Mats Böttrich
 Präsentation transkript:

Varianzanalyse II: Einzelvergleiche Tukey‘s HSD Scheffé-Test geplante Kontraste 06_anova2 1

Post-Hoc-Tests und Kontraste Einzelvergleiche Post-Hoc-Tests und Kontraste Die ANOVA ist ein overall-Test, d.h. es wird überprüft, ob es mindestens einen Mittelwertsunterschied gibt. Von mehreren Gruppen unterscheiden sich also mindestens zwei voneinander. Falls ein solcher Unterschied besteht, ist es natürlich interessant zu wissen, welche Gruppen sich unterscheiden. Dazu dienen Post-Hoc-Tests und Kontraste. 06_anova2 2

? ? ? Interpretation der H1 bei p>2 Einzelvergleiche Interpretation der H1 bei p>2 Wenn Femp > Fkrit (bzw. p<α) wird die H0 verworfen und damit die H1 angenommen. Es gilt also: μi ≠ μj, für mindestens ein Paar i, j Allerdings ist damit noch unklar, welche Mittelwerte sich unterscheiden. strukturell bildhaft emotional M1=5 M2=10 M3=12 ? ? ? 06_anova2 3

Einzelvergleiche Vergleich der einzelnen Mittelwerte: (a) Post-hoc-Tests  Im Nachhinein Unterschiede finden (b) Geplante Vergleiche (Kontraste)  vorher festgelegte (a priori) Hypothesen testen 06_anova2 4

post-hoc Vergleiche post-hoc Vergleiche (Nur) Bei einem signifikanten F-Wert erfolgt ein Vergleich aller Gruppenmittelwerte. Es gibt verschieden Verfahren hierzu. Eine besonderes hohe Teststärke haben: Tukey‘s HSD (Honestly Significant Differences) Scheffé-Test 06_anova2 5

Nachschlagen in einer Tabelle bzw. HSD von SPSS berechnen lassen! post-hoc Vergleiche Tukey´s HSD Tukey‘s HSD ist die Mittelwertsdistanz, die zwei Gruppen haben müssen, damit die Unterschiede statistisch bedeutsam sind. qα hängt ab von Zahl der Gruppen dfwithin α-Niveau Nachschlagen in einer Tabelle bzw. HSD von SPSS berechnen lassen! 06_anova2 6

Tukey´s HSD Tukey´s HSD  Gruppendifferenzen von d>3.34 sind statistisch bedeutsam! 06_anova2 7

* Signifikante Differenz (weil d > HSD) Tukey´s HSD strukturell bildhaft emotional M1=5 M2=10 M3=12 d=5* d=2 d=7* * Signifikante Differenz (weil d > HSD) 06_anova2 8

Tukey´s HSD 06_anova2 9

Tukey´s HSD 06_anova2 10

Mittlere Differenz (I-J) Tukey´s HSD Mehrfachvergleiche mem Tukey-HSD (I) bed (J) bed Mittlere Differenz (I-J) Standardfehler Signifikanz 95% Konfidenzintervall Untergrenze Obergrenze 1 2 -5,0000* 1,12546 ,002 -8,0026 -1,9974 3 -7,0000* ,000 -10,0026 -3,9974 5,0000* 1,9974 8,0026 -2,0000 ,219 -5,0026 1,0026 7,0000* 3,9974 10,0026 2,0000 -1,0026 5,0026 Grundlage: beobachtete Mittelwerte. Der Fehlerterm ist Mittel der Quadrate(Fehler) = 3.167 *. Die mittlere Differenz ist auf der Stufe 0.05 signifikant. 06_anova2 11

Tukey´s HSD mem Tukey-HSD bed N Untergruppe 1 2 5 5,0000 10,0000 3 12,0000 Signifikanz 1,000 ,219 Mittelwerte für Gruppen in homogenen Untergruppen werden angezeigt. Grundlage: beobachtete Mittelwerte. Der Fehlerterm ist Mittel der Quadrate(Fehler) = 3.167. 06_anova2 12

Der Scheffé-Test Scheffé-Tests beruhen auf Mittelwertsvergleichen. post-hoc Vergleiche Der Scheffé-Test Scheffé-Tests beruhen auf Mittelwertsvergleichen. Es handelt sich um ebenfalls um post hoc Tests: Sie werden eingesetzt, wenn keine Hypothesen a priori formuliert wurden. Der Scheffé-Test hat eine geringere Power als Tukey‘s HSD! 06_anova2 13

Der Scheffé-Test 06_anova2 14

Mittlere Differenz (I-J) Der Scheffé-Test Mehrfachvergleiche mem Scheffé (I) bed (J) bed Mittlere Differenz (I-J) Standardfehler Signifikanz 95% Konfidenzintervall Untergrenze Obergrenze 1 2 -5,0000* 1,12546 ,003 -8,1373 -1,8627 3 -7,0000* ,000 -10,1373 -3,8627 5,0000* 1,8627 8,1373 -2,0000 ,246 -5,1373 1,1373 7,0000* 3,8627 10,1373 2,0000 -1,1373 5,1373 Grundlage: beobachtete Mittelwerte. Der Fehlerterm ist Mittel der Quadrate(Fehler) = 3.167 *. Die mittlere Differenz ist auf der Stufe 0.05 signifikant. 06_anova2 15

Der Scheffé-Test mem Scheffé bed N Untergruppe 1 2 5 5,0000 10,0000 3 12,0000 Signifikanz 1,000 ,246 Mittelwerte für Gruppen in homogenen Untergruppen werden angezeigt. Grundlage: beobachtete Mittelwerte. Der Fehlerterm ist Mittel der Quadrate(Fehler) = 3.167. 06_anova2 16

post-hoc Vergleiche Geplante Kontraste Kontraste sind „geplante Mittelwertvergleiche“ (Gruppenvergleiche) Kontrast werden statt eines globalen Tests angewendet. Kontraste müssen immer vorher (a priori) festgelegt werden! Sie ermöglichen gezielte Vergleiche zwischen mehreren Gruppen Kontrast sind post-hoc Tests vorzuziehen, da sie eine höhere Power haben! 06_anova2 17

Kontraste Mögliche Kontraste Wenn eine ANOVA mit vier Gruppen (A, B, C, D) durchgeführt wird, sind viele folgende Kontraste möglich: Einzelvergleiche: A mit B, A mit C, A mit D, B mit C, B mit D, C mit D Mittelwert von [A & B] mit Mittelwert von [C & D] Mittelwert von [A, B & C] mit [D] … 06_anova2 18

Kontraste Kontraste: Beispiel 4 Gruppen: Fußgänger (F), Radfahrer (R), Auto- (A) und Motorradfahrer (M) AV: Stress auf dem Weg zur Arbeit Vergleiche: M(R) vs. M(F) M(R, F) vs. M(A, M) M(R, F, A) vs. M 06_anova2 19

Kontraste Definition Ein Kontrast Ψ (Psi) ist die gewichtete Summe von p Populationsmittelwerten μj. Dabei ist mindestens ein Gewicht cj ungleich Null … und die Summe aller Gewichte ist gleich Null! 06_anova2 20

Kontraste sind Mittelwertvergleiche Kontrast 1: Fahrrad vs. Fußgänger Es werden also die Mittelwerte von Fahrradfahrern und Fußgängern verglichen! 06_anova2 21

Kontraste sind Mittelwertvergleiche Kontrast 2: [Fahrrad & Fußgänger] vs. [Auto & Motorrad] Es werden die Mittelwerte von nicht-motorisierten und motorisierten Verkehrsteilnehmern verglichen. 06_anova2 22

Kontraste sind Mittelwertvergleiche Kontrast 3: [Fahrrad & Fußgänger & Auto] vs. Motorrad Es werden die Mittelwerte von Verkehrsteilnehmern ohne und mit Motorrad verglichen. 06_anova2 23

Signifikanz von Kontrasten Kontraste können mit einem t-Test auf Signifikanz überprüft werden. Hypothesen: H0: Ψ = 0 (Der Kontrast ist gleich 0, bzw. die Mittelwerte unterscheiden sich nicht) H1: Ψ ≠ 0 (Der Kontrast ist ungleich Null, bzw. die Mittelwerte unterscheiden sich) Kontraste können auch mit gerichteten Hypothesen geprüft werden. 06_anova2 24

Signifikanz von Kontrasten Berechnung 06_anova2 25

Unabhängigkeit von Kontrasten Alle geplanten Kontraste müssen paarweise unabhängig sein. Nur bei unabhängigen Kontrasten wird eine α-Fehler Kumulierung verhindert. Zwei Kontraste sind unabhängig, wenn gilt: 06_anova2 26

ok ok X Unabhängigkeit von Kontrasten 1 Kontrast 1 & 2: F A M 1. R vs. F 1 -1 2. R,F vs. A,M 1/2 -1/2 3. R,F,A vs. M ok ok X 06_anova2 27

ok ok ok Unabhängigkeit von Kontrasten 2 Kontrast 1 & 2: F A M 1. R vs. F 1 -1 2. R,F vs. A,M 1/2 -1/2 3. R,F,A vs. M 1/3 ok ok ok 06_anova2 28

Unabhängigkeit von Kontrasten 3 Bei p Gruppen können p-1 unabhängige Kontraste gebildet werden: 06_anova2 29

Beispiel: Therapiewirksamkeit Beispiel: Therapiewirksamkeit (fiktive Daten) Es wird der Therapieerfolg zwischen 5 verschiedenen Gruppen verglichen: Verhaltenstherapie (VT) Systemische Therapie (ST) Psychoanalyse (PA) Gesprächspsychotherapie (GT) Kontrollgruppe (KG) AV: Symptomverbesserung (0 bis 10). 06_anova2 30

Beispiel: Therapiewirksamkeit Hypothesen: Der Therapieerfolg ist in den 4 Therapie-Gruppen größer als in der KG. Verhaltensorientierte Gruppen (VT+ST) unterscheiden sich von gesprächsorientierten Gruppen (PA+GT) Der Therapieerfolg von VT ist größer als der von ST Es gibt einen Unterschied zwischen PA und GT 06_anova2 31

Beispiel: Therapiewirksamkeit Hypothese 1: Die therapierten Gruppen unterscheiden sich von der Kontrollgruppe: 06_anova2 32

Beispiel: Therapiewirksamkeit Hypothese 2: Verhaltensorientierte Gruppen (VT+ST) unterscheiden sich von gesprächsorientierten Gruppen (PA+GT) 06_anova2 33

Beispiel: Therapiewirksamkeit Hypothese 3: Es gibt einen Unterschied zwischen VT und ST. 06_anova2 34

Beispiel: Therapiewirksamkeit Hypothese 4: Es gibt einen Unterschied zwischen PA und GT. 06_anova2 35

Beispiel: Therapiewirksamkeit Daten: Vp VT ST PA GT KG 1 8 5 2 9 7 4 6 3 10 06_anova2 36

Beispiel: Therapiewirksamkeit Benutzerdefinierte Kontraste können nur über die Syntax eingegeben werden! glm symptom by gruppe /contrast (gruppe) = special ( 0.25 0.25 0.25 0.25 -1, 0.5 0.5 -0.5 -0.5 0, 1 -1 0 0 0, 0 0 1 -1 0). 06_anova2 37

Beispiel: Therapiewirksamkeit Kontrast 1: Der Kontrast ist signifikant von Null verschieden! Die Therapien [VT, ST, PA, GT] unterscheiden sich von der [KG] 06_anova2 38

Beispiel: Therapiewirksamkeit Kontrast 2: Der Kontrast ist signifikant von Null verschieden! [VT und ST] unterscheiden sich von [PA und GT] 06_anova2 39

Beispiel: Therapiewirksamkeit Kontrast 3: Der Kontrast ist signifikant von Null verschieden. (weil die Hypothese gerichtet formuliert war, darf p halbiert werden!) [VT] ist besser als [ST] 06_anova2 40

Beispiel: Therapiewirksamkeit Kontrast 4: Der Kontrast ist nicht signifikant von Null verschieden! [PA] unterscheiden sich nicht bedeutsam von [GT] 06_anova2 41

Beispiel: Therapiewirksamkeit Vergleich von Kontrasten und post-hoc Tests: glm symptom by gruppe /contrast (gruppe) = special (0.25 0.25 0.25 0.25 -1, 0.5 0.5 -0.5 -0.5 0, 1 -1 0 0 0, 0 0 1 -1 0) /posthoc gruppe (tukey). 06_anova2 42

Beispiel: Therapiewirksamkeit Tukey-HSD (I) gruppe (J) gruppe Mittlere Differenz (I-J) Standardfehler Signifikanz 95% Konfidenzintervall Untergrenze Obergrenze 1 2 ,9000 ,47796 ,341 -,4581 2,2581 3 3,8000* ,000 2,4419 5,1581 4 3,1000* 1,7419 4,4581 5 6,1000* 4,7419 7,4581 -,9000 -2,2581 ,4581 2,9000* 1,5419 4,2581 2,2000* ,8419 3,5581 5,2000* 3,8419 6,5581 -3,8000* -5,1581 -2,4419 -2,9000* -4,2581 -1,5419 -,7000 ,590 -2,0581 ,6581 2,3000* ,9419 3,6581 -3,1000* -4,4581 -1,7419 -2,2000* -3,5581 -,8419 ,7000 -,6581 2,0581 3,0000* 1,6419 4,3581 -6,1000* -7,4581 -4,7419 -5,2000* -6,5581 -3,8419 -2,3000* -3,6581 -,9419 -3,0000* -4,3581 -1,6419 06_anova2 43

Beispiel: Therapiewirksamkeit symptom   Tukey-HSD gruppe N Untergruppe 1 2 3 5 10 1,6000 3,9000 4 4,6000 6,8000 7,7000 Signifikanz 1,000 ,590 ,341 Mittelwerte für Gruppen in homogenen Untergruppen werden angezeigt. Grundlage: beobachtete Mittelwerte. Der Fehlerterm ist Mittel der Quadrate(Fehler) = 1.142. 06_anova2 44

Einzelvergleiche Zusammenfassung Eine ANOVA prüft, ob sich mindestens 2 Gruppen unterscheiden. Bei einem signifikanten Ergebnis sollte überprüft werden, welche Gruppen sich voneinander unterscheiden. Wenn a priori spezifische Hypothesen formuliert wurden, können Kontraste gerechnet werden, sonst müssen post-hoc Vergleich vorgenommen werden (Tukey oder Scheffé) Für die Teststärke (Power) gilt: Kontraste > Tukey > Scheffé Daher sollte Tukey‘s HSD generell gegenüber dem Scheffé-Test bevorzugt werden. 06_anova2 45