Präsentation herunterladen
1
Varianzanalyse II: Einzelvergleiche
Tukey‘s HSD Scheffé-Test geplante Kontraste 06_anova2 1
2
Post-Hoc-Tests und Kontraste
Einzelvergleiche Post-Hoc-Tests und Kontraste Die ANOVA ist ein overall-Test, d.h. es wird überprüft, ob es mindestens einen Mittelwertsunterschied gibt. Von mehreren Gruppen unterscheiden sich also mindestens zwei voneinander. Falls ein solcher Unterschied besteht, ist es natürlich interessant zu wissen, welche Gruppen sich unterscheiden. Dazu dienen Post-Hoc-Tests und Kontraste. 06_anova2 2
3
? ? ? Interpretation der H1 bei p>2
Einzelvergleiche Interpretation der H1 bei p>2 Wenn Femp > Fkrit (bzw. p<α) wird die H0 verworfen und damit die H1 angenommen. Es gilt also: μi ≠ μj, für mindestens ein Paar i, j Allerdings ist damit noch unklar, welche Mittelwerte sich unterscheiden. strukturell bildhaft emotional M1=5 M2=10 M3=12 ? ? ? 06_anova2 3
4
Einzelvergleiche Vergleich der einzelnen Mittelwerte:
(a) Post-hoc-Tests Im Nachhinein Unterschiede finden (b) Geplante Vergleiche (Kontraste) vorher festgelegte (a priori) Hypothesen testen 06_anova2 4
5
post-hoc Vergleiche post-hoc Vergleiche (Nur) Bei einem signifikanten F-Wert erfolgt ein Vergleich aller Gruppenmittelwerte. Es gibt verschieden Verfahren hierzu. Eine besonderes hohe Teststärke haben: Tukey‘s HSD (Honestly Significant Differences) Scheffé-Test 06_anova2 5
6
Nachschlagen in einer Tabelle bzw. HSD von SPSS berechnen lassen!
post-hoc Vergleiche Tukey´s HSD Tukey‘s HSD ist die Mittelwertsdistanz, die zwei Gruppen haben müssen, damit die Unterschiede statistisch bedeutsam sind. qα hängt ab von Zahl der Gruppen dfwithin α-Niveau Nachschlagen in einer Tabelle bzw. HSD von SPSS berechnen lassen! 06_anova2 6
7
Tukey´s HSD Tukey´s HSD Gruppendifferenzen von d>3.34 sind statistisch bedeutsam! 06_anova2 7
8
* Signifikante Differenz (weil d > HSD)
Tukey´s HSD strukturell bildhaft emotional M1=5 M2=10 M3=12 d=5* d=2 d=7* * Signifikante Differenz (weil d > HSD) 06_anova2 8
9
Tukey´s HSD 06_anova2 9
10
Tukey´s HSD 06_anova2 10
11
Mittlere Differenz (I-J)
Tukey´s HSD Mehrfachvergleiche mem Tukey-HSD (I) bed (J) bed Mittlere Differenz (I-J) Standardfehler Signifikanz 95% Konfidenzintervall Untergrenze Obergrenze 1 2 -5,0000* 1,12546 ,002 -8,0026 -1,9974 3 -7,0000* ,000 -10,0026 -3,9974 5,0000* 1,9974 8,0026 -2,0000 ,219 -5,0026 1,0026 7,0000* 3,9974 10,0026 2,0000 -1,0026 5,0026 Grundlage: beobachtete Mittelwerte. Der Fehlerterm ist Mittel der Quadrate(Fehler) = 3.167 *. Die mittlere Differenz ist auf der Stufe 0.05 signifikant. 06_anova2 11
12
Tukey´s HSD mem Tukey-HSD bed N Untergruppe 1 2 5 5,0000 10,0000 3
12,0000 Signifikanz 1,000 ,219 Mittelwerte für Gruppen in homogenen Untergruppen werden angezeigt. Grundlage: beobachtete Mittelwerte. Der Fehlerterm ist Mittel der Quadrate(Fehler) = 06_anova2 12
13
Der Scheffé-Test Scheffé-Tests beruhen auf Mittelwertsvergleichen.
post-hoc Vergleiche Der Scheffé-Test Scheffé-Tests beruhen auf Mittelwertsvergleichen. Es handelt sich um ebenfalls um post hoc Tests: Sie werden eingesetzt, wenn keine Hypothesen a priori formuliert wurden. Der Scheffé-Test hat eine geringere Power als Tukey‘s HSD! 06_anova2 13
14
Der Scheffé-Test 06_anova2 14
15
Mittlere Differenz (I-J)
Der Scheffé-Test Mehrfachvergleiche mem Scheffé (I) bed (J) bed Mittlere Differenz (I-J) Standardfehler Signifikanz 95% Konfidenzintervall Untergrenze Obergrenze 1 2 -5,0000* 1,12546 ,003 -8,1373 -1,8627 3 -7,0000* ,000 -10,1373 -3,8627 5,0000* 1,8627 8,1373 -2,0000 ,246 -5,1373 1,1373 7,0000* 3,8627 10,1373 2,0000 -1,1373 5,1373 Grundlage: beobachtete Mittelwerte. Der Fehlerterm ist Mittel der Quadrate(Fehler) = 3.167 *. Die mittlere Differenz ist auf der Stufe 0.05 signifikant. 06_anova2 15
16
Der Scheffé-Test mem Scheffé bed N Untergruppe 1 2 5 5,0000 10,0000 3
12,0000 Signifikanz 1,000 ,246 Mittelwerte für Gruppen in homogenen Untergruppen werden angezeigt. Grundlage: beobachtete Mittelwerte. Der Fehlerterm ist Mittel der Quadrate(Fehler) = 06_anova2 16
17
post-hoc Vergleiche Geplante Kontraste Kontraste sind „geplante Mittelwertvergleiche“ (Gruppenvergleiche) Kontrast werden statt eines globalen Tests angewendet. Kontraste müssen immer vorher (a priori) festgelegt werden! Sie ermöglichen gezielte Vergleiche zwischen mehreren Gruppen Kontrast sind post-hoc Tests vorzuziehen, da sie eine höhere Power haben! 06_anova2 17
18
Kontraste Mögliche Kontraste Wenn eine ANOVA mit vier Gruppen (A, B, C, D) durchgeführt wird, sind viele folgende Kontraste möglich: Einzelvergleiche: A mit B, A mit C, A mit D, B mit C, B mit D, C mit D Mittelwert von [A & B] mit Mittelwert von [C & D] Mittelwert von [A, B & C] mit [D] … 06_anova2 18
19
Kontraste Kontraste: Beispiel 4 Gruppen: Fußgänger (F), Radfahrer (R), Auto- (A) und Motorradfahrer (M) AV: Stress auf dem Weg zur Arbeit Vergleiche: M(R) vs. M(F) M(R, F) vs. M(A, M) M(R, F, A) vs. M 06_anova2 19
20
Kontraste Definition Ein Kontrast Ψ (Psi) ist die gewichtete Summe von p Populationsmittelwerten μj. Dabei ist mindestens ein Gewicht cj ungleich Null … und die Summe aller Gewichte ist gleich Null! 06_anova2 20
21
Kontraste sind Mittelwertvergleiche
Kontrast 1: Fahrrad vs. Fußgänger Es werden also die Mittelwerte von Fahrradfahrern und Fußgängern verglichen! 06_anova2 21
22
Kontraste sind Mittelwertvergleiche
Kontrast 2: [Fahrrad & Fußgänger] vs. [Auto & Motorrad] Es werden die Mittelwerte von nicht-motorisierten und motorisierten Verkehrsteilnehmern verglichen. 06_anova2 22
23
Kontraste sind Mittelwertvergleiche
Kontrast 3: [Fahrrad & Fußgänger & Auto] vs. Motorrad Es werden die Mittelwerte von Verkehrsteilnehmern ohne und mit Motorrad verglichen. 06_anova2 23
24
Signifikanz von Kontrasten
Kontraste können mit einem t-Test auf Signifikanz überprüft werden. Hypothesen: H0: Ψ = 0 (Der Kontrast ist gleich 0, bzw. die Mittelwerte unterscheiden sich nicht) H1: Ψ ≠ 0 (Der Kontrast ist ungleich Null, bzw. die Mittelwerte unterscheiden sich) Kontraste können auch mit gerichteten Hypothesen geprüft werden. 06_anova2 24
25
Signifikanz von Kontrasten
Berechnung 06_anova2 25
26
Unabhängigkeit von Kontrasten
Alle geplanten Kontraste müssen paarweise unabhängig sein. Nur bei unabhängigen Kontrasten wird eine α-Fehler Kumulierung verhindert. Zwei Kontraste sind unabhängig, wenn gilt: 06_anova2 26
27
ok ok X Unabhängigkeit von Kontrasten 1 Kontrast 1 & 2:
F A M 1. R vs. F 1 -1 2. R,F vs. A,M 1/2 -1/2 3. R,F,A vs. M ok ok X 06_anova2 27
28
ok ok ok Unabhängigkeit von Kontrasten 2 Kontrast 1 & 2:
F A M 1. R vs. F 1 -1 2. R,F vs. A,M 1/2 -1/2 3. R,F,A vs. M 1/3 ok ok ok 06_anova2 28
29
Unabhängigkeit von Kontrasten 3
Bei p Gruppen können p-1 unabhängige Kontraste gebildet werden: 06_anova2 29
30
Beispiel: Therapiewirksamkeit
Beispiel: Therapiewirksamkeit (fiktive Daten) Es wird der Therapieerfolg zwischen 5 verschiedenen Gruppen verglichen: Verhaltenstherapie (VT) Systemische Therapie (ST) Psychoanalyse (PA) Gesprächspsychotherapie (GT) Kontrollgruppe (KG) AV: Symptomverbesserung (0 bis 10). 06_anova2 30
31
Beispiel: Therapiewirksamkeit
Hypothesen: Der Therapieerfolg ist in den 4 Therapie-Gruppen größer als in der KG. Verhaltensorientierte Gruppen (VT+ST) unterscheiden sich von gesprächsorientierten Gruppen (PA+GT) Der Therapieerfolg von VT ist größer als der von ST Es gibt einen Unterschied zwischen PA und GT 06_anova2 31
32
Beispiel: Therapiewirksamkeit
Hypothese 1: Die therapierten Gruppen unterscheiden sich von der Kontrollgruppe: 06_anova2 32
33
Beispiel: Therapiewirksamkeit
Hypothese 2: Verhaltensorientierte Gruppen (VT+ST) unterscheiden sich von gesprächsorientierten Gruppen (PA+GT) 06_anova2 33
34
Beispiel: Therapiewirksamkeit
Hypothese 3: Es gibt einen Unterschied zwischen VT und ST. 06_anova2 34
35
Beispiel: Therapiewirksamkeit
Hypothese 4: Es gibt einen Unterschied zwischen PA und GT. 06_anova2 35
36
Beispiel: Therapiewirksamkeit
Daten: Vp VT ST PA GT KG 1 8 5 2 9 7 4 6 3 10 06_anova2 36
37
Beispiel: Therapiewirksamkeit
Benutzerdefinierte Kontraste können nur über die Syntax eingegeben werden! glm symptom by gruppe /contrast (gruppe) = special ( , , , ). 06_anova2 37
38
Beispiel: Therapiewirksamkeit
Kontrast 1: Der Kontrast ist signifikant von Null verschieden! Die Therapien [VT, ST, PA, GT] unterscheiden sich von der [KG] 06_anova2 38
39
Beispiel: Therapiewirksamkeit
Kontrast 2: Der Kontrast ist signifikant von Null verschieden! [VT und ST] unterscheiden sich von [PA und GT] 06_anova2 39
40
Beispiel: Therapiewirksamkeit
Kontrast 3: Der Kontrast ist signifikant von Null verschieden. (weil die Hypothese gerichtet formuliert war, darf p halbiert werden!) [VT] ist besser als [ST] 06_anova2 40
41
Beispiel: Therapiewirksamkeit
Kontrast 4: Der Kontrast ist nicht signifikant von Null verschieden! [PA] unterscheiden sich nicht bedeutsam von [GT] 06_anova2 41
42
Beispiel: Therapiewirksamkeit
Vergleich von Kontrasten und post-hoc Tests: glm symptom by gruppe /contrast (gruppe) = special ( , , , ) /posthoc gruppe (tukey). 06_anova2 42
43
Beispiel: Therapiewirksamkeit
Tukey-HSD (I) gruppe (J) gruppe Mittlere Differenz (I-J) Standardfehler Signifikanz 95% Konfidenzintervall Untergrenze Obergrenze 1 2 ,9000 ,47796 ,341 -,4581 2,2581 3 3,8000* ,000 2,4419 5,1581 4 3,1000* 1,7419 4,4581 5 6,1000* 4,7419 7,4581 -,9000 -2,2581 ,4581 2,9000* 1,5419 4,2581 2,2000* ,8419 3,5581 5,2000* 3,8419 6,5581 -3,8000* -5,1581 -2,4419 -2,9000* -4,2581 -1,5419 -,7000 ,590 -2,0581 ,6581 2,3000* ,9419 3,6581 -3,1000* -4,4581 -1,7419 -2,2000* -3,5581 -,8419 ,7000 -,6581 2,0581 3,0000* 1,6419 4,3581 -6,1000* -7,4581 -4,7419 -5,2000* -6,5581 -3,8419 -2,3000* -3,6581 -,9419 -3,0000* -4,3581 -1,6419 06_anova2 43
44
Beispiel: Therapiewirksamkeit
symptom Tukey-HSD gruppe N Untergruppe 1 2 3 5 10 1,6000 3,9000 4 4,6000 6,8000 7,7000 Signifikanz 1,000 ,590 ,341 Mittelwerte für Gruppen in homogenen Untergruppen werden angezeigt. Grundlage: beobachtete Mittelwerte. Der Fehlerterm ist Mittel der Quadrate(Fehler) = 06_anova2 44
45
Einzelvergleiche Zusammenfassung Eine ANOVA prüft, ob sich mindestens 2 Gruppen unterscheiden. Bei einem signifikanten Ergebnis sollte überprüft werden, welche Gruppen sich voneinander unterscheiden. Wenn a priori spezifische Hypothesen formuliert wurden, können Kontraste gerechnet werden, sonst müssen post-hoc Vergleich vorgenommen werden (Tukey oder Scheffé) Für die Teststärke (Power) gilt: Kontraste > Tukey > Scheffé Daher sollte Tukey‘s HSD generell gegenüber dem Scheffé-Test bevorzugt werden. 06_anova2 45
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.