Non-parametrische Testverfahren Gliederung Definition Der χ² Test Kolmogorov-Smirnov-Test Überblick weitere Verfahren: Der Fisher-Yates-Test Der McNemar-Test Cochran-Test (Q-Test) Der Mediantest Der U-Test (Mann-Whitney Test) Vorzeichentest und Vorzeichenrangtest Der Friedman-Test Binominal-Test 11_nonpara 1
Non-parametrische Testverfahren Definition: Nonparametrische (verteilungsfreie) Testverfahren setzen nicht eine bestimmte Verteilungsformen des erfassten Merkmals (z.B. Normalverteilung) voraus. Nonparametrische Verfahren werden eingesetzt… für die Analyse von Ordinal- oder Nominalskalierten Variablen Wenn die Normalverteilungsannahme verletzt ist. Parametrische Verfahren dürfen nur verwendet werden, wenn die beteiligten Variablen die gefordert Verteilungsform ausweisen (z.B. Normalverteilung für den t-Test). Sie haben in der Regel eine höher statistische Power. 11_nonpara 2
Leiden Männer und Frauen gleich häufig an einer bestimmten Erkrankung? Der χ² -Test Der χ²-Test („Chi-Quadrat-Test“) dient dem Vergleich von beobachteten und erwarteten Häufigkeiten. Er kann eingesetzt werden, wenn 1 oder 2 nominalskalierte unabhängige Variablen vorliegen. Beispiele: Leiden Männer und Frauen gleich häufig an einer bestimmten Erkrankung? Leisten hoch-ängstlich und gering-ängstliche Personen gleich häufig Hilfe in einer Notsituation? 11_nonpara 3
Voraussetzung für den χ² -Test (Faustregeln) Der χ² -Test Voraussetzung für den χ² -Test (Faustregeln) Weniger als 1/5 aller Zellen hat ein erwartete Häufigkeit kleiner als 5. Keine Zelle weist eine erwartete Häufigkeit kleiner als 1 auf. Wenn diese Voraussetzungen nicht erfüllt sind, sollte alternativ der Fisher-Yates-Test verwendet werden. 11_nonpara 4
Statistische Hypothesen Der χ² -Test χ² -Test – Beispiel 1 Es soll geprüft werden, ob die Verteilung von Männern und Frauen in einer Gruppe signifikant von einer Gleichverteilung abweicht. N = 76 (Frauen: 56; Männer: 20) Statistische Hypothesen H0: π(Frau) = π(Mann) H1: π(Frau) ≠ π(Mann) 11_nonpara 5
Zunächst werden die nach der H0 zu erwarteten Häufigkeiten berechnet: Der χ² -Test Schritt 1: Zunächst werden die nach der H0 zu erwarteten Häufigkeiten berechnet: Beobachtet: NF = 56; NM=20 Erwartet: ??? Gesamtzahl: 76 Bei einer Gleichverteilung wären also 38 Männer und 38 Frauen zu erwarten. 11_nonpara 6
Nun wird der (empirische) χ²-Wert berechnet: Der χ² -Test Schritt 2: Nun wird der (empirische) χ²-Wert berechnet: mit: k: Anzahl der Stufen der beiden Variablen fb,i: Beobachtete Häufigkeit in der Zelle (i) fe,i: Erwartete Häufigkeit in der Zelle (i) 11_nonpara 7
Der χ² -Test Geschlecht Frau Mann Beobachtet 56 20 76 Erwartet 38 58 78 11_nonpara 8
Für α=.05 ergibt sich bei df=1: Der χ² -Test Schritt 3: Vergleich des empirischen χ²-Werts mit dem kritischen χ²-Wert. Der kritische χ²-Wert wird in Abhängigkeit von den Freiheits-graden und dem gewählten α-Niveau aus einer Tabelle zur χ²-Verteilung abgelesen (Leonhart, S.448f). Für α=.05 ergibt sich bei df=1: Die H0 muss verworfen werden; folglich kann ein Unterschied nachgewiesen werden. 11_nonpara 9
Statistische Hypothesen Der χ² -Test Geschlecht Angst Frau Mann gering 25 14 39 hoch 33 6 58 20 78 χ² -Test – Beispiel 2 Frage: Ist die (relative) Häufigkeit hoher bzw. geringer Ängstlichkeit bei Männern und Frauen gleich? Statistische Hypothesen H0: π(Angst | Frau) = π(Angst | Mann) H1: π(Angst | Frau) ≠ π(Angst | Mann) 11_nonpara 10
Der χ² -Test Schritt 1: Zunächst werden aus den Randsummen die nach der H0 zu erwarteten Häufigkeiten geschätzt: Beobachtet: Erwartet: Geschlecht Angst Frau Mann gering 25 14 39 hoch 33 6 58 20 78 Geschlecht Angst Frau Mann gering 29 10 39 hoch 58 20 78 11_nonpara 11
Schritt 2: Nun wird der (empirische) χ²-Wert berechnet: Der χ² -Test Schritt 2: Nun wird der (empirische) χ²-Wert berechnet: mit: k, l: Anzahl der Stufen der beiden Variablen fb(i,j): Beobachtete Häufigkeit in der Zelle (i,j) fe(i,j): Erwartete Häufigkeit in der Zelle (i,j) 11_nonpara 12
Beobachtet: Erwartet: Der χ² -Test Beobachtet: Erwartet: Geschlecht Angst Frau Mann gering 25 14 39 hoch 33 6 58 20 78 Geschlecht Angst Frau Mann gering 29 10 39 hoch 58 20 78 11_nonpara 13
Für α=.05 ergibt sich bei df=1: Der χ² -Test Schritt 3: Vergleich des empirischen χ²-Werts mit dem kritischen χ²-Wert. Der kritische χ²-Wert wird in Abhängigkeit von den Freiheits-graden und dem gewählten α-Niveau aus einer Tabelle zur χ²-Verteilung abgelesen (Leonhart, S.448f). Für α=.05 ergibt sich bei df=1: Die H0 muss verworfen werden; folglich kann ein Unterschied nachgewiesen werden. 11_nonpara 14
Der χ² -Test in SPSS 11_nonpara 15
Der χ² -Test in SPSS NPAR TEST /CHISQUARE=sex /EXPECTED=EQUAL 11_nonpara 16
SPSS-Ausgabe: Der χ² -Test in SPSS sex Beobachtetes N Erwartete Anzahl Residuum 1 56 38,0 18,0 2 20 -18,0 Gesamt 76 Statistik für Test sex Chi-Quadrat 17,053a df 1 Asymptotische Signifikanz ,000 a. Bei 0 Zellen (.0%) werden weniger als 5 Häufigkeiten erwartet. Die kleinste erwartete Zellenhäufigkeit ist 38.0. 11_nonpara 17
Der Kolmogorov-Smirnov-Test Der Kolmogorov-Smirnov-Test vergleicht eine empirische Verteilung mit einer vorgegebenen theoretischen Verteilung (z.B. Normalverteilung). Damit ist es möglich, die Voraussetzung parametrischer Testverfahren (z.B. für den t-Test) zu überprüfen. Statistische Hypothesen: H0: Die Variable ist normalverteilt H1: Die Variable ist nicht normalverteilt 11_nonpara 18
Der Kolmogorov-Smirnov-Test in SPSS 11_nonpara 19
Der Kolmogorov-Smirnov-Test in SPSS NPAR TESTS /K-S(NORMAL)=freiburg psycho stat. 11_nonpara 20
Der Kolmogorov-Smirnov-Test in SPSS Wenn p<.05 ist die Normalverteilungsannahme verletzt. Kolmogorov-Smirnov-Anpassungstest freiburg psycho stat N 98 Parameter der Normalverteilunga Mittelwert 20,8163 19,7908 16,5204 Standardabweichung 1,89055 3,04428 3,15650 Extremste Differenzen Absolut ,182 ,124 ,111 Positiv ,104 ,063 ,057 Negativ -,182 -,124 -,111 Kolmogorov-Smirnov-Z 1,797 1,225 1,098 Asymptotische Signifikanz (2-seitig) ,003 ,099 ,179 a. Die zu testende Verteilung ist eine Normalverteilung. 11_nonpara 21
Überblick weitere Verfahren: 11_nonpara 22
Der Fisher-Yates-Test Der Fisher-Yates Test wird eingesetzt, um Kontingenztabellen auszuwerten, wenn die Voraussetzungen des χ²-Test verletzt sind (d.h. bei geringen erwarteten Häufigkeiten). Beispiel: Berechnung: Siehe Leonhart (2004), Seite 162f Raucher Nichtraucher Frauen 20 40 Männer 3 5 11_nonpara 23
Die erwarteten Häufigkeiten sollten nicht kleiner als 5 sein. McNemar-Test Der McNemar-Test Der McNemar-Test wird für nominalskalierten Daten in zwei abhängigen Stichproben (z.B. Messwiederholung) verwendet . Die erwarteten Häufigkeiten sollten nicht kleiner als 5 sein. Beispiel: Veränderung des Rauchverhaltens von der Jugend bis ins Erwachsenenalter. Berechnung: Siehe Leonhart (2004), Seite 163f Erwachsene Jugend Nichtraucher Raucher Σ 33 3 36 18 21 39 51 24 75 11_nonpara 24
Cochran-Test (Q-Test) Der Cochran-Test (Q-Test) Der Cochran-Test dient der Auswertung von nominalskalierten Daten in mehr als zwei abhängigen Stichproben. Beispiel: (NR=Nichtraucher; R=Raucher) Berechnung: Siehe Leonhart (2004), Seite 165f Alter (Jahre) Vp 12 16 20 24 28 1 NR R 2 3 4 5 11_nonpara 25
Berechnung: Siehe Leonhart (2004), Seite 162f Mediantest Der Mediantest Der Der Mediantest dient dem Vergleich der zentralen Tendenz ordinalskalierter Variablen, wenn zwei unabhängige Stichproben vorliegen. Beispiel: Die Reaktionszeit bei einer Aufgabe soll zwischen Männern und Frauen verglichen werden (Da die Zeiten nicht normalverteilt sind, soll kein t-Test gerechnet werden) Berechnung: Siehe Leonhart (2004), Seite 162f 11_nonpara 26
U-Test (Mann-Whitney-Test) Der U-Test (Mann-Whitney-Test) Der U-Test vergleicht die zentrale Tendenz eines ordinalskalierten Merkmals zwischen zwei unabhängigen Zufallsstichproben. Anmerkung: Der U-Test hat einer höhere Power als der Mediantest, jedoch ist er empfindlicher gegenüber Ausreißerwerten. Beispiel: Der Therapieerfolg (Rating 1 bis 5) soll zwischen einer Therapiegruppe und einer „Wartekontrollgruppe“ verglichen werden. Berechnung: Siehe Leonhart (2004), Seite 169f 11_nonpara 27
U-Test (Mann-Whitney-Test) 11_nonpara 28
U-Test (Mann-Whitney-Test) NPAR TESTS /M-W= freiburg BY sex(1 2) . 11_nonpara 29
U-Test (Mann-Whitney-Test) Weil p>.05 besteht also kein bedeutsamer Rangunterschied. Ränge Geschlecht N Mittlerer Rang Rangsumme freiburg männlich 21 41,57 873,00 weiblich 75 50,44 3783,00 Gesamt 96 Statistik für Testa freiburg Mann-Whitney-U 642,000 Wilcoxon-W 873,000 Z -1,312 Asymptotische Signifikanz (2-seitig) ,189 a. Gruppenvariable: Geschlecht 11_nonpara 30
H-Test (Kruskal & Wallis -Test) Der H-Test (Kruskal & Wallis -Test) Der U-Test vergleicht die zentrale Tendenz eines ordinalskalierten Merkmals zwischen zwei unabhängigen Zufallsstichproben. Beispiel: Der Therapieerfolg soll zwischen drei Therapie-verfahren sowie einer „Wartekontrollgruppe“ verglichen werden. Berechnung: Siehe Leonhart (2004), Seite 175ff Therapie A Therapie B Therapie C Wartekontroll-gruppe Therapie-erfolg 4 3 2 1 11_nonpara 31
Vorzeichentest und Vorzeichenrangtest Der Vorzeichentest und der Vorzeichenrangtest nach Wilcoxon vergleichen, wie sich die Merkmalsausprägung eines ordinalskalierten Merkmals zwischen zwei abhängigen Stichproben unterscheiden. Anmerkung: Der Vorzeichenrangtest nach Wilcoxon hat die höhere Power und ist daher generell zu bevorzugen. Beispiel: Es wird überprüft, ob sich die Arbeitsfähigkeit im Laufe einer Reha-Maßnahme verbessert hat. Dabei wird die Arbeitsfähigkeit als 5-stufiges Rating vor und nach der Maßnahme erfasst. Berechnung: Siehe Leonhart (2004), Seite 172ff 11_nonpara 32
Berechnung: Siehe Leonhart (2004), Seite 177f Friedman-Test Der Friedman-Test Der Friedman-Test vergleicht die Merkmalsausprägung eines ordinalskalierten Merkmals zwischen mehr als zwei abhängigen Stichproben. Beispiel: Es wird überprüft, ob sich die Arbeitsfähigkeit im Laufe einer Reha-Maßnahme verbessert hat. Dabei wird die Arbeitsfähigkeit als 5-Stufiges Rating zu 3 Messzeitpunkten erfasst (prä-, post-, follow-up - Erhebung). Berechnung: Siehe Leonhart (2004), Seite 177f 11_nonpara 33
Nonparametrische Testverfahren können eingesetzt werden, wenn Zusammenfassung Nonparametrische Testverfahren können eingesetzt werden, wenn die vorliegenden Daten kein Intervallskalenniveau aufweisen oder die Normalverteilungsannahme der parametrischen Tests verletzt ist. Der χ²-Test überprüft ob beobachtete und erwartete Häufigkeiten signifikant voneinander abweichen. Der Kolmogorov-Smirnov-Test prüft, ob eine empirische Verteilung mit einer theoretisch vorgegebenen Verteilungsform (Normalverteilung) übereinstimmt. Der U-Test vergleicht die mittleren Rangplätze zwischen 2 Gruppen. Weitere Testverfahren können je nach Skalenniveau, Abhängigkeit der Stichprobe und Anzahl der Gruppen ausgewählt werden 11_nonpara 34