STATISIK LV Nr.: 1852 WS 2005/06 22. Dezember 2005
Anteilstests Einstichprobentest für den Anteilswert Hat der Anteil einen bestimmten Wert, bzw. liegt er in einem bestimmten Bereich? Entscheidung basiert auf dem Ergebnis einer einzigen Stichprobe. Zweistichprobentest für Anteilswerte Unterscheiden sich die Anteile zweier unabhängiger Gruppen? Entscheidung basiert auf zwei Stichproben
Anteilstest - Einstichprobentest Einstichprobentest für den Anteilswert: Einseitige Hypothesen: H0: θ ≤ θ0 gegen H1: θ > θ0 H0: θ ≥ θ0 gegen H1: θ < θ0 Zweiseitige Hypothesen: H0: θ = θ0 gegen H1: θ ≠ θ0
Anteilstest - Einstichprobentest Vorgehensweise: Teststatistik bestimmen Testverteilung bestimmen Entescheidung über Annahme oder Ablehnung von H0.
Anteilstest - Einstichprobentest Anteilswert einer Stichprobe: P = x / n Unter H0 ist P, wenn nθ0(1-θ0) ≥ 9, approximativ N-Vt., mit Parametern E(P) = θ0 Var(P) = θ0(1-θ0)/n · [(N-n)/(N-1)] Vernachlässigung der Endlichkeitskorrektur wenn n/N < 0,05.
Anteilstest - Einstichprobentest Prüfgröße / Teststatistik: Standardisierte Zufallsvariable Z:
Anteilstest - Einstichprobentest Testverteilung: Teststatistik Z ist unter H0 N(0,1) verteilt. Daher: Testverteilung ist die Standardnormalverteilung.
Anteilstest - Einstichprobentest Kritischer Bereich: α festlegen (z.B. α = 0,05) Kritischer Wert: α – Quantil der N(0,1)-Vt. Entscheidung: H0 ablehnen, wenn Teststatistik im kritischen Bereich. p-Wert: p-Wert: Niveau, bei dem der Test gerade noch die H0 ablehnen würde. Entscheidung: H0 ablehnen, wenn p-Wert < α
Anteilstest - Einstichprobentest Bsp: Anteil der weiblichen Studenten Approximation durch N-Vt. zulässig, da unter H0 nθ0(1-θ0) = 18,25 ≥ 9. 1. Einseitige Tests: H0: pw ≤ 0,5 gegen H1: pw > 0,5 und α=0,05 H0: pw ≥ 0,5 gegen H1: pw < 0,5 und α=0,05 2. Zweiseitiger Test: H0: pw = 0,5 gegen H1: pw 0,5 und α=0,05
Anteilstest - Einstichprobentest Bsp: Anteil der weiblichen Studenten H0: pw 0,5 gegen H1: pw > 0,5 und α=0,05 Unter H0: E(P) = 0,5, Var(P) = 0,0034 und σP = 0,0585 (ohne Endlichkeitskorrektur). Teststatistik: Z = 1,05 Testverteilung: N(0,1) => Kritischer Wert 1,64 p-Wert: 0,1461
Anteilstest - Einstichprobentest Bsp: Anteil der weiblichen Studenten H0: pw ≥ 0,5 gegen H1: pw < 0,5 und α=0,05 Unter H0: E(P) = 0,5, Var(P) = 0,0034 und σP = 0,0585 (ohne Endlichkeitskorrektur). Teststatistik: Z = 1,05 Testverteilung: N(0,1) => Kritischer Wert -1,64 p-Wert: 0,8539
Anteilstest - Einstichprobentest Bsp: Anteil der weiblichen Studenten H0: pw = 0,5 gegen H1: pw 0,5 und α=0,05 Unter H0: E(P) = 0,5, Var(P) = 0,0034 und σP = 0,0585 (ohne Endlichkeitskorrektur). Teststatistik: Z = 1,05 Testverteilung: N(0,1) => Kritische Werte -1,96 und +1,96 p-Wert: 0,2922
Anteilstest - Zweistichprobentest Test für die Differenz zweier Anteilswerte Stichprobe 1: Anteil P1 = x / n1 Grundgesamtheit 1: Anteil θ1 Stichprobe 2: Anteil P2 = x / n2 Grundgesamtheit 2: Anteil θ2 H0: Anteilswerte der beiden Grundgesamtheiten sind gleich. H0: θ1 = θ2 (=θ) gegen H1: θ1 ≠ θ2
Anteilstest - Zweistichprobentest Teststatistik: (Unter Vernachlässigung der Endlichkeitskorrektur und wenn Voraussetzungen für eine N-Vt. erfüllt sind) Verteilung der Teststatistik unter H0: Z ~ N(0,1)
Anteilstest - Zweistichprobentest Entscheidung: Bestimmung des kritischen Bereichs. Z > |c| lehne H0 ab Bestimmung des p-Wertes p-Wert < α lehne H0 ab Interpretation: Wird H0 abgelehnt, dann sind die Anteile in den beiden Gruppen signifikant verschieden.
Test für arithmetisches Mittel Einstichprobentest für das arithm. Mittel: Hat das arithm. Mittel einen bestimmten Wert, bzw. liegt es in einem bestimmten Bereich? Entscheidung basiert auf dem Ergebnis einer einzigen Stichprobe. Zweistichprobentest für das arithm. Mittel Unterscheiden sich die Mittelwerte zweier Gruppen? Entscheidung basiert auf zwei Stichproben
Test für arithmetisches Mittel Einstichprobentest für das arithm. Mittel: Varianz der Grundgesamtheit ist bekannt. Varianz der Grundgesamtheit ist unbekannt.
Test für arithmetisches Mittel Einstichprobentest für das arithm. Mittel: Zweiseitige Hypothese: H0: µ = µ0 gegen H1: µ ≠ µ0 Festlegen des Signifikanzniveaus
Test für arithmetisches Mittel Varianz der Grundgesamtheit ist bekannt. Unter H0 ist das arithm. Mittel der Stichprobe N-Vt. mit E=µ und Var=σ²/n Teststatistik: Testverteilung: N(0,1)
Test für arithmetisches Mittel Bestimmung des kritischen Bereichs bzw. Berechung des p-Wertes Entscheidung Interpretation
Test für arithmetisches Mittel Varianz der Grundgesamtheit ist unbekannt. Schätzwert für unbekanntes σ²: Stichprobenvarianz s². Teststatistik: Testverteilung: tn-1 t-Test
Test für arithmetisches Mittel Bestimmung des kritischen Bereichs: kritische Werte: α/2-Quantile der t-Vt., symmetrische Vt. daher tcu = -tco Berechung des p-Wertes: Entscheidung: |t| > tc, lehne H0 ab p-Wert < α, lehne H0 ab Interpretation
Test für arithmetisches Mittel Bsp. mittlere Körpergröße (n = 73) H0: µ = 170 gegen H1: µ 170, α = 0,05 Arithm. Mittel der Stpr: 173,4 Standardabweichung der Stichprobe: 9,5 Teststatistik T = (173,4-170) / 9,5/73 = 3,1 Kritische Werte: -1,96 und +1,96 p-Wert: 0,0021 Mittlere Körpergröße ist signifikant 170
Test für arithmetisches Mittel Zweistichprobentest für die Differenz zweier arithmetischer Mittel Unterscheiden sich die Mittelwerte zweier Grundgesamtheiten? Unterscheiden sich die Mittelwerte zweier verbundener Stichproben?
Test für arithmetisches Mittel Differenz zweier arithmetischer Mittel die aus 2 Grundgesamtheiten stammen. Voraussetzung: Stichproben unabhängig Stichproben stammen aus einer N-vt. Grundgesamtheiten bzw. Approximation durch N-Vt. ist zulässig Endlichkeitskorrektur ist vernachlässigbar
Test für arithmetisches Mittel Unterscheide, ob die Varianzen der beiden Grundgesamtheiten homogen sind oder nicht. Varianzen verschieden, σ1² σ2² : Teststatistik: Testverteilung: Z asymptotisch N(0,1)-vt.
Test für arithmetisches Mittel Varianzhomogenität, σ1² = σ2² = σ²: Teststatistik: wobei Testverteilung: T ~ tv mit v=n1+n2-2 Freiheitsgarden
Test für arithmetisches Mittel Verbundene Stichproben (abhängige oder gepaarte Stpr.) Tritt auf, wenn z.B. die Merkmalsausprägungen der ersten Stpr. und die der zweiten jeweils an demselben Merkmalsträger erhoben werden. Bsp: vorher – nachher Untersuchungen. Test für die Differenz arithmetischer Mittel bei verbundenen Stichproben.
Test für arithmetisches Mittel Differenzen der Wertepaare: Di = X2i – X1i sind N-vt. mit E(Di) = µ2i - µ1i = δ und Var(Di) =σD² Teststatistik: Testverteilung: T~tv mit v=n-1
Test für Varianz Einstichprobentest für die Varianz: Hat die Varianz einen bestimmten Wert, bzw. liegt er in einem bestimmten Bereich? Entscheidung basiert auf dem Ergebnis einer einzigen Stichprobe. Zweistichprobentest für die Varianz Unterscheiden sich die Varianzen zweier Gruppen? Entscheidung basiert auf zwei Stichproben
Test für Varianz Einstichprobentest für die Varianz: Annahme: Grundgesamtheit normalverteilt H0: σ² = σ0² gegen H1: σ² σ0² Teststatistik: Testverteilung: χ²v mit v=n-1 Entscheidung: χ² > χ²co oder χ² < χ²cu, lehnen H0 ab p-Wert < α, lehne H0 ab
Test für Varianz Zweistichprobentest für den Quotienen zweier Varianzen: Annahme: Grundgesamtheit normalverteilt H0: σ1² = σ2² gegen H1: σ1² σ2² Teststatistik: Testverteilung: Fv1,v2 mit v1=n1-1 und v2=n2-1 Entscheidung: F > Fco oder F < Fcu, lehnen H0 ab p-Wert < α, lehne H0 ab
Nichtparametrische Tests Nichtparametrische Tests (v.a. wenn Annahme der Normalverteilung nicht erfüllt ist). Rangtests für Lageparameter Zeichentest Wilcoxon Vorzeichenrangtest für das Symmetriezentrum einer Verteilung Verteilungsfreie Lokationsvergleiche Wilcoxon Rangsummentest oder Mann-Whitney U Test
Rangtests für Lageparameter Zeichentest (Ordinalskala ausreichend) Annahme: unabhängige Beobachtungen x1, ..., xn stammen aus einer Grundgesamtheit mit stetiger Verteilungsfunktion F. Test für den Median ξ0,5 der Grundgesamtheit Einseitige Hypothesen: H0: ξ0,5 ξ0 gegen H1: ξ0,5 > ξ0 H0: ξ0,5 ξ0 gegen H1: ξ0,5 < ξ0 Zweiseitige Hypothese: H0: ξ0,5 = ξ0 gegen H1: ξ0,5 ξ0
Rangtests für Lageparameter Vorgehensweise: Transformation der Beobachtungswerte: xi‘ = xi - ξ0 Bestimmung von yi yi = 1 falls xi‘ > 0, yi = 0 falls xi‘ < 0, Bindungen: yi = ½ falls xi‘ = 0
Rangtests für Lageparameter Teststatistik: Unter H0 ist T ~ B(n, ½) Approximation durch N(0,1): Entscheidung: Vergleich von Z mit kritischen Werten der N(0,1) Verteilung
Rangtests für Lageparameter Beispiel für Zeichentest (Hartung, S. 243): Alter von Frauen bei der Geburt des ersten Kindes. H0: ξ0,5 25 gegen H1: ξ0,5 > 25. Zufällige Auswahl von n = 36 Müttern. i Alter xi xi‘ yi 1 30,6 5,6 2 17,8 -7,2 : 35 20 -5 36 23,5 -1,5
Rangtests für Lageparameter Beispiel Approximation durch N-Vt Entscheidung (bei α=0,05): Z < 1,645 Lehne H0: ξ0,5 25 nicht ab.
Rangtests für Lageparameter Wilcoxon Vorzeichenrangtest für das Symmetriezentrum einer Grundgesamtheit Basiert auf Rangzahlen der Beobachtungen Annahme: n unabhängige Beobachtungen (x1, ..., xn) stammen aus einer Grundgesamtheit mit Verteilungsfunktion F Frage: Ist die Verteilung symmetrisch um einen Wert ξ0, d.h. gilt F(ξ0-y) = 1-F(ξ0+y)?
Rangtests für Lageparameter
Rangtests für Lageparameter Wilcoxon Vorzeichenrangtest für das Symmetriezentrum ξ0 einer Grundgesamtheit Einseitige Hypothesen: H0: F symmetrisch um ξ ξ0 H0: F symmetrisch um ξ ξ0 Zweiseitige Hypothese: H0: F symmetrisch um ξ = ξ0
Rangtests für Lageparameter Vorgehensweise: Transformation der Beobachtungswerte: xi‘ = xi - ξ0 Ohne Berücksichtigung der Vorzeichen der xi‘ Rangzahlen Ri zuweisen (1 für kleinsten Wert, ..., n für größten Wert). Den Rangzahlen werden die Vorzeichen der zugehörigen xi‘ Werte zugewiesen => Rangstatistik R̃i
Rangtests für Lageparameter Teststatistik: mit ci = 0 falls R̃i < 0 und ci = 1 falls R̃i > 0 Entscheidung: Vergleich von T+ mit kritischen Werten wn,α des Vorzeichenrang-test von Wilcoxon (z.B. Hartung S. 245)
Rangtests für Lageparameter Approximation durch N(0,1) Verteilung: Teststatistik T* (keine Bindungen): mit E T+ = n(n+1) / 4 und Var T+ = n(n+1)(2n+1) / 24 (Beim Auftreten von Bindungen: T* laut Hartung, S. 246) Vergleich von T* mit kritischen Werten der N(0,1) Verteilung
Rangtests für Lageparameter Beispiel Wilcoxon Vorzeichenrangtest Psychologischer Test, Bewertung durch Punkte xi H0: F symmetrisch um ξ = ξ0 = 61, α = 0,05 Teststatistik: ci = 0 falls R̃i < 0 und ci = 1 falls R̃i > 0
Rangtests für Lageparameter Beispiel: T+ = 1·10,5+0·(-3)+1·3+0·(-7)+1·7+1·9+0·(-3)+1·5+1·1 +1·10,5+1·7 = 53 i xi xi‘ = xi- ξ0 Ri R̃i 1 72 11 10,5 2 55 -6 3 -3 67 6 4 53 -8 7 -7 5 69 8 71 10 9 68 65
Rangtests für Lageparameter Beispiel: Kritische Werte aus Tabelle: wn;α/2 = w11;0,025 = 11 und wn;1-α/2 = w11;0,975 = 54 Entscheidung: w11;0,025 = 11 < T+ = 53 < 54 = w11;0,975 Daher: lehne H0 nicht ab, F ist symmetrisch um ξ0 = 61.
Vt.-freie Lokationsvergleiche Wilcoxon Rangsummentest oder Mann-Whitney U Test Annahme: zwei unabhängige Messreihen, zugrundeliegenden Verteilungsfunktionen sind stetig und vergleichbar (d.h. sie schneiden einander nicht). Frage: Besteht ein Unterschied in den Verteilungen? Sind z.B. die Werte der einen Messreihe „im Durchschnitt größer“ als die der anderen?
Vt.-freie Lokationsvergleiche
Vt.-freie Lokationsvergleiche Einseitige Hypothesen: H0: F1(x) F2(x) gegen H1: F1(x) F2(x) und für mind. ein x gilt: F1(x) < F2(x) H0: F1(x) F2(x) gegen H1: F1(x) F2(x) und für mind. ein x gilt: F1(x) > F2(x) Zweiseitig Hypothese: H0: F1(x) = F2(x) gegen H1: F1(x) F2(x)
Vt.-freie Lokationsvergleiche Vorgehensweise: Gemeinsame Rangzahlen der beiden Messreihen bilden: r1, ..., rn1, rn1+1, ..., rn1+n2 Teststatistik: Kritische Werte des Wilcoxon-Rangsummen-Tests aus Tabelle (siehe z.B. Hartung 518)
Vt.-freie Lokationsvergleiche Entscheidung: H0: F1(x) F2(x), H0 verwerfen falls Wn1,n2 > Wn1;n2;1-α H0: F1(x) F2(x), H0 verwerfen falls Wn1,n2 < Wn1;n2;α Zweiseitig Hypothese: H0: F1(x) = F2(x) H0 verwerfen falls Wn1,n2 < Wn1;n2;α/2 oder Wn1,n2 > Wn1;n2;1-α/2
Vt.-freie Lokationsvergleiche Beispiel: Behandlung von Pilzen mit Vitamin B1. Führt diese Behandlung zu (signifikant) höherem Gewicht? Behand-lung Rangz. Kontrolle 27 19 26,5 18 7 17 6 34 22,5 22 14 14,5 5 18,5 8 20,5 12 24,5 13,5 3 9,5 1 29,5 21 12,5 2 4 20 10,5 35,5 24 23 15 28 9 16 13
Vt.-freie Lokationsvergleiche Beispiel: H0: FB(x) ≥ FK(x) bzw. XB ist stochastisch kleiner als XK, α = 0,05. Teststatistik: Summe der Ranzahlen der ersten Messreihe (Behandlungsgruppe): Wn1,n2 = 220. Kritischer Wert: wn1;n2;0,95 = 191 Entscheidung: 220 > 191 => H0 ablehnen. D.h. die Behandlung führt zu einem signifikant höheren Gewicht.