Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

STATISIK LV Nr.: 0021 WS 2005/06 3. November 2005.

Ähnliche Präsentationen


Präsentation zum Thema: "STATISIK LV Nr.: 0021 WS 2005/06 3. November 2005."—  Präsentation transkript:

1 STATISIK LV Nr.: 0021 WS 2005/06 3. November 2005

2 Anteilstests Einstichprobentest für den Anteilswert
Hat der Anteil einen bestimmten Wert, bzw. liegt er in einem bestimmten Bereich? Entscheidung basiert auf dem Ergebnis einer einzigen Stichprobe. Zweistichprobentest für Anteilswerte Unterscheiden sich die Anteile zweier unabhängiger Gruppen? Entscheidung basiert auf zwei Stichproben

3 Anteilstest - Einstichprobentest
Einstichprobentest für den Anteilswert: Einseitige Hypothesen: H0: θ ≤ θ0 gegen H1: θ > θ0 H0: θ ≥ θ0 gegen H1: θ < θ0 Zweiseitige Hypothesen: H0: θ = θ0 gegen H1: θ ≠ θ0

4 Anteilstest - Einstichprobentest
Vorgehensweise: Teststatistik bestimmen Testverteilung bestimmen Entescheidung über Annahme oder Ablehnung von H0.

5 Anteilstest - Einstichprobentest
Anteilswert einer Stichprobe: P = x / n Unter H0 ist P, wenn nθ0(1-θ0) ≥ 9, approximativ N-Vt., mit Parametern E(P) = θ0 Var(P) = θ0(1-θ0)/n · [(N-n)/(N-1)] Vernachlässigung der Endlichkeitskorrektur wenn n/N < 0,05.

6 Anteilstest - Einstichprobentest
Prüfgröße / Teststatistik: Standardisierte Zufallsvariable Z:

7 Anteilstest - Einstichprobentest
Testverteilung: Teststatistik Z ist unter H0 N(0,1) verteilt. Daher: Testverteilung ist die Standardnormalverteilung.

8 Anteilstest - Einstichprobentest
Kritischer Bereich: α festlegen (z.B. α = 0,05) Kritischer Wert: α – Quantil der N(0,1)-Vt. Entscheidung: H0 ablehnen, wenn Teststatistik im kritischen Bereich. p-Wert: p-Wert: Niveau, bei dem der Test gerade noch die H0 ablehnen würde. Entscheidung: H0 ablehnen, wenn p-Wert < α

9 Anteilstest - Einstichprobentest
Bsp: Anteil der weiblichen Studenten Approximation durch N-Vt. zulässig, da unter H0 nθ0(1-θ0) = 18,25 ≥ 9. 1. Einseitige Tests: H0: pw ≤ 0,5 gegen H1: pw > 0,5 und α=0,05 H0: pw ≥ 0,5 gegen H1: pw < 0,5 und α=0,05 2. Zweiseitiger Test: H0: pw = 0,5 gegen H1: pw  0,5 und α=0,05

10 Anteilstest - Einstichprobentest
Bsp: Anteil der weiblichen Studenten H0: pw  0,5 gegen H1: pw > 0,5 und α=0,05 Unter H0: E(P) = 0,5, Var(P) = 0,0034 und σP = 0,0585 (ohne Endlichkeitskorrektur). Teststatistik: Z = 1,05 Testverteilung: N(0,1) => Kritischer Wert 1,64 p-Wert: 0,1461

11 Anteilstest - Einstichprobentest
Bsp: Anteil der weiblichen Studenten H0: pw ≥ 0,5 gegen H1: pw < 0,5 und α=0,05 Unter H0: E(P) = 0,5, Var(P) = 0,0034 und σP = 0,0585 (ohne Endlichkeitskorrektur). Teststatistik: Z = 1,05 Testverteilung: N(0,1) => Kritischer Wert -1,64 p-Wert: 0,8539

12 Anteilstest - Einstichprobentest
Bsp: Anteil der weiblichen Studenten H0: pw = 0,5 gegen H1: pw  0,5 und α=0,05 Unter H0: E(P) = 0,5, Var(P) = 0,0034 und σP = 0,0585 (ohne Endlichkeitskorrektur). Teststatistik: Z = 1,05 Testverteilung: N(0,1) => Kritische Werte -1,96 und +1,96 p-Wert: 0,2922

13 Anteilstest - Zweistichprobentest
Test für die Differenz zweier Anteilswerte Stichprobe 1: Anteil P1 = x / n1 Grundgesamtheit 1: Anteil θ1 Stichprobe 2: Anteil P2 = x / n2 Grundgesamtheit 2: Anteil θ2 H0: Anteilswerte der beiden Grundgesamtheiten sind gleich. H0: θ1 = θ2 (=θ) gegen H1: θ1 ≠ θ2

14 Anteilstest - Zweistichprobentest
Teststatistik: (Unter Vernachlässigung der Endlichkeitskorrektur und wenn Voraussetzungen für eine N-Vt. erfüllt sind) Verteilung der Teststatistik unter H0: Z ~ N(0,1)

15 Anteilstest - Zweistichprobentest
Entscheidung: Bestimmung des kritischen Bereichs. Z > |c| lehne H0 ab Bestimmung des p-Wertes p-Wert < α lehne H0 ab Interpretation: Wird H0 abgelehnt, dann sind die Anteile in den beiden Gruppen signifikant verschieden.

16 Test für arithmetisches Mittel
Einstichprobentest für das arithm. Mittel: Hat das arithm. Mittel einen bestimmten Wert, bzw. liegt es in einem bestimmten Bereich? Entscheidung basiert auf dem Ergebnis einer einzigen Stichprobe. Zweistichprobentest für das arithm. Mittel Unterscheiden sich die Mittelwerte zweier Gruppen? Entscheidung basiert auf zwei Stichproben

17 Test für arithmetisches Mittel
Einstichprobentest für das arithm. Mittel: Varianz der Grundgesamtheit ist bekannt. Varianz der Grundgesamtheit ist unbekannt.

18 Test für arithmetisches Mittel
Einstichprobentest für das arithm. Mittel: Zweiseitige Hypothese: H0: µ = µ0 gegen H1: µ ≠ µ0 Festlegen des Signifikanzniveaus

19 Test für arithmetisches Mittel
Varianz der Grundgesamtheit ist bekannt. Unter H0 ist das arithm. Mittel der Stichprobe N-Vt. mit E=µ und Var=σ²/n Teststatistik: Testverteilung: N(0,1)

20 Test für arithmetisches Mittel
Bestimmung des kritischen Bereichs bzw. Berechung des p-Wertes Entscheidung Interpretation

21 Test für arithmetisches Mittel
Varianz der Grundgesamtheit ist unbekannt. Schätzwert für unbekanntes σ²: Stichprobenvarianz s². Teststatistik: Testverteilung: tn-1 t-Test

22 Test für arithmetisches Mittel
Bestimmung des kritischen Bereichs: kritische Werte: α/2-Quantile der t-Vt., symmetrische Vt. daher tcu = -tco Berechung des p-Wertes: Entscheidung: |t| > tc, lehne H0 ab p-Wert < α, lehne H0 ab Interpretation

23 Test für arithmetisches Mittel
Bsp. mittlere Körpergröße (n = 73) H0: µ = 170 gegen H1: µ  170, α = 0,05 Arithm. Mittel der Stpr: 173,4 Standardabweichung der Stichprobe: 9,5 Teststatistik T = (173,4-170) / 9,5/73 = 3,1 Kritische Werte: -1,96 und +1,96 p-Wert: 0,0021 Mittlere Körpergröße ist signifikant  170

24 Test für arithmetisches Mittel
Zweistichprobentest für die Differenz zweier arithmetischer Mittel Unterscheiden sich die Mittelwerte zweier Grundgesamtheiten? Unterscheiden sich die Mittelwerte zweier verbundener Stichproben?

25 Test für arithmetisches Mittel
Differenz zweier arithmetischer Mittel die aus 2 Grundgesamtheiten stammen. Voraussetzung: Stichproben unabhängig Stichproben stammen aus einer N-vt. Grundgesamtheiten bzw. Approximation durch N-Vt. ist zulässig Endlichkeitskorrektur ist vernachlässigbar

26 Test für arithmetisches Mittel
Unterscheide, ob die Varianzen der beiden Grundgesamtheiten homogen sind oder nicht. Varianzen verschieden, σ1²  σ2² : Teststatistik: Testverteilung: Z asymptotisch N(0,1)-vt.

27 Test für arithmetisches Mittel
Varianzhomogenität, σ1² = σ2² = σ²: Teststatistik: wobei Testverteilung: T ~ tv mit v=n1+n2-2 Freiheitsgarden

28 Test für arithmetisches Mittel
Verbundene Stichproben (abhängige oder gepaarte Stpr.) Tritt auf, wenn z.B. die Merkmalsausprägungen der ersten Stpr. und die der zweiten jeweils an demselben Merkmalsträger erhoben werden. Bsp: vorher – nachher Untersuchungen. Test für die Differenz arithmetischer Mittel bei verbundenen Stichproben.

29 Test für arithmetisches Mittel
Differenzen der Wertepaare: Di = X2i – X1i sind N-vt. mit E(Di) = µ2i - µ1i = δ und Var(Di) =σD² Teststatistik: Testverteilung: T~tv mit v=n-1

30 Test für Varianz Einstichprobentest für die Varianz:
Hat die Varianz einen bestimmten Wert, bzw. liegt er in einem bestimmten Bereich? Entscheidung basiert auf dem Ergebnis einer einzigen Stichprobe. Zweistichprobentest für die Varianz Unterscheiden sich die Varianzen zweier Gruppen? Entscheidung basiert auf zwei Stichproben

31 Test für Varianz Einstichprobentest für die Varianz:
Annahme: Grundgesamtheit normalverteilt H0: σ² = σ0² gegen H1: σ²  σ0² Teststatistik: Testverteilung: χ²v mit v=n-1 Entscheidung: χ² > χ²co oder χ² < χ²cu, lehnen H0 ab p-Wert < α, lehne H0 ab

32 Test für Varianz Zweistichprobentest für den Quotienen zweier Varianzen: Annahme: Grundgesamtheit normalverteilt H0: σ1² = σ2² gegen H1: σ1²  σ2² Teststatistik: Testverteilung: Fv1,v2 mit v1=n1-1 und v2=n2-1 Entscheidung: F > Fco oder F < Fcu, lehnen H0 ab p-Wert < α, lehne H0 ab

33 Test für arithmetisches Mittel
Zweistichprobentest für die Differenz zweier arithmetischer Mittel Unterscheiden sich die Mittelwerte zweier Grundgesamtheiten? Unterscheiden sich die Mittelwerte zweier verbundener Stichproben?

34 Test für arithmetisches Mittel
Differenz zweier arithmetischer Mittel die aus 2 Grundgesamtheiten stammen. Voraussetzung: Stichproben unabhängig Stichproben stammen aus einer N-vt. Grundgesamtheiten bzw. Approximation durch N-Vt. ist zulässig Endlichkeitskorrektur ist vernachlässigbar

35 Test für arithmetisches Mittel
Unterscheide, ob die Varianzen der beiden Grundgesamtheiten homogen sind oder nicht. Varianzen verschieden, σ1²  σ2² : Teststatistik: Testverteilung: Z asymptotisch N(0,1)-vt.

36 Test für arithmetisches Mittel
Varianzhomogenität, σ1² = σ2² = σ²: Teststatistik: wobei Testverteilung: T ~ tv mit v=n1+n2-2 Freiheitsgarden

37 Test für arithmetisches Mittel
Verbundene Stichproben (abhängige oder gepaarte Stpr.) Tritt auf, wenn z.B. die Merkmalsausprägungen der ersten Stpr. und die der zweiten jeweils an demselben Merkmalsträger erhoben werden. Bsp: vorher – nachher Untersuchungen. Test für die Differenz arithmetischer Mittel bei verbundenen Stichproben.

38 Test für arithmetisches Mittel
Differenzen der Wertepaare: Di = X2i – X1i sind N-vt. mit E(Di) = µ2i - µ1i = δ und Var(Di) =σD² Teststatistik: Testverteilung: T~tv mit v=n-1

39 Test für Varianz Einstichprobentest für die Varianz:
Hat die Varianz einen bestimmten Wert, bzw. liegt er in einem bestimmten Bereich? Entscheidung basiert auf dem Ergebnis einer einzigen Stichprobe. Zweistichprobentest für die Varianz Unterscheiden sich die Varianzen zweier Gruppen? Entscheidung basiert auf zwei Stichproben

40 Test für Varianz Einstichprobentest für die Varianz:
Annahme: Grundgesamtheit normalverteilt H0: σ² = σ0² gegen H1: σ²  σ0² Teststatistik: Testverteilung: χ²v mit v=n-1 Entscheidung: χ² > χ²co oder χ² < χ²cu, lehnen H0 ab p-Wert < α, lehne H0 ab

41 Test für Varianz Zweistichprobentest für den Quotienen zweier Varianzen: Annahme: Grundgesamtheit normalverteilt H0: σ1² = σ2² gegen H1: σ1²  σ2² Teststatistik: Testverteilung: Fv1,v2 mit v1=n1-1 und v2=n2-1 Entscheidung: F > Fco oder F < Fcu, lehnen H0 ab p-Wert < α, lehne H0 ab

42 Nichtparametrische Tests
Nichtparametrische Tests (v.a. wenn Annahme der Normalverteilung nicht erfüllt ist). Rangtests für Lageparameter Zeichentest Wilcoxon Vorzeichenrangtest für das Symmetriezentrum einer Verteilung Verteilungsfreie Lokationsvergleiche Wilcoxon Rangsummentest oder Mann-Whitney U Test

43 Rangtests für Lageparameter
Zeichentest (Ordinalskala ausreichend) Annahme: unabhängige Beobachtungen x1, ..., xn stammen aus einer Grundgesamtheit mit stetiger Verteilungsfunktion F. Test für den Median ξ0,5 der Grundgesamtheit Einseitige Hypothesen: H0: ξ0,5  ξ0 gegen H1: ξ0,5 > ξ0 H0: ξ0,5  ξ0 gegen H1: ξ0,5 < ξ0 Zweiseitige Hypothese: H0: ξ0,5 = ξ0 gegen H1: ξ0,5  ξ0

44 Rangtests für Lageparameter
Vorgehensweise: Transformation der Beobachtungswerte: xi‘ = xi - ξ0 Bestimmung von yi yi = 1 falls xi‘ > 0, yi = 0 falls xi‘ < 0, Bindungen: yi = ½ falls xi‘ = 0

45 Rangtests für Lageparameter
Teststatistik: Unter H0 ist T ~ B(n, ½) Approximation durch N(0,1): Entscheidung: Vergleich von Z mit kritischen Werten der N(0,1) Verteilung

46 Rangtests für Lageparameter
Beispiel für Zeichentest (Hartung, S. 243): Alter von Frauen bei der Geburt des ersten Kindes. H0: ξ0,5  25 gegen H1: ξ0,5 > 25. Zufällige Auswahl von n = 36 Müttern. i Alter xi xi‘ yi 1 30,6 5,6 2 17,8 -7,2 : 35 20 -5 36 23,5 -1,5

47 Rangtests für Lageparameter
Beispiel Approximation durch N-Vt Entscheidung (bei α=0,05): Z < 1,645 Lehne H0: ξ0,5  25 nicht ab.

48 Rangtests für Lageparameter
Wilcoxon Vorzeichenrangtest für das Symmetriezentrum einer Grundgesamtheit Basiert auf Rangzahlen der Beobachtungen Annahme: n unabhängige Beobachtungen (x1, ..., xn) stammen aus einer Grundgesamtheit mit Verteilungsfunktion F Frage: Ist die Verteilung symmetrisch um einen Wert ξ0, d.h. gilt F(ξ0-y) = 1-F(ξ0+y)?

49 Rangtests für Lageparameter

50 Rangtests für Lageparameter
Wilcoxon Vorzeichenrangtest für das Symmetriezentrum ξ0 einer Grundgesamtheit Einseitige Hypothesen: H0: F symmetrisch um ξ  ξ0 H0: F symmetrisch um ξ  ξ0 Zweiseitige Hypothese: H0: F symmetrisch um ξ = ξ0

51 Rangtests für Lageparameter
Vorgehensweise: Transformation der Beobachtungswerte: xi‘ = xi - ξ0 Ohne Berücksichtigung der Vorzeichen der xi‘ Rangzahlen Ri zuweisen (1 für kleinsten Wert, ..., n für größten Wert). Den Rangzahlen werden die Vorzeichen der zugehörigen xi‘ Werte zugewiesen => Rangstatistik R̃i

52 Rangtests für Lageparameter
Teststatistik: mit ci = 0 falls R̃i < 0 und ci = 1 falls R̃i > 0 Entscheidung: Vergleich von T+ mit kritischen Werten wn,α des Vorzeichenrang-test von Wilcoxon (z.B. Hartung S. 245)

53 Rangtests für Lageparameter
Approximation durch N(0,1) Verteilung: Teststatistik T* (keine Bindungen): mit E T+ = n(n+1) / 4 und Var T+ = n(n+1)(2n+1) / 24 (Beim Auftreten von Bindungen: T* laut Hartung, S. 246) Vergleich von T* mit kritischen Werten der N(0,1) Verteilung

54 Rangtests für Lageparameter
Beispiel Wilcoxon Vorzeichenrangtest Psychologischer Test, Bewertung durch Punkte xi H0: F symmetrisch um ξ = ξ0 = 61, α = 0,05 Teststatistik: ci = 0 falls R̃i < 0 und ci = 1 falls R̃i > 0

55 Rangtests für Lageparameter
Beispiel: T+ = 1·10,5+0·(-3)+1·3+0·(-7)+1·7+1·9+0·(-3)+1·5+1·1 +1·10,5+1·7 = 53 i xi xi‘ = xi- ξ0 Ri R̃i 1 72 11 10,5 2 55 -6 3 -3 67 6 4 53 -8 7 -7 5 69 8 71 10 9 68 65

56 Rangtests für Lageparameter
Beispiel: Kritische Werte aus Tabelle: wn;α/2 = w11;0,025 = 11 und wn;1-α/2 = w11;0,975 = 54 Entscheidung: w11;0,025 = 11 < T+ = 53 < 54 = w11;0,975 Daher: lehne H0 nicht ab, F ist symmetrisch um ξ0 = 61.

57 Vt.-freie Lokationsvergleiche
Wilcoxon Rangsummentest oder Mann-Whitney U Test Annahme: zwei unabhängige Messreihen, zugrundeliegenden Verteilungsfunktionen sind stetig und vergleichbar (d.h. sie schneiden einander nicht). Frage: Besteht ein Unterschied in den Verteilungen? Sind z.B. die Werte der einen Messreihe „im Durchschnitt größer“ als die der anderen?

58 Vt.-freie Lokationsvergleiche

59 Vt.-freie Lokationsvergleiche
Einseitige Hypothesen: H0: F1(x)  F2(x) gegen H1: F1(x)  F2(x) und für mind. ein x gilt: F1(x) < F2(x) H0: F1(x)  F2(x) gegen H1: F1(x)  F2(x) und für mind. ein x gilt: F1(x) > F2(x) Zweiseitig Hypothese: H0: F1(x) = F2(x) gegen H1: F1(x)  F2(x)

60 Vt.-freie Lokationsvergleiche
Vorgehensweise: Gemeinsame Rangzahlen der beiden Messreihen bilden: r1, ..., rn1, rn1+1, ..., rn1+n2 Teststatistik: Kritische Werte des Wilcoxon-Rangsummen-Tests aus Tabelle (siehe z.B. Hartung 518)

61 Vt.-freie Lokationsvergleiche
Entscheidung: H0: F1(x)  F2(x), H0 verwerfen falls Wn1,n2 > Wn1;n2;1-α H0: F1(x)  F2(x), H0 verwerfen falls Wn1,n2 < Wn1;n2;α Zweiseitig Hypothese: H0: F1(x) = F2(x) H0 verwerfen falls Wn1,n2 < Wn1;n2;α/2 oder Wn1,n2 > Wn1;n2;1-α/2

62 Vt.-freie Lokationsvergleiche
Beispiel: Behandlung von Pilzen mit Vitamin B1. Führt diese Behandlung zu (signifikant) höherem Gewicht? Behand-lung Rangz. Kontrolle 27 19 26,5 18 7 17 6 34 22,5 22 14 14,5 5 18,5 8 20,5 12 24,5 13,5 3 9,5 1 29,5 21 12,5 2 4 20 10,5 35,5 24 23 15 28 9 16 13

63 Vt.-freie Lokationsvergleiche
Beispiel: H0: FB(x) ≥ FK(x) bzw. XB ist stochastisch kleiner als XK, α = 0,05. Teststatistik: Summe der Ranzahlen der ersten Messreihe (Behandlungsgruppe): Wn1,n2 = 220. Kritischer Wert: wn1;n2;0,95 = 191 Entscheidung: 220 > 191 => H0 ablehnen. D.h. die Behandlung führt zu einem signifikant höheren Gewicht.

64 Varianzanalyse Varianzanalyse od. ANOVA
Frage: Hat ein Faktor Einfluss auf ein Merkmal? Faktor: Nominal skalierte Größe, Faktorausprägungen = Ebenen oder Stufen Merkmal (durch Faktor beeinflusst): Metrische Größe

65 Varianzanalyse Varianzanalyse Einfache Varianzanalyse: Ein Faktor
Zweifache Varianzanalyse: Zwei Faktoren

66 Varianzanalyse Test, für arithmetische Mittel von zwei oder mehr Grundgesamtheiten. Test, ob die Differenz der arithmetischen Mittel von zwei oder mehr als zwei Grundgesamtheiten signifikant von Null verschieden ist.

67 Varianzanalyse Modellannahmen der Varinazanalyse:
Unabhängigkeit der Stichproben (i=1,…,r) Normalverteilung der Merkmale mit µi und σi² Varianzhomogenität (Homoskedastizität), d.h. σi² = σ²

68 Varianzanalyse Nullhypothese: Alle Gruppen haben den gleichen Mittelwert µ H0: µ1 = µ2 = … = µ Alternativhypothese: Nicht alle Gruppen haben den gleichen Mittelwert µ H1: mindestens zwei µi sind ungleich

69 Varianzanalyse Frage: Beeinflusst der Faktor (nominal-skalierte Größe) das Merkmal (metrisch-skalierte Größe)? Unter H0: µi = µ für alle i (i = 1,…,r Faktorstufen). Abweichung, die dem Faktor zuzuschreiben sind: αi = µi - µ (i = 1,…,r) heißen wahre Effekte auf der i-ten Ebene.

70 Varianzanalyse Modell der einfachen Varianzanalyse: xij = µ + αi + eij
µ … Gesamtmittelwert αi … Effekt auf der i-ten Ebene eij … Versuchsfehler = die Abweichung eines zufällig aus der i-ten Ebene des Faktors herausgegriffenen Beobachtungswertes xik vom Mittelwert µi dieser Ebene. eij = xij – µi = xij – (µ + αi)

71 Varianzanalyse Beispiel: Zugfestigkeit von r = 3 Drahtsorten überprüfen, je Sorte 6 Proben, unabhängig voneinander und N(µi,σ²)-vt. Frage: Bestehen signifikante Unterschiede in der Zugfestigkeit? i Drahtsorte j 1 2 3 9 7,3 18 15,4 15,6 9,6 8,2 14,2 11,5 4 3,9 13 19,4 5 6,8 17,1 6 10,8 9,7 14,4

72 Varianzanalyse Vorgehensweise:
Gesamtmittelwert aller Faktorstufen und Mittelwerte der Faktorstufen bestimmen Bestimmung der Abweichungen Zerlegung der Abweichungsquadratsumme Teststatistik und Testverteilung bestimmen Entscheidung, Interpretation

73 Varianzanalyse Gesamtmittelwert über alle Faktorstufen r
Mittelwerte der r Faktorstufen

74 Varianzanalyse Beispiel: Drahtsorten i Drahtsorte j 1 2 3 x.. 9 7,3
Drahtsorte j 1 2 3 x.. 9 7,3 18 15,4 15,6 9,6 8,2 14,2 11,5 4 3,9 13 19,4 5 6,8 17,1 6 10,8 9,7 14,4 xi. 9,1 11,1 15 11,7

75 Varianzanalyse Abweichungen: Quadratsumme der Abweichungen (Sum of Squares) Abweichungen der Beobachtungen vom Gesamtmittelwert. Summe der Quadratischen Abweichungen Bezeichnungen: SST (Total), SSG (Gesamt)

76 Varianzanalyse Sum of Squares:
Abweichungen der Beobachtungen der einzelnen Messreihen vom Mittelwert der jeweiligen Messreihe. Summe der Quadratischen Abweichungen des Restes, Maß für die nicht durch den Faktor beeinflusste Restvariabilität Bezeichnungen: SSW (Within), SSE (Error), SSR (Residual).

77 Varianzanalyse Sum of Squares:
Abweichungen der Mittelwerte der einzelnen Messreihen vom Gesamtmittelwert. Mit Stichprobengröße multiplizierte Summe der Quadratischen Abweichungen der Stichprobenmittelwerte vom Gesamtmittelwert, also der beobachteten Effekte des Faktors. Bezeichnungen: SSB (Between), SSE (Explained), SSM (Model), SST (Treatment),

78 Varianzanalyse Quadratsummenzerlegung: SST = SSB + SSW
Interpretation: Gesamtvarianz (SST) setzt sich aus der Variation zwischen den Messreihen (SSB) und der Variation innerhalb der Messreihen (SSW) zusammen.

79 Varianzanalyse Idee für Test:
Vergleich der Variation zwischen den Messreihen mit der Variation innerhalb der Messreihen Ist die Variation zwischen den Messreihen größer als jene innerhalb der Messreihen, schließe auf Unterschied zwischen den Messreihen (Faktoreffekt).

80 Varianzanalyse Teststatistik – Idee:
Aus den Beobachtungswerten werden zwei voneinander unabhängige Schätzwerte für sW² und sB² für die Varianzen der Beobachtungswerte innerhalb und zwischen den Stichproben bestimmt. Liegen keine wahren Effekte vor (Gültigkeit von H0), sind sW² und sB² (bis auf zufällige Abweichungen) gleich. Bei Vorhandensein von wahren Effekten (H1) ist sB² systematisch größer als sW².

81 Varianzanalyse Erwartungstreuer Schätzer für die Varianz innerhalb der Messreihen (Restvarianz): Erwartungstreuer Schätzer für die Varianz zwischen den Messreihen (Faktoreffekt)

82 Varianzanalyse Mittlere Quadratsummen (MSS = Mean Sum of Squares):
Quadratsummen dividiert durch entsprechende Freiheitsgrade MSB und MSW sind erwartungstreue Schätzer der Varianz zwischen- und innerhalb der Messreihen.

83 Varianzanalyse Varianzanalysetafel (r Messreihen): Streuungs-ursache
Freiheits-grade (DF) Quadrat-summe (SS) Mittlere Quadratsumme (MS) Unterschied zw Messreihen r-1 SSB (Between) MSB = SSB / (r-1) Zufälliger Fehler N-r SSW (Within) MSW = SSW / (N-r) Gesamt N-1 SST (Total)

84 Varianzanalyse Teststatistik: F = MSB / MSW F ~ F(r-1),(N-r)
Entscheidung: Ist F ≤ Fc, lehne H0 nicht ab (Fc = kritischer Wert der F-Verteilung mit (r-1) und (N-r) Freiheitsgraden).

85 Varianzanalyse Beispiel: Drahtsorten
Quadratsummenzerlegung: SST = SSB + SSW 324,62 = 108, ,58 Mittlere Quadratsummen: MSB = 108,04 / (3-1) = 54,02 MSW = 216,58 / (18-3) = 14,44 Teststatistik: F = MSB / MSW = 3,74 Kritischer Wert der F2;15 Vt. 3,68 Entscheidung: 3,74 > 3,68 => H0 ablehnen, d.h. es besteht ein signifikanter Unterschied zw. den Sorten

86 Varianzanalyse Zweifache Varianzanalyse: Unterscheidung:
2 Faktoren (A und B, wobei r Faktorstufen bei A und p Faktorstufen bei B) 1 metrische Variable Unterscheidung: Modell ohne Wechselwirkungen zw. den Faktoren Modell mit Wechselwirkungen zw. den Faktoren

87 Varianzanalyse Modell ohne Wechselwirkungen zw. den Faktoren
xijk = µ + αi + βj + eijk (für i=1,…,r, j=1,…,p, k=1,…,n) µ gemeinsamer Mittelwert α, β Faktoreffekte eijk zufällige Fehler

88 Varianzanalyse Mittelwerte: Gesamt Faktor A Faktor B

89 Varianzanalyse Schätzer für Gesamtmittel und Effekte Gesamtmittel
Effekt von Faktor A Effekt von Faktor B

90 Varianzanalyse Quadratsummen SSR = SST – SSE(A) – SSE(B)

91 Varianzanalyse Quadratsummenzerlegung Mittlere Quadratsummen:
SST = SSE(A) + SSE(B) + SSR Mittlere Quadratsummen: MSE(A) = SSE(A) / (r-1) MSE(B) = SSE(B) / (p-1) MSR = SSR / (rpn-r-p+1)

92 Varianzanalyse Prüfgrößen und kritische Werte: Faktor A: Faktor B:
F(A) = MSE(A) / MSR Fr-1,(nrp-r-p+1);1-α Faktor B: F(B) = MSE(B) / MSR Fp-1,(nrp-r-p+1);1-α

93 Varianzanalyse Beispiel: 2 Faktoren (Erreger, Antibiotikum)
Erreger i (A) Antibiotikum j (B) 1 2 3 Mittelwerte Schätzer ai k 38 40 35 41 39 38,5 0,667 42 33 45 34 37,7 -0,167 36 37,3 -0,500 39,8 38,2 35,5 37,8 Schätzer bj 2,000 0,333 -2,333

94 Varianzanalyse Modell mit Wechselwirkungen zw. den Faktoren
xijk = µ + αi + βj + (αβ)ij + eijk (für i=1,…,r, j=1,…,p, k=1,…,n) µ gemeinsamer Mittelwert α, β Faktoreffekte αβ Wechselwirkung eijk zufällige Fehler

95 Varianzanalyse Mittelwerte: Gesamt Faktor A Faktor B Wechselwirkung

96 Varianzanalyse Gesamtmittel und Effekte Gesamtmittel
Effekt von Faktor A Effekt von Faktor B Effekt der Wechselwirkung

97 Varianzanalyse Quadratsummen SSR = SST – SSE(A) – SSE(B) – SSE(AB)

98 Varianzanalyse Quadratsummenzerlegung Mittlere Quadratsummen:
SST = SSE(A) + SSE(B) + SSE(AB) + SSR Mittlere Quadratsummen: MSE(A) = SSE(A) / (r-1) MSE(B) = SSE(B) / (p-1) MSE(AB) = SSE(AB) / (p-1)(r-1) MSR = SSR / (rpn-r-p+1)

99 Varianzanalyse Prüfgrößen und kritische Werte: Faktor A: Faktor B:
F(A) = MSE(A) / MSR Fr-1, pr(n-1); 1-α Faktor B: F(B) = MSE(B) / MSR Fp-1, pr(n-1); 1-α Wechselwirkung: F(AB) = MSE(AB) / MSR F(p-1)(r-1), pr(n-1); 1-α

100 Antibiotikum j (Faktor B)
Varianzanalyse Beispiel: 2 Faktoren + Wechselwirkung Erreger i Antibiotikum j (Faktor B) (Faktor A) 1 2 3 `xi.. ai k xi1k `xi1. (ab)i1 xi2k `xi2. (ab)i2 xi3k `xi3. (ab)i3 38 36,5 -4,000 40 40,5 1,667 38,5 2,333 35 41 39 0,667 42 43,5 3,833 36 -2,000 33 33,5 -1,833 45 34 37,7 -0,167 39,5 0,167 0,333 34,5 -0,500 37,3 `x.j. 39,8 38,2 35,5 37,8 bj 2,000 -2,333

101 Varianzanalyse Beispiel: Varianzanalysetafel
Faktor Erreger: kein Effekt Faktor Antibiotikum: Effekt Interaktion: Effekt (impliziert, dass auch Faktor Erreger eine Wirkung hat). Streuungs-ursache Freiheits-grade Quadrat-summe Mittlere Quadrats. Test-statistik Kritischer Wert Erreger 2 4,33 2,16667 0,52 4,26 Antibiotikum 57,33 28,6667 6,88 Interaktion 4 93,33 23,3333 5,60 3,63 Fehler 9 37,50 4,16667 Total 17 192,5

102 Varianzanalyse

103 Nichtparametrische ANOVA
Kruskal-Wallis Test Unterscheiden sich die Mittelwerte von p Messreihen (n1, …, np)? Voraussetzungen: Stetige Verteilung der Messreihen Mindestens Ordinalskala Setzt weder Normalverteilung, noch Varianzhomogenität voraus. Hypothese: H0: Mittelwerte der p Messreihen sind gleich H1: Mittelwerte unterscheiden sich

104 Nichtparametrische ANOVA
Vorgehensweise: N Messwerten X11, …, Xpnp werden Rangzahlen rij zugewiesen. Summe der Ränge der einzelnen Messreihen berechnen: Bindungen (mehrere Messwerte sind gleich): Mittelwert der Ränge

105 Nichtparametrische ANOVA
Prüfgröße: g … Anzahl der verschiedenen Messwerte t … wie oft tritt ein Messwert auf Treten keine Bindungen auf, ist B = 1

106 Nichtparametrische ANOVA
Entscheidung: H0 ablehnen, wenn H > hp(n1,…,np);1-α h … kritische Werte (Tabelle, z.B. Hartung S. 615) Approximation durch χ²p-1,1-α Verteilung: H0 ablehnen, wenn H > χ²p-1,1-α (Quantile der χ² Verteilung)


Herunterladen ppt "STATISIK LV Nr.: 0021 WS 2005/06 3. November 2005."

Ähnliche Präsentationen


Google-Anzeigen