Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

1 STATISIK LV Nr.: 0021 WS 2005/06 3. November 2005.

Ähnliche Präsentationen


Präsentation zum Thema: "1 STATISIK LV Nr.: 0021 WS 2005/06 3. November 2005."—  Präsentation transkript:

1 1 STATISIK LV Nr.: 0021 WS 2005/06 3. November 2005

2 2 Anteilstests Einstichprobentest für den Anteilswert –Hat der Anteil einen bestimmten Wert, bzw. liegt er in einem bestimmten Bereich? –Entscheidung basiert auf dem Ergebnis einer einzigen Stichprobe. Zweistichprobentest für Anteilswerte –Unterscheiden sich die Anteile zweier unabhängiger Gruppen? –Entscheidung basiert auf zwei Stichproben

3 3 Anteilstest - Einstichprobentest Einstichprobentest für den Anteilswert: Einseitige Hypothesen: –H 0 : θ θ 0 gegen H 1 : θ > θ 0 –H 0 : θ θ 0 gegen H 1 : θ < θ 0 Zweiseitige Hypothesen: –H 0 : θ = θ 0 gegen H 1 : θ θ 0

4 4 Anteilstest - Einstichprobentest Vorgehensweise: Teststatistik bestimmen Testverteilung bestimmen Entescheidung über Annahme oder Ablehnung von H 0.

5 5 Anteilstest - Einstichprobentest Anteilswert einer Stichprobe: P = x / n Unter H 0 ist P, wenn nθ 0 (1-θ 0 ) 9, approximativ N-Vt., mit Parametern –E(P) = θ 0 –Var(P) = θ 0 (1-θ 0 )/n · [(N-n)/(N-1)] Vernachlässigung der Endlichkeitskorrektur wenn n/N < 0,05.

6 6 Anteilstest - Einstichprobentest Prüfgröße / Teststatistik: Standardisierte Zufallsvariable Z:

7 7 Anteilstest - Einstichprobentest Testverteilung: Teststatistik Z ist unter H 0 N(0,1) verteilt. Daher: Testverteilung ist die Standardnormalverteilung.

8 8 Anteilstest - Einstichprobentest Kritischer Bereich: α festlegen (z.B. α = 0,05) Kritischer Wert: α – Quantil der N(0,1)-Vt. Entscheidung: H 0 ablehnen, wenn Teststatistik im kritischen Bereich. p-Wert: α festlegen (z.B. α = 0,05) p-Wert: Niveau, bei dem der Test gerade noch die H 0 ablehnen würde. Entscheidung: H 0 ablehnen, wenn p-Wert < α

9 9 Anteilstest - Einstichprobentest Bsp: Anteil der weiblichen Studenten Approximation durch N-Vt. zulässig, da unter H 0 nθ 0 (1-θ 0 ) = 18, Einseitige Tests: –H 0 : p w 0,5 gegen H 1 : p w > 0,5 und α=0,05 –H 0 : p w 0,5 gegen H 1 : p w < 0,5 und α=0,05 2. Zweiseitiger Test: –H 0 : p w = 0,5 gegen H 1 : p w 0,5 und α=0,05

10 10 Anteilstest - Einstichprobentest Bsp: Anteil der weiblichen Studenten H 0 : p w 0,5 gegen H 1 : p w > 0,5 und α=0,05 –Unter H 0 : E(P) = 0,5, Var(P) = 0,0034 und σ P = 0,0585 (ohne Endlichkeitskorrektur). –Teststatistik: Z = 1,05 –Testverteilung: N(0,1) => Kritischer Wert 1,64 –p-Wert: 0,1461

11 11 Anteilstest - Einstichprobentest Bsp: Anteil der weiblichen Studenten H 0 : p w 0,5 gegen H 1 : p w < 0,5 und α=0,05 –Unter H 0 : E(P) = 0,5, Var(P) = 0,0034 und σ P = 0,0585 (ohne Endlichkeitskorrektur). –Teststatistik: Z = 1,05 –Testverteilung: N(0,1) => Kritischer Wert -1,64 –p-Wert: 0,8539

12 12 Anteilstest - Einstichprobentest Bsp: Anteil der weiblichen Studenten H 0 : p w = 0,5 gegen H 1 : p w 0,5 und α=0,05 –Unter H 0 : E(P) = 0,5, Var(P) = 0,0034 und σ P = 0,0585 (ohne Endlichkeitskorrektur). –Teststatistik: Z = 1,05 –Testverteilung: N(0,1) => Kritische Werte -1,96 und +1,96 –p-Wert: 0,2922

13 13 Anteilstest - Zweistichprobentest Test für die Differenz zweier Anteilswerte Stichprobe 1: Anteil P 1 = x / n 1 Grundgesamtheit 1: Anteil θ 1 Stichprobe 2: Anteil P 2 = x / n 2 Grundgesamtheit 2: Anteil θ 2 H 0 : Anteilswerte der beiden Grundgesamtheiten sind gleich. H 0 : θ 1 = θ 2 (=θ) gegen H 1 : θ 1 θ 2

14 14 Anteilstest - Zweistichprobentest Teststatistik: ( Unter Vernachlässigung der Endlichkeitskorrektur und wenn Voraussetzungen für eine N-Vt. erfüllt sind) Verteilung der Teststatistik unter H 0 : Z ~ N(0,1)

15 15 Anteilstest - Zweistichprobentest Entscheidung: Bestimmung des kritischen Bereichs. –Z > |c| lehne H 0 ab Bestimmung des p-Wertes –p-Wert < α lehne H 0 ab Interpretation: Wird H 0 abgelehnt, dann sind die Anteile in den beiden Gruppen signifikant verschieden.

16 16 Test für arithmetisches Mittel Einstichprobentest für das arithm. Mittel: –Hat das arithm. Mittel einen bestimmten Wert, bzw. liegt es in einem bestimmten Bereich? –Entscheidung basiert auf dem Ergebnis einer einzigen Stichprobe. Zweistichprobentest für das arithm. Mittel –Unterscheiden sich die Mittelwerte zweier Gruppen? –Entscheidung basiert auf zwei Stichproben

17 17 Test für arithmetisches Mittel Einstichprobentest für das arithm. Mittel: –Varianz der Grundgesamtheit ist bekannt. –Varianz der Grundgesamtheit ist unbekannt.

18 18 Test für arithmetisches Mittel Einstichprobentest für das arithm. Mittel: Zweiseitige Hypothese: H 0 : µ = µ 0 gegen H 1 : µ µ 0 Festlegen des Signifikanzniveaus

19 19 Test für arithmetisches Mittel Varianz der Grundgesamtheit ist bekannt. Unter H 0 ist das arithm. Mittel der Stichprobe N-Vt. mit E=µ und Var=σ²/n Teststatistik: Testverteilung: N(0,1)

20 20 Test für arithmetisches Mittel Bestimmung des kritischen Bereichs bzw. Berechung des p-Wertes Entscheidung Interpretation

21 21 Test für arithmetisches Mittel Varianz der Grundgesamtheit ist unbekannt. Schätzwert für unbekanntes σ²: Stichprobenvarianz s². Teststatistik: Testverteilung: t n-1 t-Test

22 22 Test für arithmetisches Mittel Bestimmung des kritischen Bereichs: kritische Werte: α/2-Quantile der t-Vt., symmetrische Vt. daher t c u = -t c o Berechung des p-Wertes: Entscheidung: |t| > t c, lehne H 0 ab p-Wert < α, lehne H 0 ab Interpretation

23 23 Test für arithmetisches Mittel Bsp. mittlere Körpergröße (n = 73) H 0 : µ = 170 gegen H 1 : µ 170, α = 0,05 Arithm. Mittel der Stpr: 173,4 Standardabweichung der Stichprobe: 9,5 Teststatistik T = (173,4-170) / 9,5/ 73 = 3,1 Kritische Werte: -1,96 und +1,96 p-Wert: 0,0021 Mittlere Körpergröße ist signifikant 170

24 24 Test für arithmetisches Mittel Zweistichprobentest für die Differenz zweier arithmetischer Mittel –Unterscheiden sich die Mittelwerte zweier Grundgesamtheiten? –Unterscheiden sich die Mittelwerte zweier verbundener Stichproben?

25 25 Test für arithmetisches Mittel Differenz zweier arithmetischer Mittel die aus 2 Grundgesamtheiten stammen. Voraussetzung: –Stichproben unabhängig –Stichproben stammen aus einer N-vt. Grundgesamtheiten bzw. Approximation durch N-Vt. ist zulässig –Endlichkeitskorrektur ist vernachlässigbar

26 26 Test für arithmetisches Mittel Unterscheide, ob die Varianzen der beiden Grundgesamtheiten homogen sind oder nicht. Varianzen verschieden, σ 1 ² σ 2 ² : Teststatistik: Testverteilung: Z asymptotisch N(0,1)-vt.

27 27 Test für arithmetisches Mittel Varianzhomogenität, σ 1 ² = σ 2 ² = σ²: Teststatistik: wobei Testverteilung: T ~ t v mit v=n 1 +n 2 -2 Freiheitsgarden

28 28 Test für arithmetisches Mittel Verbundene Stichproben (abhängige oder gepaarte Stpr.) –Tritt auf, wenn z.B. die Merkmalsausprägungen der ersten Stpr. und die der zweiten jeweils an demselben Merkmalsträger erhoben werden. Bsp: vorher – nachher Untersuchungen. Test für die Differenz arithmetischer Mittel bei verbundenen Stichproben.

29 29 Test für arithmetisches Mittel Differenzen der Wertepaare: D i = X 2i – X 1i sind N-vt. mit E(D i ) = µ 2i - µ 1i = δ und Var(D i ) =σ D ² Teststatistik: Testverteilung: T~t v mit v=n-1

30 30 Test für Varianz Einstichprobentest für die Varianz: –Hat die Varianz einen bestimmten Wert, bzw. liegt er in einem bestimmten Bereich? –Entscheidung basiert auf dem Ergebnis einer einzigen Stichprobe. Zweistichprobentest für die Varianz –Unterscheiden sich die Varianzen zweier Gruppen? –Entscheidung basiert auf zwei Stichproben

31 31 Test für Varianz Einstichprobentest für die Varianz: Annahme: Grundgesamtheit normalverteilt H 0 : σ² = σ 0 ² gegen H 1 : σ² σ 0 ² Teststatistik: Testverteilung: χ² v mit v=n-1 Entscheidung: –χ² > χ² c o oder χ² < χ² c u, lehnen H 0 ab –p-Wert < α, lehne H 0 ab

32 32 Test für Varianz Zweistichprobentest für den Quotienen zweier Varianzen: Annahme: Grundgesamtheit normalverteilt H 0 : σ 1 ² = σ 2 ² gegen H 1 : σ 1 ² σ 2 ² Teststatistik: Testverteilung: F v1,v2 mit v 1 =n 1 -1 und v 2 =n 2 -1 Entscheidung: –F > F c o oder F < F c u, lehnen H 0 ab –p-Wert < α, lehne H 0 ab

33 33 Test für arithmetisches Mittel Zweistichprobentest für die Differenz zweier arithmetischer Mittel –Unterscheiden sich die Mittelwerte zweier Grundgesamtheiten? –Unterscheiden sich die Mittelwerte zweier verbundener Stichproben?

34 34 Test für arithmetisches Mittel Differenz zweier arithmetischer Mittel die aus 2 Grundgesamtheiten stammen. Voraussetzung: –Stichproben unabhängig –Stichproben stammen aus einer N-vt. Grundgesamtheiten bzw. Approximation durch N-Vt. ist zulässig –Endlichkeitskorrektur ist vernachlässigbar

35 35 Test für arithmetisches Mittel Unterscheide, ob die Varianzen der beiden Grundgesamtheiten homogen sind oder nicht. Varianzen verschieden, σ 1 ² σ 2 ² : Teststatistik: Testverteilung: Z asymptotisch N(0,1)-vt.

36 36 Test für arithmetisches Mittel Varianzhomogenität, σ 1 ² = σ 2 ² = σ²: Teststatistik: wobei Testverteilung: T ~ t v mit v=n 1 +n 2 -2 Freiheitsgarden

37 37 Test für arithmetisches Mittel Verbundene Stichproben (abhängige oder gepaarte Stpr.) –Tritt auf, wenn z.B. die Merkmalsausprägungen der ersten Stpr. und die der zweiten jeweils an demselben Merkmalsträger erhoben werden. Bsp: vorher – nachher Untersuchungen. Test für die Differenz arithmetischer Mittel bei verbundenen Stichproben.

38 38 Test für arithmetisches Mittel Differenzen der Wertepaare: D i = X 2i – X 1i sind N-vt. mit E(D i ) = µ 2i - µ 1i = δ und Var(D i ) =σ D ² Teststatistik: Testverteilung: T~t v mit v=n-1

39 39 Test für Varianz Einstichprobentest für die Varianz: –Hat die Varianz einen bestimmten Wert, bzw. liegt er in einem bestimmten Bereich? –Entscheidung basiert auf dem Ergebnis einer einzigen Stichprobe. Zweistichprobentest für die Varianz –Unterscheiden sich die Varianzen zweier Gruppen? –Entscheidung basiert auf zwei Stichproben

40 40 Test für Varianz Einstichprobentest für die Varianz: Annahme: Grundgesamtheit normalverteilt H 0 : σ² = σ 0 ² gegen H 1 : σ² σ 0 ² Teststatistik: Testverteilung: χ² v mit v=n-1 Entscheidung: –χ² > χ² c o oder χ² < χ² c u, lehnen H 0 ab –p-Wert < α, lehne H 0 ab

41 41 Test für Varianz Zweistichprobentest für den Quotienen zweier Varianzen: Annahme: Grundgesamtheit normalverteilt H 0 : σ 1 ² = σ 2 ² gegen H 1 : σ 1 ² σ 2 ² Teststatistik: Testverteilung: F v1,v2 mit v 1 =n 1 -1 und v 2 =n 2 -1 Entscheidung: –F > F c o oder F < F c u, lehnen H 0 ab –p-Wert < α, lehne H 0 ab

42 42 Nichtparametrische Tests Nichtparametrische Tests (v.a. wenn Annahme der Normalverteilung nicht erfüllt ist). Rangtests für Lageparameter –Zeichentest –Wilcoxon Vorzeichenrangtest für das Symmetriezentrum einer Verteilung Verteilungsfreie Lokationsvergleiche –Wilcoxon Rangsummentest oder Mann-Whitney U Test

43 43 Rangtests für Lageparameter Zeichentest (Ordinalskala ausreichend) –Annahme: unabhängige Beobachtungen x 1,..., x n stammen aus einer Grundgesamtheit mit stetiger Verteilungsfunktion F. Test für den Median ξ 0,5 der Grundgesamtheit Einseitige Hypothesen: –H 0 : ξ 0,5 ξ 0 gegen H 1 : ξ 0,5 > ξ 0 –H 0 : ξ 0,5 ξ 0 gegen H 1 : ξ 0,5 < ξ 0 Zweiseitige Hypothese: –H 0 : ξ 0,5 = ξ 0 gegen H 1 : ξ 0,5 ξ 0

44 44 Rangtests für Lageparameter Vorgehensweise: Transformation der Beobachtungswerte: –x i = x i - ξ 0 Bestimmung von y i –y i = 1 falls x i > 0, y i = 0 falls x i < 0, Bindungen: y i = ½ falls x i = 0

45 45 Rangtests für Lageparameter Teststatistik: Unter H 0 ist T ~ B(n, ½) Approximation durch N(0,1): Entscheidung: Vergleich von Z mit kritischen Werten der N(0,1) Verteilung

46 46 Rangtests für Lageparameter Beispiel für Zeichentest (Hartung, S. 243): –Alter von Frauen bei der Geburt des ersten Kindes. H 0 : ξ 0,5 25 gegen H 1 : ξ 0,5 > 25. Zufällige Auswahl von n = 36 Müttern. iAlter x i x i yiyi 130,65,61 217,8-7,20 :::: ,5-1,50

47 47 Rangtests für Lageparameter Beispiel Approximation durch N-Vt Entscheidung (bei α=0,05): Z < 1,645 Lehne H 0 : ξ 0,5 25 nicht ab.

48 48 Rangtests für Lageparameter Wilcoxon Vorzeichenrangtest für das Symmetriezentrum einer Grundgesamtheit –Basiert auf Rangzahlen der Beobachtungen –Annahme: n unabhängige Beobachtungen (x 1,..., x n ) stammen aus einer Grundgesamtheit mit Verteilungsfunktion F Frage: Ist die Verteilung symmetrisch um einen Wert ξ 0, d.h. gilt F(ξ 0 -y) = 1-F(ξ 0 +y)?

49 49 Rangtests für Lageparameter

50 50 Rangtests für Lageparameter Wilcoxon Vorzeichenrangtest für das Symmetriezentrum ξ 0 einer Grundgesamtheit Einseitige Hypothesen: –H 0 : F symmetrisch um ξ ξ 0 Zweiseitige Hypothese: –H 0 : F symmetrisch um ξ = ξ 0

51 51 Rangtests für Lageparameter Vorgehensweise: Transformation der Beobachtungswerte: –x i = x i - ξ 0 Ohne Berücksichtigung der Vorzeichen der x i Rangzahlen R i zuweisen (1 für kleinsten Wert,..., n für größten Wert). Den Rangzahlen werden die Vorzeichen der zugehörigen x i Werte zugewiesen => Rangstatistik R̃ i

52 52 Rangtests für Lageparameter Teststatistik: mit c i = 0 falls R̃ i 0 Entscheidung: Vergleich von T + mit kritischen Werten w n,α des Vorzeichenrang- test von Wilcoxon (z.B. Hartung S. 245)

53 53 Rangtests für Lageparameter Approximation durch N(0,1) Verteilung: Teststatistik T* (keine Bindungen): mit E T + = n(n+1) / 4 und Var T + = n(n+1)(2n+1) / 24 (Beim Auftreten von Bindungen: T* laut Hartung, S. 246) Vergleich von T* mit kritischen Werten der N(0,1) Verteilung

54 54 Rangtests für Lageparameter Beispiel Wilcoxon Vorzeichenrangtest Psychologischer Test, Bewertung durch Punkte x i H 0 : F symmetrisch um ξ = ξ 0 = 61, α = 0,05 Teststatistik: c i = 0 falls R̃ i 0

55 55 Rangtests für Lageparameter Beispiel: T + = 1·10,5+0·(-3)+1·3+0·(-7)+1·7+1·9+0·(-3)+1·5+1·1 +1·10,5+1·7 = 53 ixixi x i = x i - ξ 0 RiRi R̃ i , ,

56 56 Rangtests für Lageparameter Beispiel: Kritische Werte aus Tabelle: w n;α/2 = w 11;0,025 = 11 und w n;1-α/2 = w 11;0,975 = 54 Entscheidung: w 11;0,025 = 11 < T + = 53 < 54 = w 11;0,975 Daher: lehne H 0 nicht ab, F ist symmetrisch um ξ 0 = 61.

57 57 Vt.-freie Lokationsvergleiche Wilcoxon Rangsummentest oder Mann- Whitney U Test Annahme: zwei unabhängige Messreihen, zugrundeliegenden Verteilungsfunktionen sind stetig und vergleichbar (d.h. sie schneiden einander nicht). Frage: Besteht ein Unterschied in den Verteilungen? Sind z.B. die Werte der einen Messreihe im Durchschnitt größer als die der anderen?

58 58 Vt.-freie Lokationsvergleiche

59 59 Vt.-freie Lokationsvergleiche Einseitige Hypothesen: –H 0 : F 1 (x) F 2 (x) gegen H 1 : F 1 (x) F 2 (x) und für mind. ein x gilt: F 1 (x) < F 2 (x) –H 0 : F 1 (x) F 2 (x) gegen H 1 : F 1 (x) F 2 (x) und für mind. ein x gilt: F 1 (x) > F 2 (x) Zweiseitig Hypothese: –H 0 : F 1 (x) = F 2 (x) gegen H 1 : F 1 (x) F 2 (x)

60 60 Vt.-freie Lokationsvergleiche Vorgehensweise: Gemeinsame Rangzahlen der beiden Messreihen bilden: r 1,..., r n1, r n1+1,..., r n1+n2 Teststatistik: Kritische Werte des Wilcoxon- Rangsummen-Tests aus Tabelle (siehe z.B. Hartung 518)

61 61 Vt.-freie Lokationsvergleiche Entscheidung: –H 0 : F 1 (x) F 2 (x), H 0 verwerfen falls W n1,n2 > W n1;n2;1-α –H 0 : F 1 (x) F 2 (x), H 0 verwerfen falls W n1,n2 < W n1;n2;α Zweiseitig Hypothese: –H 0 : F 1 (x) = F 2 (x) H 0 verwerfen falls W n1,n2 W n1;n2;1-α/2

62 62 Vt.-freie Lokationsvergleiche Beispiel: Behandlung von Pilzen mit Vitamin B 1. Führt diese Behandlung zu (signifikant) höherem Gewicht? Behand- lungRangz. Behand- lungRangz.KontrolleRangz.KontrolleRangz , , ,5518,58 20,51224,51713,539,51 29, ,512, ,535, ,5 2113

63 63 Vt.-freie Lokationsvergleiche Beispiel: H 0 : F B (x) F K (x) bzw. X B ist stochastisch kleiner als X K, α = 0,05. Teststatistik: Summe der Ranzahlen der ersten Messreihe (Behandlungsgruppe): W n1,n2 = 220. Kritischer Wert: w n1;n2;0,95 = 191 Entscheidung: 220 > 191 => H 0 ablehnen. D.h. die Behandlung führt zu einem signifikant höheren Gewicht.

64 64 Varianzanalyse Varianzanalyse od. ANOVA Frage: Hat ein Faktor Einfluss auf ein Merkmal? Faktor: Nominal skalierte Größe, Faktorausprägungen = Ebenen oder Stufen Merkmal (durch Faktor beeinflusst): Metrische Größe

65 65 Varianzanalyse Einfache Varianzanalyse: Ein Faktor Zweifache Varianzanalyse: Zwei Faktoren …

66 66 Varianzanalyse Test, für arithmetische Mittel von zwei oder mehr Grundgesamtheiten. –Test, ob die Differenz der arithmetischen Mittel von zwei oder mehr als zwei Grundgesamtheiten signifikant von Null verschieden ist.

67 67 Varianzanalyse Modellannahmen der Varinazanalyse: –Unabhängigkeit der Stichproben (i=1,…,r) –Normalverteilung der Merkmale mit µ i und σ i ² –Varianzhomogenität (Homoskedastizität), d.h. σ i ² = σ²

68 68 Varianzanalyse Nullhypothese: Alle Gruppen haben den gleichen Mittelwert µ H 0 : µ 1 = µ 2 = … = µ Alternativhypothese: Nicht alle Gruppen haben den gleichen Mittelwert µ H 1 : mindestens zwei µ i sind ungleich

69 69 Varianzanalyse Frage: Beeinflusst der Faktor (nominal- skalierte Größe) das Merkmal (metrisch- skalierte Größe)? Unter H 0 : µ i = µ für alle i (i = 1,…,r Faktorstufen). Abweichung, die dem Faktor zuzuschreiben sind: α i = µ i - µ (i = 1,…,r) heißen wahre Effekte auf der i-ten Ebene.

70 70 Varianzanalyse Modell der einfachen Varianzanalyse: x ij = µ + α i + e ij –µ … Gesamtmittelwert –α i … Effekt auf der i-ten Ebene –e ij … Versuchsfehler = die Abweichung eines zufällig aus der i-ten Ebene des Faktors herausgegriffenen Beobachtungswertes x ik vom Mittelwert µ i dieser Ebene. e ij = x ij – µ i = x ij – (µ + α i )

71 71 Varianzanalyse Beispiel: Zugfestigkeit von r = 3 Drahtsorten überprüfen, je Sorte 6 Proben, unabhängig voneinander und N(µ i,σ²)-vt. Frage: Bestehen signifikante Unterschiede in der Zugfestigkeit? i Drahtsorte j , ,415,69,6 38,214,211,5 43,91319,4 57,36,817,1 610,89,714,4

72 72 Varianzanalyse Vorgehensweise: Gesamtmittelwert aller Faktorstufen und Mittelwerte der Faktorstufen bestimmen Bestimmung der Abweichungen Zerlegung der Abweichungsquadratsumme Teststatistik und Testverteilung bestimmen Entscheidung, Interpretation

73 73 Varianzanalyse Gesamtmittelwert über alle Faktorstufen r Mittelwerte der r Faktorstufen

74 74 Varianzanalyse Beispiel: Drahtsorten i Drahtsorte j123 x.. 197, ,415,69,6 38,214,211,5 43,91319,4 57,36,817,1 610,89,714,4 x i. 9,111,11511,7

75 75 Varianzanalyse Abweichungen: Quadratsumme der Abweichungen (Sum of Squares) –Abweichungen der Beobachtungen vom Gesamtmittelwert. –Summe der Quadratischen Abweichungen –Bezeichnungen: SST (Total), SSG (Gesamt)

76 76 Varianzanalyse Sum of Squares: –Abweichungen der Beobachtungen der einzelnen Messreihen vom Mittelwert der jeweiligen Messreihe. –Summe der Quadratischen Abweichungen des Restes, Maß für die nicht durch den Faktor beeinflusste Restvariabilität –Bezeichnungen: SSW (Within), SSE (Error), SSR (Residual).

77 77 Varianzanalyse Sum of Squares: –Abweichungen der Mittelwerte der einzelnen Messreihen vom Gesamtmittelwert. –Mit Stichprobengröße multiplizierte Summe der Quadratischen Abweichungen der Stichprobenmittelwerte vom Gesamtmittelwert, also der beobachteten Effekte des Faktors. –Bezeichnungen: SSB (Between), SSE (Explained), SSM (Model), SST (Treatment),

78 78 Varianzanalyse Quadratsummenzerlegung: SST = SSB + SSW Interpretation: Gesamtvarianz (SST) setzt sich aus der Variation zwischen den Messreihen (SSB) und der Variation innerhalb der Messreihen (SSW) zusammen.

79 79 Varianzanalyse Idee für Test: –Vergleich der Variation zwischen den Messreihen mit der Variation innerhalb der Messreihen –Ist die Variation zwischen den Messreihen größer als jene innerhalb der Messreihen, schließe auf Unterschied zwischen den Messreihen (Faktoreffekt).

80 80 Varianzanalyse Teststatistik – Idee: –Aus den Beobachtungswerten werden zwei voneinander unabhängige Schätzwerte für s W ² und s B ² für die Varianzen der Beobachtungswerte innerhalb und zwischen den Stichproben bestimmt. –Liegen keine wahren Effekte vor (Gültigkeit von H 0 ), sind s W ² und s B ² (bis auf zufällige Abweichungen) gleich. –Bei Vorhandensein von wahren Effekten (H 1 ) ist s B ² systematisch größer als s W ².

81 81 Varianzanalyse Erwartungstreuer Schätzer für die Varianz innerhalb der Messreihen (Restvarianz): Erwartungstreuer Schätzer für die Varianz zwischen den Messreihen (Faktoreffekt)

82 82 Varianzanalyse Mittlere Quadratsummen (MSS = Mean Sum of Squares): Quadratsummen dividiert durch entsprechende Freiheitsgrade MSB und MSW sind erwartungstreue Schätzer der Varianz zwischen- und innerhalb der Messreihen.

83 83 Varianzanalyse Varianzanalysetafel (r Messreihen): Streuungs- ursache Freiheits- grade (DF) Quadrat- summe (SS) Mittlere Quadratsumme (MS) Unterschied zw Messreihen r-1SSB (Between) MSB = SSB / (r-1) Zufälliger Fehler N-rSSW (Within) MSW = SSW / (N-r) GesamtN-1SST (Total)

84 84 Varianzanalyse Teststatistik: F = MSB / MSW F ~ F (r-1),(N-r) Entscheidung: Ist F F c, lehne H 0 nicht ab (F c = kritischer Wert der F-Verteilung mit (r-1) und (N-r) Freiheitsgraden).

85 85 Varianzanalyse Beispiel: Drahtsorten Quadratsummenzerlegung: SST = SSB + SSW –324,62 = 108, ,58 Mittlere Quadratsummen: –MSB = 108,04 / (3-1) = 54,02 –MSW = 216,58 / (18-3) = 14,44 Teststatistik: –F = MSB / MSW = 3,74 Kritischer Wert der F 2;15 Vt. 3,68 Entscheidung: 3,74 > 3,68 => H 0 ablehnen, d.h. es besteht ein signifikanter Unterschied zw. den Sorten

86 86 Varianzanalyse Zweifache Varianzanalyse: –2 Faktoren (A und B, wobei r Faktorstufen bei A und p Faktorstufen bei B) –1 metrische Variable Unterscheidung: –Modell ohne Wechselwirkungen zw. den Faktoren –Modell mit Wechselwirkungen zw. den Faktoren

87 87 Varianzanalyse Modell ohne Wechselwirkungen zw. den Faktoren x ijk = µ + α i + β j + e ijk (für i=1,…,r, j=1,…,p, k=1,…,n) –µ gemeinsamer Mittelwert –α, β Faktoreffekte –e ijk zufällige Fehler

88 88 Varianzanalyse Mittelwerte: Gesamt Faktor A Faktor B

89 89 Varianzanalyse Schätzer für Gesamtmittel und Effekte Gesamtmittel Effekt von Faktor A Effekt von Faktor B

90 90 Varianzanalyse Quadratsummen SSR = SST – SSE(A) – SSE(B)

91 91 Varianzanalyse Quadratsummenzerlegung –SST = SSE(A) + SSE(B) + SSR Mittlere Quadratsummen: –MSE(A) = SSE(A) / (r-1) –MSE(B) = SSE(B) / (p-1) –MSR = SSR / (rpn-r-p+1)

92 92 Varianzanalyse Prüfgrößen und kritische Werte: Faktor A: –F(A) = MSE(A) / MSR –F r-1,(nrp-r-p+1);1-α Faktor B: –F(B) = MSE(B) / MSR –F p-1,(nrp-r-p+1);1-α

93 93 Varianzanalyse Beispiel: 2 Faktoren (Erreger, Antibiotikum) Erreger i (A) Antibiotikum j (B) 123MittelwerteSchätzer a i k ,50, ,7-0, ,3-0,500 Mittelwerte 39,838,235,537,8 Schätzer b j 2,0000,333-2,333

94 94 Varianzanalyse Modell mit Wechselwirkungen zw. den Faktoren x ijk = µ + α i + β j + (αβ) ij + e ijk (für i=1,…,r, j=1,…,p, k=1,…,n) –µ gemeinsamer Mittelwert –α, β Faktoreffekte –αβWechselwirkung –e ijk zufällige Fehler

95 95 Varianzanalyse Mittelwerte: Gesamt Faktor A Faktor B Wechselwirkung

96 96 Varianzanalyse Gesamtmittel und Effekte Gesamtmittel Effekt von Faktor A Effekt von Faktor B Effekt der Wechselwirkung

97 97 Varianzanalyse Quadratsummen SSR = SST – SSE(A) – SSE(B) – SSE(AB)

98 98 Varianzanalyse Quadratsummenzerlegung –SST = SSE(A) + SSE(B) + SSE(AB) + SSR Mittlere Quadratsummen: –MSE(A) = SSE(A) / (r-1) –MSE(B) = SSE(B) / (p-1) –MSE(AB) = SSE(AB) / (p-1)(r-1) –MSR = SSR / (rpn-r-p+1)

99 99 Varianzanalyse Prüfgrößen und kritische Werte: Faktor A: –F(A) = MSE(A) / MSR –F r-1, pr(n-1); 1-α Faktor B: –F(B) = MSE(B) / MSR –F p-1, pr(n-1); 1-α Wechselwirkung: –F(AB) = MSE(AB) / MSR –F (p-1)(r-1), pr(n-1); 1-α

100 100 Varianzanalyse Beispiel: 2 Faktoren + Wechselwirkung Erreger i Antibiotikum j (Faktor B) (Faktor A) 123 x i.. aiai kx i1k x i1. (ab) i1 x i2k x i2. (ab) i2 x i3k x i3. (ab) i ,5-4, ,51, ,52, ,50, ,53, , ,5-1, ,7-0, ,50, , ,5-0, ,3-0,500 x.j. 39,8 38,2 35,5 37,8 bjbj 2,000 0,333 -2,333

101 101 Varianzanalyse Beispiel: Varianzanalysetafel Faktor Erreger: kein Effekt Faktor Antibiotikum: Effekt Interaktion: Effekt (impliziert, dass auch Faktor Erreger eine Wirkung hat). Streuungs- ursache Freiheits- grade Quadrat- summe Mittlere Quadrats. Test- statistik Kritischer Wert Erreger24,332,166670,524,26 Antibiotikum257,3328,66676,884,26 Interaktion493,3323,33335,603,63 Fehler937,504,16667 Total17192,5

102 102 Varianzanalyse

103 103 Nichtparametrische ANOVA Kruskal-Wallis Test Unterscheiden sich die Mittelwerte von p Messreihen (n 1, …, n p )? Voraussetzungen: –Stetige Verteilung der Messreihen –Mindestens Ordinalskala –Setzt weder Normalverteilung, noch Varianzhomogenität voraus. Hypothese: –H 0 : Mittelwerte der p Messreihen sind gleich –H 1 : Mittelwerte unterscheiden sich

104 104 Nichtparametrische ANOVA Vorgehensweise: –N Messwerten X 11, …, X pnp werden Rangzahlen r ij zugewiesen. –Summe der Ränge der einzelnen Messreihen berechnen: –Bindungen (mehrere Messwerte sind gleich): Mittelwert der Ränge

105 105 Nichtparametrische ANOVA Prüfgröße: –g … Anzahl der verschiedenen Messwerte –t … wie oft tritt ein Messwert auf –Treten keine Bindungen auf, ist B = 1

106 106 Nichtparametrische ANOVA Entscheidung: –H 0 ablehnen, wenn H > h p(n1,…,np);1-α –h … kritische Werte (Tabelle, z.B. Hartung S. 615) Approximation durch χ² p-1,1-α Verteilung: –H 0 ablehnen, wenn H > χ² p-1,1-α (Quantile der χ² Verteilung)


Herunterladen ppt "1 STATISIK LV Nr.: 0021 WS 2005/06 3. November 2005."

Ähnliche Präsentationen


Google-Anzeigen