Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse

Ähnliche Präsentationen


Präsentation zum Thema: "Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse"—  Präsentation transkript:

1 Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse

2 Memo: Mediator- & Moderatoranalyse Was fällt euch noch ein?

3 Memo -Spezielle Verwendungen der Methode Regressionsanalyse -Funktion Mediatoranalyse: Vermittlung der gemeinsamen Varianz über Drittvariablen sichtbar machen -Die vier Schritte der Mediatoranalyse -Funktion Moderatoranalyse: Beinflussung der Höhe des Zusammenhangs zwischen zwei Variablen durch (eine) dritte Variable prüfen -Zentraler mathematischer Unterschied: Bei der Mediatoranalyse müssen alle Variablen korrelieren, bei der Moderatoranalyse soll die Drittvariable nicht mit Prädiktor/UV korrelieren

4 Thema: einfaktorielle Varianzanalyse

5 Gliederung Die Varianzanalyse wird mit ANOVA = Analysis of Variance abgekürzt I.Anwendung und Funktion der ANOVA II.Verknüpfung: Effekte, ALM & ANOVA III.Berechnung der ANOVA IV.Hypothesen & Voraussetzungen V.Effektgrößen & Formalia

6 I.ANOVA: Anwendung & Funktion

7 ANOVA: Was und wozu? Ziel: Vergleich von Mittelwerten Warum kein t-Test?! Einfaktorielle ANOVA mit zwei Gruppen entspricht dem t-Test (F=t²) strukturellbildhaft M=5M=10

8 Alpha-Fehler-Kumulierung Wenn drei Gruppen verglichen werden sollen, sind verschie- dene Vergleiche möglich: (1) struk vs. bild: t(8) = -3.73; p =.006 (2) struk vs. emo: t(8) = -9.04; p =.000 (3) bild vs. emo: t(8) = -1.69; p =.129 Bei jedem der 3 Vergleiche besteht die Gefahr fälschlicher- weise einen signifikanten Effekt zu finden (α = 0.05)! strukturellbildhaftemotional M=5M=10M=12

9 GruppenVergleiche Kumulierter α-Fehler Alpha-Fehler-Kumulierung Der kumulierte α-Fehler gibt die Wahrscheinlichkeit an, mindestens einen statistisch bedeutsamen Gruppenunterschied zu finden, obwohl in der Population die H 0 gilt (alle Gruppen sind gleich). Bereits bei 5 Gruppen nähern wir uns dem Zufallsniveau!

10 Bonferroni-Korrektur Mit der Bonferroni-Korrektur wird das α-Fehler-Niveau für jeden einzelnen Test soweit herabgesetzt, dass der kumulierte Fehler nur noch 0.05 beträgt. Beispiel:5 Gruppen 10 Tests α adj = 0.05 / 10 = Nachteil: sehr niedriges Alpha-Niveau bei den einzelnen Tests geringe Power (großer β-Fehler) Bessere Alternative: Berechnung einer Varianzanalyse

11 ANOVA: Was und wozu? oDie Varianzanalyse ist ein Verfahren zur Berechnung von Mittelwertsunterschieden zwischen Gruppen t - Test oDie Varianzanalyse wird verwendet, wenn man effizient und mit geringem Beta- Fehler (hoher Power) prüfen will, ob sich mehr als zwei Gruppenmittelwerte signifikant voneinander unterscheiden

12 Übersicht ANOVA

13 Begriffsklärung 1 oEinfaktoriell: Die ANOVA beinhaltet eine UV, die beliebig viele Stufen haben kann oBeispiel: Ich untersuche ob sich die Extraversionswerte (AV) der Probanden in Abhängigkeit von der Haarfarbe unterscheiden (UV, hier mit 4 Stufen: braun, schwarz, blond, rot)

14 oMehrfaktoriell: Die ANOVA beinhaltet mehr als zwei UVs oder Faktoren, deren Wirkung auf die AV untersucht wird oBeispiel: Als zusätzliche UV in meiner Extraversionsstudie nehme ich den ebenfalls vierstufigen Faktor Haarlänge auf Damit werden auch Wechselwirkungen (Interaktionseffekte) zwischen den Faktoren analysierbar Welche Methode zur Analyse von Wechselwirkungen kennt ihr bereits? Begriffsklärung 2

15 oFeste Effekte: Die UV ist nominalskaliert oZufällige Effekte: Die UV ist intervallskaliert Die Implikationen für Berechnung und Interpretation der ANOVA werden später im Semester behandelt. Wissbegierigen sei vorab Leonhart S empfohlen. Begriffsklärung 3

16 Begriffsklärung 4 oUnivariat: Wir untersuchen eine AV in Abhängigkeit der UV oMultivariat: Wir untersuchen mehrere AV Beispiel: Der Einfluss des Geburtszeitpunkts (UV, dichotom: Sommer/Winter) auf IQ, Lebenszufriedenheit und Größe (AVs)

17 II.Effekte, ALM & ANOVA

18 Effekte Effekt: Abweichung eines Gruppenmittelwerts vom Gesamtmittelwert Gruppenzahl = Anzahl der Faktorstufen Mathematisch:

19 Gesamtmittelwert Mittelwert Gruppe 2 Mittelwert Gruppe 1 ALM Beispiel: Effekte

20 Strukturgleichung des ALM

21 Effekte im ALM

22 ALM in Matrizenform

23 Dummy- und Effektkodierung oDie Varianzanalyse verwendet k-1 (k=Gruppen) Variablen um die Zugehörigkeit zu einer Gruppe in einer Designmatrix darzustellen oDie Dummykodierung spart, indem sie von einem Nulleffekt für eine Gruppe ausgeht oDie Effektkodierung macht sich die Tatsache zur Nutze, dass sich alle Effekte zu Null addieren:

24 Dummykodierung Effektkodierung

25 III.Berechnung der ANOVA

26 Berechnung der ANOVA -Quadratsummenzerlegung -F-Test & Interpretation

27 Quadratsummenzerlegung

28 Basis der Methode: Varianz Quadratsumme Freiheitsgrade MS: Mittlere Quadratsumme

29 Quadratsummenzerlegung Gesamt-Quadratsumme (SS total ) Quadratsumme innerhalb der Gruppen (SS within, SS Error ) Quadratsumme zwischen den Gruppen (SS between, SS Treatment )

30 Gesamt-Quadratsumme strukturellbildhaft y 11 =5y 12 =12 y 21 =7y 22 =7 y 31 =3y 32 =8 y 41 =4y 42 =10 y 51 =6y 52 =13 M 1 =5M 2 =10 G=7.5

31 Freiheitsgrade der Gesamtvarianz strukturellbildhaft y 11 =5y 12 =12 y 21 =7y 22 =7 y 31 =3y 32 =8 y 41 =4y 42 =10 y 51 =6y 52 =13 M 1 =5M 2 =10 G=7.5

32 strukturellbildhaft y 11 =5y 12 =12 y 21 =7y 22 =7 y 31 =3y 32 =8 y 41 =4y 42 =10 y 51 =6y 52 =13 M 1 =5M 2 =10 G=7.5 Gesamtvarianz

33 Varianz innerhalb der Gruppen strukturellbildhaft y 11 =5y 12 =12 y 21 =7y 22 =7 y 31 =3y 32 =8 y 41 =4y 42 =10 y 51 =6y 52 =13 M 1 =5M 2 =10 G=7.5

34 Varianz zwischen den Gruppen strukturellbildhaft y 11 =5y 12 =12 y 21 =7y 22 =7 y 31 =3y 32 =8 y 41 =4y 42 =10 y 51 =6y 52 =13 M 1 =5M 2 =10 G=7.5

35 Zwischenergebnisse Gesamtvarianz Varianz innerhalb Varianz zwischen

36 Additivität Quadratsummen sind additiv Freiheitsgrade sind additiv Varianzen sind nicht additiv

37 F-Test & Interpretation

38 Der F-Test Vergleich zweier Varianzen ( multiple Regression) H 0 : Varianzen gleich groß F=1 H 1 : Zählervarianz (=erklärte Varianz) größer F>1 F emp > F krit Varianzen signifikant verschieden!

39 Abgleich: empirischer & kritischer Wert oAnalog zum t-Test wird der berechnete empirische Wert mit einem kritischen Wert aus einer Tabelle verglichen Die H 1 gilt wenn F emp > F krit Die H 0 gilt wenn F emp F krit oIm Unterschied zum t-Test hängt der kritische F-Wert von Zähler- und Nennerfreiheitsgraden ab

40 Am Beispiel o F emp (1, 8) = 62,5 : 4,5 = 13,89 o F krit (1, 8) = 5,32; α =.05 o F emp > F krit Es gilt die H1 Varianz innerhalb Varianz zwischen

41 Leonhart S. 658 ff.

42 Varianzanalyse: rechnerisches Vorgehen im Überblick oGruppen- und Gesamtmittelwerte bilden oQuadratsummen berechnen = Vorstufe der Varianz oFreiheitsgrade berechnen oMittlere Quadratsummen berechnen = Varianz oF-Bruch bilden, Vergleich mit krit. F-Wert oInterpretation: Entscheidung für H 0 oder H 1

43 IV.Hypothesen & Voraussetzungen

44 Nullhypothese der ANOVA H 0 : Alle Mittelwerte sind gleich: μ 1 = μ 2 = … = μ p μ i = μ j (für alle i,j) bzw. H 0 : Alle Effekte sind Null H 0: α 1 = α 2 = … = α p = 0 α i = 0 (für alle i) bzw. H 0 : Die Varianz der Effekte ist Null H 0: σ² α = 0 oder σ² Effekt =0

45 H 1 : Mindestens zwei Mittelwerte sind verschieden μ i μ j (für mind. ein Paar i, j) bzw. H 1 : Mindestens ein Effekt ist ungleich Null α i 0 (für mindestens ein i) bzw. H 1 : Varianz der Effekte ist größer als Null σ² α > 0 oder σ² Effekt >0 Mittels ANOVA sind nur ungerichtete Alternativhypothesen möglich Alternativhypothese der ANOVA

46 Voraussetzungen der ANOVA (1)Intervallskalierte, normalverteilte AV (2)Mindestens 20 Elemente pro Gruppe (3)Ähnlich Gruppengrößen in den Zellen (4)Varianzhomogenität

47 Prüfung der Varianzhomogenität Zur Überprüfung der Varianzhomogenität stehen verschie- dene Tests zur Verfügung: a)Barlett-Test (sehr empfindlich gegenüber der Verletzungen der Normalverteilung) b)Levene-Test (relativ unempfindlich gegenüber Verletzungen der Normalverteilung) c)F max -Statistik (Hartley Test, nur bei gleichen Gruppen-Größen)

48 Levene-Test Der Levene-Test ist eine Varianzanalyse über die Ab-weichung der individuellen Messwerte vom Gruppenmittelwert: H0:H0: Wird der Levene-Test signifikant (p < 0.05), dann ist die Annahme der Varianzgleichheit verletzt.

49 Varianzanalyse ist robust D.h. bei Verletzungen der Annahmen resultieren meistens trotzdem sinnvolle Ergebnisse (Insbesondere bei großen Stichproben). Wenn nur einzelne Annahmen verletzt sind, können die Ergebnisse einer ANOVA dennoch verwendet werden. Allerdings muss dann berichtet werden, dass die Annahmen verletzt sind, damit der Leser weiß, das die Ergebnisse mit Vorsicht zu interpretieren sind!

50 V.Effektgrößen & Formalia

51 Effektgrößen oWas war noch gleich Cohens d? oAuch bei der ANOVA lässt sich die praktische Relevanz von Effekten durch Berechnungen vergleichen. oEta² gibt an, wie viel % der Varianz der AV durch die UV erklärt wird. Alternativ: Berechnung aus F-Wert

52 Formalia: F-Tests in Forschungsdokumentationen Konventionen: -Nötige Infos: F- und p-Wert bzw. p-Niveau, Zähler- und Nennerfreiheitsgrade -F- und p-Wert : exakt zwei Nachkommastellen; Ausnahme: p-Wert bei n.s. Signifikante Ergebnisse: (F[2, 37] = 5.34; p <.01) Nicht-signifkante Ergebnisse: (F[2, 37] = 1.44; p=.25) oder (F[2, 37] = 1.44; n.s.)

53 Vielen Dank für eure Aufmerksamkeit!

54 Arbeitsblatt Aufgabe 1 In einer Untersuchung zur Lesekompetenz in verschiedenen Ländern ergibt sich folgender Datensatz: Land ALand BLand C y 11 = 80y 12 = 35y 13 = 70 y 21 = 75y 22 = 50y 23 = 75 y 31 = 60 y 33 = 75 y 41 = 65y 42 = 40y 43 = 45 a.Formulieren Sie die Null- und die Alternativhypothese für eine ANOVA b.Berechnen Sie die Quadrat- summen (total, within, between) c.Berechnen Sie die mittleren Quadratsummen (…) d.Berechnen Sie den empirischen F-Wert e.Geben Sie den kritischen F- Wert an (-> 4,26) f.Entscheiden Sie sich für eine der Hypothesen

55 Lösung (a) H0: µ a = µ b = µ c oder… H0: Die Lesekompetenz unterscheidet sich nicht H1: µ i µ j für mindestens ein Paar i,j oder… H1: Die Lesekompetenz unterscheidet sich zwischen mindestens zwei Ländern

56 Lösung (b) M A = 70; M B = 46,25; M C = 66,25 M ges = 60,83 SS total = 2541,67 SS within = 1237,5 SS between = 1304,17

57 Lösung (c) MS total = 2541,67 : 11 = 231,06 MS within = 1237,5 : 9 = 137,5 MS between = 1304,17 : 2 = 625,08

58 Lösung (d,e,f) d.F emp (2, 9) = 625,8 : 137,5 = 4,74 e.F krit (2, 9) = 4,26; α =.05 f.Da F emp > F krit gilt die H1

59 Arbeitsblatt Aufgabe 3 Berechnen Sie den Levene-Test für die Daten aus Aufgabe 1 Land ALand BLand C y 11 = 80y 12 = 35y 13 = 70 y 21 = 75y 22 = 50y 23 = 75 y 31 = 60 y 33 = 75 y 41 = 65y 42 = 40y 43 = 45

60 Lösung Land ALand BLand C d 11 = 10d 12 = 11,25d 13 = 3,75 d 21 = 5d 22 = 3,75d 23 = 8,75 d 31 = 10d 31 = 13,75d 33 = 8,75 d 41 = 5d 42 = 6,25d 43 = 21,25 M A = 7,5; M B = 8,75; M C = 10,63 M ges = 8,96

61 Lösung 2 SS total = 274,88 SS within = 254,69 SS between = 19,79 MS total = 24,95 MS within = 28,3 MS between = 9,9

62 Lösung 3 oF emp (2, 9) = 0,35 oF krit (2, 9) = 4,26; α =.05 Da F emp < F krit gilt die H0, die Annahme der Varianzhomogenität ist nicht verletzt


Herunterladen ppt "Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse"

Ähnliche Präsentationen


Google-Anzeigen