Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse

Ähnliche Präsentationen


Präsentation zum Thema: "Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse"—  Präsentation transkript:

1 Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse

2 Memo: Mediator- & Moderatoranalyse
Was fällt euch noch ein? Wichtige Infos: Wozu brauche ich das Verfahren und wie rechne ich es.

3 Memo Spezielle Verwendungen der Methode Regressionsanalyse
Funktion Mediatoranalyse: Vermittlung der gemeinsamen Varianz über Drittvariablen sichtbar machen Die vier Schritte der Mediatoranalyse Funktion Moderatoranalyse: Beinflussung der „Höhe“ des Zusammenhangs zwischen zwei Variablen durch (eine) dritte Variable prüfen Zentraler mathematischer Unterschied: Bei der Mediatoranalyse müssen alle Variablen korrelieren, bei der Moderatoranalyse soll die Drittvariable nicht mit Prädiktor/UV korrelieren

4 Thema: einfaktorielle Varianzanalyse

5 Gliederung Anwendung und Funktion der ANOVA
Die Varianzanalyse wird mit ANOVA = Analysis of Variance abgekürzt Anwendung und Funktion der ANOVA Verknüpfung: Effekte, ALM & ANOVA Berechnung der ANOVA Hypothesen & Voraussetzungen Effektgrößen & Formalia

6 ANOVA: Anwendung & Funktion

7 ANOVA: Was und wozu? Ziel: Vergleich von Mittelwerten
strukturell bildhaft 5 12 7 3 8 4 10 6 13 M=5 M=10 Ziel: Vergleich von Mittelwerten  Warum kein t-Test?!  Einfaktorielle ANOVA mit zwei Gruppen entspricht dem t-Test (F=t²)

8 Alpha-Fehler-Kumulierung
strukturell bildhaft emotional 5 12 7 11 3 8 4 10 6 13 M=5 M=10 M=12 Wenn drei Gruppen verglichen werden sollen, sind verschie-dene Vergleiche möglich: (1) struk vs. bild: t(8) = -3.73; p = .006 (2) struk vs. emo: t(8) = -9.04; p = .000 (3) bild vs. emo: t(8) = -1.69; p = .129 Bei jedem der 3 Vergleiche besteht die Gefahr fälschlicher-weise einen signifikanten Effekt zu finden (α = 0.05)!

9 Alpha-Fehler-Kumulierung
Gruppen Vergleiche Kumulierter α-Fehler 3 0.143 4 6 0.264 5 10 0.401 15 0.537 7 21 0.659 8 28 0.762 9 36 0.842 45 0.901 11 55 0.940 12 66 0.966 13 78 0.982 14 91 0.991 105 0.995 Der kumulierte α-Fehler gibt die Wahrscheinlichkeit an, mindestens einen statistisch bedeutsamen Gruppenunterschied zu finden, obwohl in der Population die H0 gilt (alle Gruppen sind gleich). Bereits bei 5 Gruppen nähern wir uns dem Zufallsniveau!

10 Bonferroni-Korrektur
Mit der Bonferroni-Korrektur wird das α-Fehler-Niveau für jeden einzelnen Test soweit herabgesetzt, dass der kumulierte Fehler nur noch 0.05 beträgt. Beispiel: 5 Gruppen  10 Tests  αadj = 0.05 / 10 = 0.005 Nachteil: sehr niedriges Alpha-Niveau bei den einzelnen Tests geringe Power (großer β-Fehler) Bessere Alternative: Berechnung einer Varianzanalyse

11 ANOVA: Was und wozu? Die Varianzanalyse ist ein Verfahren zur Berechnung von Mittelwertsunterschieden zwischen Gruppen → t - Test Die Varianzanalyse wird verwendet, wenn man effizient und mit geringem Beta-Fehler (hoher Power) prüfen will, ob sich mehr als zwei Gruppenmittelwerte signifikant voneinander unterscheiden

12 Übersicht ANOVA Hier eine Übersicht über die verschiedenen varianzanalytischen Verfahren. Einige davon werden wir genauer kennenlernen. (Diese Tabelle finden Sie auch im Skript.)

13 Begriffsklärung 1 Einfaktoriell: Die ANOVA beinhaltet eine UV, die beliebig viele Stufen haben kann Beispiel: Ich untersuche ob sich die Extraversionswerte (AV) der Probanden in Abhängigkeit von der Haarfarbe unterscheiden (UV, hier mit 4 Stufen: braun, schwarz, blond, rot) Die UV kann eine diskrete oder eine kontinuierliche Variable sein

14 Begriffsklärung 2 Mehrfaktoriell: Die ANOVA beinhaltet mehr als zwei UVs oder Faktoren, deren Wirkung auf die AV untersucht wird Beispiel: Als zusätzliche UV in meiner Extraversionsstudie nehme ich den ebenfalls vierstufigen Faktor Haarlänge auf Damit werden auch Wechselwirkungen (Interaktionseffekte) zwischen den Faktoren analysierbar Welche Methode zur Analyse von Wechselwirkungen kennt ihr bereits?

15 Begriffsklärung 3 Feste Effekte: Die UV ist nominalskaliert
Zufällige Effekte: Die UV ist intervallskaliert Die Implikationen für Berechnung und Interpretation der ANOVA werden später im Semester behandelt. Wissbegierigen sei vorab Leonhart S empfohlen. Wie ist es mit Ordinalskalenniveau? Wie ist es, wenn eine UV Nominal- und eine Intervallskalenniveau aufweist?

16 Begriffsklärung 4 Univariat: Wir untersuchen eine AV in Abhängigkeit der UV Multivariat: Wir untersuchen mehrere AV Beispiel: Der Einfluss des Geburtszeitpunkts (UV, dichotom: Sommer/Winter) auf IQ, Lebenszufriedenheit und Größe (AVs) Auch hier Interaktionseffekte?

17 Effekte, ALM & ANOVA

18 Effekte Effekt: Abweichung eines Gruppenmittelwerts vom Gesamtmittelwert → Gruppenzahl = Anzahl der Faktorstufen Mathematisch:

19 Beispiel: Effekte → ALM Mittelwert Gruppe 1 Mittelwert Gruppe 2
Gesamtmittelwert

20 Strukturgleichung des ALM

21 Effekte im ALM

22 ALM in Matrizenform

23 Dummy- und Effektkodierung
Die Varianzanalyse verwendet k-1 (k=Gruppen) Variablen um die Zugehörigkeit zu einer Gruppe in einer Designmatrix darzustellen Die Dummykodierung „spart“, indem sie von einem Nulleffekt für eine Gruppe ausgeht Die Effektkodierung macht sich die Tatsache zur Nutze, dass sich alle Effekte zu Null addieren:

24 Dummykodierung Effektkodierung

25 Berechnung der ANOVA

26 Berechnung der ANOVA Quadratsummenzerlegung F-Test & Interpretation

27 Quadratsummenzerlegung

28 Basis der Methode: Varianz
Quadratsumme MS: Mittlere Quadratsumme Freiheitsgrade

29 Quadratsummenzerlegung
Gesamt-Quadratsumme (SStotal) Quadratsumme innerhalb der Gruppen (SSwithin , SSError) Quadratsumme zwischen den Gruppen (SSbetween, SSTreatment)

30 Gesamt-Quadratsumme strukturell bildhaft y11=5 y12=12 y21=7 y22=7

31 Freiheitsgrade der Gesamtvarianz
strukturell bildhaft y11=5 y12=12 y21=7 y22=7 y31=3 y32=8 y41=4 y42=10 y51=6 y52=13 M1=5 M2=10 G=7.5

32 Gesamtvarianz strukturell bildhaft y11=5 y12=12 y21=7 y22=7 y31=3

33 Varianz innerhalb der Gruppen
strukturell bildhaft y11=5 y12=12 y21=7 y22=7 y31=3 y32=8 y41=4 y42=10 y51=6 y52=13 M1=5 M2=10 G=7.5

34 Varianz zwischen den Gruppen
strukturell bildhaft y11=5 y12=12 y21=7 y22=7 y31=3 y32=8 y41=4 y42=10 y51=6 y52=13 M1=5 M2=10 G=7.5

35 Zwischenergebnisse Gesamtvarianz Varianz innerhalb Varianz zwischen

36 Additivität Quadratsummen sind additiv Freiheitsgrade sind additiv
Varianzen sind nicht additiv

37 F-Test & Interpretation

38 Der F-Test Vergleich zweier Varianzen (→ multiple Regression)
H0: Varianzen gleich groß  F=1 H1: Zählervarianz (=erklärte Varianz) größer  F>1 Femp > Fkrit  Varianzen signifikant verschieden!

39 Abgleich: empirischer & kritischer Wert
Analog zum t-Test wird der berechnete empirische Wert mit einem kritischen Wert aus einer Tabelle verglichen Die H1 gilt wenn Femp > Fkrit Die H0 gilt wenn Femp ≤ Fkrit Im Unterschied zum t-Test hängt der kritische F-Wert von Zähler- und Nennerfreiheitsgraden ab Die Tabelle unterscheidet sich daher auf den ersten Blick, das dahinter stehende Prinzip bleibt jedoch gleich

40 Am Beispiel Varianz innerhalb Varianz zwischen Femp (1, 8) = 62,5 : 4,5 = 13,89 Fkrit (1, 8) = 5,32; α = .05 Femp > Fkrit Es gilt die H1

41 → Leonhart S. 658 ff.

42 Varianzanalyse: rechnerisches Vorgehen im Überblick
Gruppen- und Gesamtmittelwerte bilden Quadratsummen berechnen = „Vorstufe“ der Varianz Freiheitsgrade berechnen Mittlere Quadratsummen berechnen = Varianz F-Bruch bilden, Vergleich mit krit. F-Wert Interpretation: Entscheidung für H0 oder H1

43 Hypothesen & Voraussetzungen

44 Nullhypothese der ANOVA
H0: Alle Mittelwerte sind gleich: μ1 = μ2 = … = μp  μi = μj (für alle i,j) bzw. H0: Alle Effekte sind Null H0: α1 = α2 = … = αp = 0  αi = 0 (für alle i) H0: Die Varianz der Effekte ist Null H0: σ²α = 0 oder σ²Effekt=0

45 Alternativhypothese der ANOVA
H1: Mindestens zwei Mittelwerte sind verschieden μi ≠ μj (für mind. ein Paar i, j) bzw. H1: Mindestens ein Effekt ist ungleich Null αi ≠ 0 (für mindestens ein i) H1: Varianz der Effekte ist größer als Null σ²α > 0 oder σ²Effekt>0 Mittels ANOVA sind nur ungerichtete Alternativhypothesen möglich Welche Gruppen sich unterscheiden analysiert man entweder mittels post-hoc Tests oder Kontrasten (bei Vorliegen von a priori Hypothesen)

46 Voraussetzungen der ANOVA
Intervallskalierte, normalverteilte AV Mindestens 20 Elemente pro Gruppe Ähnlich Gruppengrößen in den Zellen Varianzhomogenität Arbeitsblatt Aufgabe 2

47 Prüfung der Varianzhomogenität
Zur Überprüfung der Varianzhomogenität stehen verschie-dene Tests zur Verfügung: Barlett-Test (sehr empfindlich gegenüber der Verletzungen der Normalverteilung) Levene-Test (relativ unempfindlich gegenüber Verletzungen der Normalverteilung) Fmax-Statistik (Hartley Test, nur bei gleichen Gruppen-Größen)

48 Levene-Test Der Levene-Test ist eine Varianzanalyse über die Ab-weichung der individuellen Messwerte vom Gruppenmittelwert: H0: Wird der Levene-Test signifikant (p < 0.05), dann ist die Annahme der Varianzgleichheit verletzt.

49 Varianzanalyse ist robust
D.h. bei Verletzungen der Annahmen resultieren meistens trotzdem sinnvolle Ergebnisse (Insbesondere bei großen Stichproben).  Wenn nur einzelne Annahmen verletzt sind, können die Ergebnisse einer ANOVA dennoch verwendet werden.  Allerdings muss dann berichtet werden, dass die Annahmen verletzt sind, damit der Leser weiß, das die Ergebnisse mit Vorsicht zu interpretieren sind!

50 Effektgrößen & Formalia

51 Alternativ: Berechnung aus F-Wert
Effektgrößen Was war noch gleich Cohens d? Auch bei der ANOVA lässt sich die praktische Relevanz von Effekten durch Berechnungen vergleichen. Eta² gibt an, wie viel % der Varianz der AV durch die UV erklärt wird. Alternativ: Berechnung aus F-Wert

52 Formalia: F-Tests in Forschungsdokumentationen
Konventionen: Nötige Infos: F- und p-Wert bzw. p-Niveau, Zähler- und Nennerfreiheitsgrade F- und p-Wert : exakt zwei Nachkommastellen; Ausnahme: p-Wert bei n.s. Signifikante Ergebnisse: (F[2, 37] = 5.34; p < .01) Nicht-signifkante Ergebnisse: (F[2, 37] = 1.44; p=.25) oder (F[2, 37] = 1.44; n.s.)

53 Vielen Dank für eure Aufmerksamkeit!

54 Arbeitsblatt Aufgabe 1 Land A Land B Land C y11 = 80 y12 = 35 y13 = 70
Formulieren Sie die Null- und die Alternativhypothese für eine ANOVA Berechnen Sie die Quadrat-summen (total, within, between) Berechnen Sie die mittleren Quadratsummen (…) Berechnen Sie den empirischen F-Wert Geben Sie den kritischen F-Wert an (-> 4,26) Entscheiden Sie sich für eine der Hypothesen In einer Untersuchung zur Lesekompetenz in verschiedenen Ländern ergibt sich folgender Datensatz: Land A Land B Land C y11 = 80 y12 = 35 y13 = 70 y21 = 75 y22 = 50 y23 = 75 y31 = 60 y33 = 75 y41 = 65 y42 = 40 y43 = 45

55 Lösung (a) H0: µa = µb = µc oder…
H0: Die Lesekompetenz unterscheidet sich nicht H1: µi ≠ µj für mindestens ein Paar i,j oder… H1: Die Lesekompetenz unterscheidet sich zwischen mindestens zwei Ländern

56 Lösung (b) MA = 70; MB = 46,25; MC = 66,25 Mges = 60,83
SStotal = 2541,67 SSwithin = 1237,5 SSbetween = 1304,17

57 Lösung (c) MStotal = 2541,67 : 11 = 231,06 MSwithin = 1237,5 : 9 = 137,5 MSbetween = 1304,17 : 2 = 625,08

58 Lösung (d,e,f) Femp (2, 9) = 625,8 : 137,5 = 4,74
Fkrit (2, 9) = 4,26; α = .05 Da Femp > Fkrit gilt die H1

59 Arbeitsblatt Aufgabe 3 Berechnen Sie den Levene-Test für die Daten aus Aufgabe 1 Land A Land B Land C y11 = 80 y12 = 35 y13 = 70 y21 = 75 y22 = 50 y23 = 75 y31 = 60 y33 = 75 y41 = 65 y42 = 40 y43 = 45

60 Lösung MA = 7,5; MB = 8,75; MC = 10,63 Mges = 8,96 Land A Land B
Land C d11 = 10 d12 = 11,25 d13 = 3,75 d21 = 5 d22 = 3,75 d23 = 8,75 d31 = 10 d31 = 13,75 d33 = 8,75 d41 = 5 d42 = 6,25 d43 = 21,25

61 Lösung 2 SStotal = 274,88 SSwithin = 254,69 SSbetween = 19,79
MStotal = 24,95 MSwithin = 28,3 MSbetween = 9,9

62 Lösung 3 Femp (2, 9) = 0,35 Fkrit (2, 9) = 4,26; α = .05
Da Femp < Fkrit gilt die H0, die Annahme der Varianzhomogenität ist nicht verletzt


Herunterladen ppt "Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse"

Ähnliche Präsentationen


Google-Anzeigen