Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse

Slides:



Advertisements
Ähnliche Präsentationen
T - Test Prüfung des Mittelwerteunterschieds bei abhängigen und unabhängigen Stichproben.
Advertisements

Anzahl der ausgefüllten und eingesandten Fragebögen: 211
Tutorat Statistik II im SS 09 zweifaktorielle Varianzanalyse
Tutorat Statistik II im SS 09 Zufallseffekte & Messwiederholung
Tutorat Statistik II im SS 09 Mediator- & Moderatoranalyse
Tutorat Statistik II im SS 09 Multiple Regression
Korrektur Tutoratsaufgaben V
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil3.
Heute 1.F – Test zur Varianzhomogenität 2.Bartlett-Test zur Varianzhomogenität 3.Chi – Quadrat Tests für Häufigkeiten 4.Chi – Quadrat Tests zur Verteilungsanpassung.
Thema der Stunde I. Einführung in die Varianzanalyse:
Einfaktorielle Varianzanalyse
Gliederung Vertrauensintervalle Arten von Hypothesen
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-28.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
A-Priori Kontraste Prüfung des Mittelwerteunterschieds von Faktorstufen bzw. Kombinationen von Faktorstufen: z.B.: oder.
Rechneraufbau & Rechnerstrukturen, Folie 2.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 2.
Ein frohes und erfolgreiches Jahr
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil2.
Hypothesen testen: Grundidee
Prof. Dr. Bernhard Wasmayr
Prüfung statistischer Hypothesen
Effektgrößen, Kontraste & Post-hoc-Tests
Aufgabe Der Zusammenhang zwischen einem traumatischen Erlebnis und der Entstehung einer PTBS wird von mehreren Variablen …………….: Copingstrategien, Kontrollüberzeigung,
Fragen Was wird mit der Alphafehler-Kumulierung bzw. –inflation bezeichnet? Wie hoch ist die Wahrscheinlichkeit bei einer Untersuchung mit 4 Gruppen einen.
Konfidenzintervalle Intervallschätzung
Ab nächster Woche wird die Übungsgruppe Gruppe 2: Henrike Berg Di SR 222 wegen Personalmangel eingestellt.
Prof. Dr. Bernhard Wasmayr VWL 2. Semester
AWA 2007 Natur und Umwelt Natürlich Leben
Tutorium
Tutorium
Tutorium
Vorlesung: ANOVA I
Wiederholung: Einfache Regressionsgleichung
Deutsch als Zweitsprache: Experimentelle Methoden WS 2013/2014
20:00.
Formulierung und Überprüfung von Hypothesen
Varianzanalyse IV: Messwiederholung
Vergleich der 3 Arten des t-Tests Testergebnisse berichten
Eine Einführung in die CD-ROM
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Chi Quadrat Test Tamara Katschnig.
Wahrscheinlichkeitsrechnung
Varianzanalyse III: Zweifaktorielle Varianzanalyse
Kovarianzanalyse Störvariablen Veranschaulichung der Kovarianzanalyse
Einfaktorielle Varianzanalyse (ANOVA)
Das Allgemeine Lineare Modell (ALM)
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
STATISIK LV Nr.: 1375 SS März 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
Modul Statistische Datenanalyse
SStotal SStotal SStreat SSerror SStreat SSerror Biomasse (g) wenig
Konfidenzintervall und Testen für den Mittelwert und Anteile
Ertragsteuern, 5. Auflage Christiana Djanani, Gernot Brähler, Christian Lösel, Andreas Krenzin © UVK Verlagsgesellschaft mbH, Konstanz und München 2012.
Zahlentheorie und Zahlenspiele Hartmut Menzer, Ingo Althöfer ISBN: © 2014 Oldenbourg Wissenschaftsverlag GmbH Abbildungsübersicht / List.
MINDREADER Ein magisch - interaktives Erlebnis mit ENZO PAOLO
Schutzvermerk nach DIN 34 beachten 20/05/14 Seite 1 Grundlagen XSoft Lösung :Logische Grundschaltung IEC-Grundlagen und logische Verknüpfungen.
Folie Beispiel für eine Einzelauswertung der Gemeindedaten (fiktive Daten)
Tutorium Statistik II Übung IV Philipp Schäpers Mi – 11.45
Folie Einzelauswertung der Gemeindedaten
Datum:17. Dezember 2014 Thema:IFRS Update zum Jahresende – die Neuerungen im Überblick Referent:Eberhard Grötzner, EMA ® Anlass:12. Arbeitskreis Internationale.
Die einfache/multiple lineare Regression
Soziale Urteilsbildung Lozo, Soziale Urteilsbildung, AE Sozialpsychologie, SS 2004 Laienhafte Inferenzstrategien oder „the intuitive psychologist“ 2: Urteilsheuristiken.
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Die einfache/multiple lineare Regression
Varianzanalyse und Eta²
ANOVA für unabhängige Daten.
 Präsentation transkript:

Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Memo: Mediator- & Moderatoranalyse Was fällt euch noch ein? Wichtige Infos: Wozu brauche ich das Verfahren und wie rechne ich es.

Memo Spezielle Verwendungen der Methode Regressionsanalyse Funktion Mediatoranalyse: Vermittlung der gemeinsamen Varianz über Drittvariablen sichtbar machen Die vier Schritte der Mediatoranalyse Funktion Moderatoranalyse: Beinflussung der „Höhe“ des Zusammenhangs zwischen zwei Variablen durch (eine) dritte Variable prüfen Zentraler mathematischer Unterschied: Bei der Mediatoranalyse müssen alle Variablen korrelieren, bei der Moderatoranalyse soll die Drittvariable nicht mit Prädiktor/UV korrelieren

Thema: einfaktorielle Varianzanalyse

Gliederung Anwendung und Funktion der ANOVA Die Varianzanalyse wird mit ANOVA = Analysis of Variance abgekürzt Anwendung und Funktion der ANOVA Verknüpfung: Effekte, ALM & ANOVA Berechnung der ANOVA Hypothesen & Voraussetzungen Effektgrößen & Formalia

ANOVA: Anwendung & Funktion

ANOVA: Was und wozu? Ziel: Vergleich von Mittelwerten strukturell bildhaft 5 12 7 3 8 4 10 6 13 M=5 M=10 Ziel: Vergleich von Mittelwerten  Warum kein t-Test?!  Einfaktorielle ANOVA mit zwei Gruppen entspricht dem t-Test (F=t²)

Alpha-Fehler-Kumulierung strukturell bildhaft emotional 5 12 7 11 3 8 4 10 6 13 M=5 M=10 M=12 Wenn drei Gruppen verglichen werden sollen, sind verschie-dene Vergleiche möglich: (1) struk vs. bild: t(8) = -3.73; p = .006 (2) struk vs. emo: t(8) = -9.04; p = .000 (3) bild vs. emo: t(8) = -1.69; p = .129 Bei jedem der 3 Vergleiche besteht die Gefahr fälschlicher-weise einen signifikanten Effekt zu finden (α = 0.05)!

Alpha-Fehler-Kumulierung Gruppen Vergleiche Kumulierter α-Fehler 3 0.143 4 6 0.264 5 10 0.401 15 0.537 7 21 0.659 8 28 0.762 9 36 0.842 45 0.901 11 55 0.940 12 66 0.966 13 78 0.982 14 91 0.991 105 0.995 Der kumulierte α-Fehler gibt die Wahrscheinlichkeit an, mindestens einen statistisch bedeutsamen Gruppenunterschied zu finden, obwohl in der Population die H0 gilt (alle Gruppen sind gleich). Bereits bei 5 Gruppen nähern wir uns dem Zufallsniveau!

Bonferroni-Korrektur Mit der Bonferroni-Korrektur wird das α-Fehler-Niveau für jeden einzelnen Test soweit herabgesetzt, dass der kumulierte Fehler nur noch 0.05 beträgt. Beispiel: 5 Gruppen  10 Tests  αadj = 0.05 / 10 = 0.005 Nachteil: sehr niedriges Alpha-Niveau bei den einzelnen Tests geringe Power (großer β-Fehler) Bessere Alternative: Berechnung einer Varianzanalyse

ANOVA: Was und wozu? Die Varianzanalyse ist ein Verfahren zur Berechnung von Mittelwertsunterschieden zwischen Gruppen → t - Test Die Varianzanalyse wird verwendet, wenn man effizient und mit geringem Beta-Fehler (hoher Power) prüfen will, ob sich mehr als zwei Gruppenmittelwerte signifikant voneinander unterscheiden

Übersicht ANOVA Hier eine Übersicht über die verschiedenen varianzanalytischen Verfahren. Einige davon werden wir genauer kennenlernen. (Diese Tabelle finden Sie auch im Skript.)

Begriffsklärung 1 Einfaktoriell: Die ANOVA beinhaltet eine UV, die beliebig viele Stufen haben kann Beispiel: Ich untersuche ob sich die Extraversionswerte (AV) der Probanden in Abhängigkeit von der Haarfarbe unterscheiden (UV, hier mit 4 Stufen: braun, schwarz, blond, rot) Die UV kann eine diskrete oder eine kontinuierliche Variable sein

Begriffsklärung 2 Mehrfaktoriell: Die ANOVA beinhaltet mehr als zwei UVs oder Faktoren, deren Wirkung auf die AV untersucht wird Beispiel: Als zusätzliche UV in meiner Extraversionsstudie nehme ich den ebenfalls vierstufigen Faktor Haarlänge auf Damit werden auch Wechselwirkungen (Interaktionseffekte) zwischen den Faktoren analysierbar Welche Methode zur Analyse von Wechselwirkungen kennt ihr bereits?

Begriffsklärung 3 Feste Effekte: Die UV ist nominalskaliert Zufällige Effekte: Die UV ist intervallskaliert Die Implikationen für Berechnung und Interpretation der ANOVA werden später im Semester behandelt. Wissbegierigen sei vorab Leonhart S. 327-330 empfohlen. Wie ist es mit Ordinalskalenniveau? Wie ist es, wenn eine UV Nominal- und eine Intervallskalenniveau aufweist?

Begriffsklärung 4 Univariat: Wir untersuchen eine AV in Abhängigkeit der UV Multivariat: Wir untersuchen mehrere AV Beispiel: Der Einfluss des Geburtszeitpunkts (UV, dichotom: Sommer/Winter) auf IQ, Lebenszufriedenheit und Größe (AVs) Auch hier Interaktionseffekte?

Effekte, ALM & ANOVA

Effekte Effekt: Abweichung eines Gruppenmittelwerts vom Gesamtmittelwert → Gruppenzahl = Anzahl der Faktorstufen Mathematisch:

Beispiel: Effekte → ALM Mittelwert Gruppe 1 Mittelwert Gruppe 2 Gesamtmittelwert

Strukturgleichung des ALM

Effekte im ALM

ALM in Matrizenform

Dummy- und Effektkodierung Die Varianzanalyse verwendet k-1 (k=Gruppen) Variablen um die Zugehörigkeit zu einer Gruppe in einer Designmatrix darzustellen Die Dummykodierung „spart“, indem sie von einem Nulleffekt für eine Gruppe ausgeht Die Effektkodierung macht sich die Tatsache zur Nutze, dass sich alle Effekte zu Null addieren:

Dummykodierung Effektkodierung

Berechnung der ANOVA

Berechnung der ANOVA Quadratsummenzerlegung F-Test & Interpretation

Quadratsummenzerlegung

Basis der Methode: Varianz Quadratsumme MS: Mittlere Quadratsumme Freiheitsgrade

Quadratsummenzerlegung Gesamt-Quadratsumme (SStotal) Quadratsumme innerhalb der Gruppen (SSwithin , SSError) Quadratsumme zwischen den Gruppen (SSbetween, SSTreatment)

Gesamt-Quadratsumme strukturell bildhaft y11=5 y12=12 y21=7 y22=7

Freiheitsgrade der Gesamtvarianz strukturell bildhaft y11=5 y12=12 y21=7 y22=7 y31=3 y32=8 y41=4 y42=10 y51=6 y52=13 M1=5 M2=10 G=7.5

Gesamtvarianz strukturell bildhaft y11=5 y12=12 y21=7 y22=7 y31=3

Varianz innerhalb der Gruppen strukturell bildhaft y11=5 y12=12 y21=7 y22=7 y31=3 y32=8 y41=4 y42=10 y51=6 y52=13 M1=5 M2=10 G=7.5

Varianz zwischen den Gruppen strukturell bildhaft y11=5 y12=12 y21=7 y22=7 y31=3 y32=8 y41=4 y42=10 y51=6 y52=13 M1=5 M2=10 G=7.5

Zwischenergebnisse Gesamtvarianz Varianz innerhalb Varianz zwischen

Additivität Quadratsummen sind additiv Freiheitsgrade sind additiv Varianzen sind nicht additiv

F-Test & Interpretation

Der F-Test Vergleich zweier Varianzen (→ multiple Regression) H0: Varianzen gleich groß  F=1 H1: Zählervarianz (=erklärte Varianz) größer  F>1 Femp > Fkrit  Varianzen signifikant verschieden!

Abgleich: empirischer & kritischer Wert Analog zum t-Test wird der berechnete empirische Wert mit einem kritischen Wert aus einer Tabelle verglichen Die H1 gilt wenn Femp > Fkrit Die H0 gilt wenn Femp ≤ Fkrit Im Unterschied zum t-Test hängt der kritische F-Wert von Zähler- und Nennerfreiheitsgraden ab Die Tabelle unterscheidet sich daher auf den ersten Blick, das dahinter stehende Prinzip bleibt jedoch gleich

Am Beispiel Varianz innerhalb Varianz zwischen Femp (1, 8) = 62,5 : 4,5 = 13,89 Fkrit (1, 8) = 5,32; α = .05 Femp > Fkrit Es gilt die H1

→ Leonhart S. 658 ff.

Varianzanalyse: rechnerisches Vorgehen im Überblick Gruppen- und Gesamtmittelwerte bilden Quadratsummen berechnen = „Vorstufe“ der Varianz Freiheitsgrade berechnen Mittlere Quadratsummen berechnen = Varianz F-Bruch bilden, Vergleich mit krit. F-Wert Interpretation: Entscheidung für H0 oder H1

Hypothesen & Voraussetzungen

Nullhypothese der ANOVA H0: Alle Mittelwerte sind gleich: μ1 = μ2 = … = μp  μi = μj (für alle i,j) bzw. H0: Alle Effekte sind Null H0: α1 = α2 = … = αp = 0  αi = 0 (für alle i) H0: Die Varianz der Effekte ist Null H0: σ²α = 0 oder σ²Effekt=0

Alternativhypothese der ANOVA H1: Mindestens zwei Mittelwerte sind verschieden μi ≠ μj (für mind. ein Paar i, j) bzw. H1: Mindestens ein Effekt ist ungleich Null αi ≠ 0 (für mindestens ein i) H1: Varianz der Effekte ist größer als Null σ²α > 0 oder σ²Effekt>0 Mittels ANOVA sind nur ungerichtete Alternativhypothesen möglich Welche Gruppen sich unterscheiden analysiert man entweder mittels post-hoc Tests oder Kontrasten (bei Vorliegen von a priori Hypothesen)

Voraussetzungen der ANOVA Intervallskalierte, normalverteilte AV Mindestens 20 Elemente pro Gruppe Ähnlich Gruppengrößen in den Zellen  Varianzhomogenität Arbeitsblatt Aufgabe 2

Prüfung der Varianzhomogenität Zur Überprüfung der Varianzhomogenität stehen verschie-dene Tests zur Verfügung: Barlett-Test (sehr empfindlich gegenüber der Verletzungen der Normalverteilung) Levene-Test (relativ unempfindlich gegenüber Verletzungen der Normalverteilung) Fmax-Statistik (Hartley Test, nur bei gleichen Gruppen-Größen)

Levene-Test Der Levene-Test ist eine Varianzanalyse über die Ab-weichung der individuellen Messwerte vom Gruppenmittelwert: H0: Wird der Levene-Test signifikant (p < 0.05), dann ist die Annahme der Varianzgleichheit verletzt.

Varianzanalyse ist robust D.h. bei Verletzungen der Annahmen resultieren meistens trotzdem sinnvolle Ergebnisse (Insbesondere bei großen Stichproben).  Wenn nur einzelne Annahmen verletzt sind, können die Ergebnisse einer ANOVA dennoch verwendet werden.  Allerdings muss dann berichtet werden, dass die Annahmen verletzt sind, damit der Leser weiß, das die Ergebnisse mit Vorsicht zu interpretieren sind!

Effektgrößen & Formalia

Alternativ: Berechnung aus F-Wert Effektgrößen Was war noch gleich Cohens d? Auch bei der ANOVA lässt sich die praktische Relevanz von Effekten durch Berechnungen vergleichen. Eta² gibt an, wie viel % der Varianz der AV durch die UV erklärt wird. Alternativ: Berechnung aus F-Wert

Formalia: F-Tests in Forschungsdokumentationen Konventionen: Nötige Infos: F- und p-Wert bzw. p-Niveau, Zähler- und Nennerfreiheitsgrade F- und p-Wert : exakt zwei Nachkommastellen; Ausnahme: p-Wert bei n.s. Signifikante Ergebnisse: (F[2, 37] = 5.34; p < .01) Nicht-signifkante Ergebnisse: (F[2, 37] = 1.44; p=.25) oder (F[2, 37] = 1.44; n.s.)

Vielen Dank für eure Aufmerksamkeit!

Arbeitsblatt Aufgabe 1 Land A Land B Land C y11 = 80 y12 = 35 y13 = 70 Formulieren Sie die Null- und die Alternativhypothese für eine ANOVA Berechnen Sie die Quadrat-summen (total, within, between) Berechnen Sie die mittleren Quadratsummen (…) Berechnen Sie den empirischen F-Wert Geben Sie den kritischen F-Wert an (-> 4,26) Entscheiden Sie sich für eine der Hypothesen In einer Untersuchung zur Lesekompetenz in verschiedenen Ländern ergibt sich folgender Datensatz: Land A Land B Land C y11 = 80 y12 = 35 y13 = 70 y21 = 75 y22 = 50 y23 = 75 y31 = 60 y33 = 75 y41 = 65 y42 = 40 y43 = 45

Lösung (a) H0: µa = µb = µc oder… H0: Die Lesekompetenz unterscheidet sich nicht H1: µi ≠ µj für mindestens ein Paar i,j oder… H1: Die Lesekompetenz unterscheidet sich zwischen mindestens zwei Ländern

Lösung (b) MA = 70; MB = 46,25; MC = 66,25 Mges = 60,83 SStotal = 2541,67 SSwithin = 1237,5 SSbetween = 1304,17

Lösung (c) MStotal = 2541,67 : 11 = 231,06 MSwithin = 1237,5 : 9 = 137,5 MSbetween = 1304,17 : 2 = 625,08

Lösung (d,e,f) Femp (2, 9) = 625,8 : 137,5 = 4,74 Fkrit (2, 9) = 4,26; α = .05 Da Femp > Fkrit gilt die H1

Arbeitsblatt Aufgabe 3 Berechnen Sie den Levene-Test für die Daten aus Aufgabe 1 Land A Land B Land C y11 = 80 y12 = 35 y13 = 70 y21 = 75 y22 = 50 y23 = 75 y31 = 60 y33 = 75 y41 = 65 y42 = 40 y43 = 45

Lösung MA = 7,5; MB = 8,75; MC = 10,63 Mges = 8,96 Land A Land B Land C d11 = 10 d12 = 11,25 d13 = 3,75 d21 = 5 d22 = 3,75 d23 = 8,75 d31 = 10 d31 = 13,75 d33 = 8,75 d41 = 5 d42 = 6,25 d43 = 21,25

Lösung 2 SStotal = 274,88 SSwithin = 254,69 SSbetween = 19,79 MStotal = 24,95 MSwithin = 28,3 MSbetween = 9,9

Lösung 3 Femp (2, 9) = 0,35 Fkrit (2, 9) = 4,26; α = .05 Da Femp < Fkrit gilt die H0, die Annahme der Varianzhomogenität ist nicht verletzt