Einfaktorielle Varianzanalyse
Einführendes Beispiel Es soll in einer empirischen Untersuchung überprüft werden, ob das Alter von Vpn einen Einfluss auf ihre Einstellung zu Gewalt in der Erziehung hat. Dazu werden die Probanden in zwei Gruppen eingeteilt: Gruppe 1: Vpn < 20 Jahre Gruppe 2: Vpn > 20 Jahre Stichprobentyp: unabhängig UV (Faktor): Alter Ausprägung der UV: 2 (Vpn < 20 Jahre & Vpn > 20 Jahre) AV: Einstellung zu Gewalt in der Erziehung Testverfahren: t-Test für unabhängige Stichproben
t-Test Prüft, ob die Mittelwerte einzelner Gruppen (maximal 2) einer Variablen in der Grundgesamtheit gleich groß sind. Problem: Wie verhält es sich, wenn die UV mehr als 2 Ausprägungen hat?
Beispiel Es soll in einer empirischen Untersuchung überprüft werden, ob das Alter von Vpn einen Einfluss auf ihre Einstellung zu Gewalt in der Erziehung hat. Dazu werden die Probanden in vier Gruppen eingeteilt: Gruppe 1: Vpn < 20 Jahre Gruppe 2: Vpn 20-40 Jahre Gruppe 3: Vpn 40-60 Jahre Gruppe 4: Vpn > 60 Jahre Vorgehensweise bei Berechnung eines t-Testes Vergleich zwischen: Gruppe 1 & Gruppe 2 Gruppe 2 & Gruppe 3 Gruppe 1 & Gruppe 3 Gruppe 2 & Gruppe 4 Gruppe 1 & Gruppe 4 Gruppe 3 & Gruppe 4
Vergleich zwischen 3 Gruppen 1. Hypothese µ1 = µ 2 2. Hypothese µ2 = µ 3 Falls die Hypothesen 1 und 2 zutreffen, bedingt sich die letzte Nullhypothese von selbst! 3. Hypothese µ1 = µ3
Schlussfolgerung Wenn die UV mehr als zwei Ausprägungen hat: Können nur p-1 verschiedenen unabhängige Nullhypothesen getestet werden (p = Zahl der Faktorstufen) Mit jedem t-Test erhöht sich die Irrtumswahrscheinlichkeit α α-Fehler-Adjustierung (Irrtumswahrscheinlichkeiten der Einzeltests muss in ihrer Summe ein Gesamt-α von 5% haben) Jeder Test wird mit einer Irrtumswahrscheinlichkeit von 5/m% geprüft (m = Anzahl der durchgeführten Tests)
Argumente gegen einen t-Test bei mehr als 2 Ausprägungen der UV Die Anzahl der Paare, die man mit einem t-Test vergleichen möchte, ist zu groß! Bei vielen t-Test werden schon einige zufällig signifikant: große Schwierigkeiten, die signifikanten Ergebnisse zu interpretieren!
Varianzanalyse Erlaubt einen gleichzeitigen Vergleich zwischen mehreren Stichproben, oder: Überprüft den Einfluss 1 UV mit mehr als zwei Ausprägungen auf 1 AV. Voraussetzung für die Varianzanalyse: AV muss intervallskaliert sein!
Formen der Varianzanalyse Stufen der AV 1 2 Stufen der UV einfaktorielle univariate VA einfaktorielle multivariate VA Mehrfaktorielle univariate VA mehrfaktorielle multivariate VA
Hypothesen der Varianzanalyse Ho = Alle verglichenen Gruppenmittelwerte der AV sind in der Grundgesamtheit identisch. Ho = µ1 = µ2 = ... µ m H1 = Mindestens 2 Gruppenmittelwerte der AV unterscheiden sich in der Grundgesamtheit. H1 = µ1 ≠ µ2 = ... µ m
Beispieldatensatz Vpn < 20 Jahre 20-40 Jahre 40-60 Jahre 1 2 3 6 5 4 8 7 10 Summe 15 35 20 Mittelwerte
Ziel und Grundgedanke der Varianzanalyse Zerlegung der Varianzen bzw. Streuung in ihre verschiedenen Bestandteile Lassen sich vorhandene Unterschiede auf Unterschiede zwischen den Gruppen zurückführen? (im Beispiel: Altersunterschiede) Oder: Lassen sich vorhandene Unterschiede auf Unterschiede innerhalb der Gruppe zurückführen? (im Beispiel: Zusammensetzung der jeweiligen Stichprobe so genannte „Störvariablen“ oder „Fehlervariablen“)
1. Schritt: Bestimmung von QStot und σ2tot Bestimmung der Gesamtvarianz aller Messwerte df tot = (n x p - 1)
2. Schritt: Bestimmung von QStreat und σ2treat Vpn < 20 Jahre 20-40 Jahre 40-60 Jahre > 60 Jahre 1 2 3 6 5 4 8 7 10 Summe 15 35 20 Mittelwerte
2. Schritt: Bestimmung von QStreat und σ2treat Frage: Wie verhalten sich die Varianzen zwischen den Stichproben? Vpn < 20 Jahre 20-40 Jahre 40-60 Jahre > 60 Jahre 1 2 3 7 4 5
3. Schritt: Bestimmung von QSFehler und σ2Fehler Frage: Wie verhalten sich die Varianzen innerhalb der Gruppe? Unterscheiden sich die Messwerte innerhalb einer Gruppe, so kann dieses nur auf Störgrößen zurückgeführt werden. Quantifizierung der Störgröße: Berechnung der Abweichung jeder Vpn vom Gruppenmittelwert df= p x (n - 1)
3. Schritt: Signifikanzberechnung dfzähler = p - 1 dfnenner = p x (n – 1)
Darstellungsweise der Ergebnisse QS df 2 F p Treatment 70 3 23,33 8,10 .049 Fehler 46 16 2,88 Total 116 19 6,11
Einzelvergleiche falls ein signifikanter F-Wertes existiert: Durchführung von Einzelvergleichen oder Kontrasten (Scheffé) Test Bestimmung der kritischen Differenzschwelle, ab der Mittelwerte signifikant werden.
Einzelvergleiche Vpn < 20 Jahre 20-40 Jahre 40-60 Jahre 1 2 3 6 5 4 8 7 10 Summe 15 35 20 Mittelwerte
…Ende