Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26
Thema der Stunde I. t- Test für abhängige Stichproben II. Wilcoxon - Test III. Chi-Quadrat Test für a) Unabhängigkeit von Merkmalen b) Die Güte der Anpassung einer empirischen Verteilung an eine theoretische Verteilung
Abhängige Stichproben Eine Gruppe von Schülern wird trainiert. Vorher und nachher wird ein Leistungstest gemacht. 1 89 2 93 94 3 98 100 4 102 -2 5 99 6 106 110 7 117 112 -5 8 104 9 92 10 103 Nr Test 1 Test 2 D (Messwertpaare) Testung der H0: Bei 1 vielleicht mal die Simulation de´s Centrak Limit, wenn Zeit Bei 2 Vorrechenen an der tafel! Sind die Schüler nach dem Training besser als vorher? Frage
Verteilung der Mittelwerte von Differenzen -15 -10 -5 5 10 15 0.00 0.05 0.10 Wahrscheinlichkeitsdichte f ( x ) 3 Festlegungen für die Verteilung: 2. Die sind normalverteilt (für N 30) 1. Sie hat den Mittelwert 0 3. Sie hat eine Standardabweichung („Standardfehler“) Standardfehler muss bestimmt werden
Schätzung des Standardfehlers Es gilt: Aus Stichprobendaten: Standardfehler aus Stichprobendaten: Wobei N die Anzahl der Messwertpaare ist.
Prüfgröße und Entscheidung Gilt die Nullhypothese 2 = m1 (bzw. mD = 0) so ist t - verteilt mit N - 1 Freiheitsgraden. Interpretation wie im Fall des t – Tests für unabhängige Stichproben
Die t- Verteilung t- Verteilung mit df = 9 Normalverteilung Testen zum sig level a heisst: Ist abs t grösser tcrit Kritische Werte sind bei der t- Verteilung im Vergleich zur N- Verteilung größer Ablehnung der H0 erst bei größeren Werten der Prüfgröße
Voraussetzungen des t- Tests für abhängige Stichproben Für N < 30 müssen die Werte aus normalverteilten Populationen stammen (Prüfung der Stichprobenwerte auf Normalverteilung) Die Populationsvarianzen, die beiden Stichproben zugrundeliegen müssen nicht gleich (homogen) sein. (Allerdings verliert der Test an Teststärke für stark verschiedene Varianzen) Bei 1 vielleicht mal die Simulation de´s Centrak Limit, wenn Zeit Bei 2 Vorrechenen an der tafel! Bei hohen Korrelationen der beiden Stichproben und gleichen Varianzen ist der t- Test für abhängige Stichproben weit mehr teststark als der t- Test für unabhängige Stichproben. [Tafelbeispiel für 2 und 3]
Der Wilcoxon - Test Man hat ordinalskalierte Daten (Rangdaten) und testet, ob sich die Meßobjekte in 2 abhängigen Gruppen in ihren Rängen unterscheiden. Beispiel: wie t- Test abhängig 1 89 2 93 94 3 98 100 4 102 -2 5 99 6 106 110 7 117 112 -5 8 104 9 92 10 103 Nr Test 1 Test 2 D Ranking von |D| Unterscheiden sich die Rangsummen der Differenzen mit positivem und negativem Vorzeichen? Bei 1 vielleicht mal die Simulation de´s Centrak Limit, wenn Zeit Bei 2 Vorrechenen an der tafel!
Der Wilcoxon - Test Man hat ordinalskalierte Daten (Rangdaten) und testet, ob sich die Meßobjekte in 2 abhängigen Gruppen in ihren Rängen unterscheiden. Fall Nr Test1 Test2 D |D| Rang + - 1 89 89 2 93 94 1 1 1 1 3 98 100 2 2 2.5 2.5 Prüfe Rangsummen T und T‘ 4 102 100 -2 2 2.5 (-) 2.5 5 99 102 3 3 4 4 Bei 1 vielleicht mal die Simulation de´s Centrak Limit, wenn Zeit Bei 2 Vorrechenen an der tafel! 6 106 110 4 4 5 5 7 117 112 -5 5 6.5 (-) 6.5 8 99 104 5 5 6.5 6.5 9 92 100 8 8 8 8 10 94 103 9 9 9 9 T T' 36 9
Der Wilcoxon - Test Es gilt: Rang + - 1 2.5 4 5 6.5 8 9 T T' 36 (Wird um Anzahl der Null- Differenzen reduziert) Es gilt: Bei 1 vielleicht mal die Simulation de´s Centrak Limit, wenn Zeit Bei 2 Vorrechenen an der tafel! Rangsummen Man kann die Teststatistik alternativ über T oder T‘ berechnen. T T‘
Der Wilcoxon - Test Berechnung der Prüfgrüße: Unter H0 gilt: mit Rang + - 1 2.5 4 5 6.5 8 9 T T' 36 Rangsummen T‘ mit T bzw. T‘ sind normalverteilt für N > 25: Bei 1 vielleicht mal die Simulation de´s Centrak Limit, wenn Zeit Bei 2 Vorrechenen an der tafel! Prüfung in Standardnormalverteilung [für N 25 gesonderte Tabelle (Bortz, Tab. G)] [Rechenbeispiel]
Chi-Quadrat Tests für Häufigkeiten Zur Prüfung von Häufigkeitsunterschieden Zur Prüfung der Unabhängigkeit zweier nominalskalierter Variablen Zur Prüfung der Übereinstimmung einer empirischen mit einer theoretischen Verteilung
Chi - Quadrat Die generelle Form des Chi – Quadrat für Häufigkeiten ist: mit: Dieses Schema wird flexibel auf die jeweilige Fragestellung angewandt. Die Frage ist, nach welchem Kriterium sich die erwarteten Häufigkeiten ergeben ! Das einache c2 hat k-1 Freiheitsgrade, die zugehörige Wahrscheinlichkeitsverteilung ist die c2 Verteilung.
Chi – Quadrat Test auf Unabhängigkeit Man hat eine l k Kreuztabelle: Merkmal A + - o11 o12 SB+ o21 o22 SB- SA+ SA- N Merkmal B Ferner gilt: Erwartete Häufigkeit eij:
Chi – Quadrat Test: Verteilungsanpassung Sind die Abweichungen von empirischer und theoretischer Verteilung nur zufällig oder systematisch?
Chi – Quadrat Test: Verteilungsanpassung Die erwarteten relativen Häufigkeiten berechnet man aus der Differenz der Werte der Verteilungsfunktion für die exakten Intervallgrenzen Die erwarteten Häufigkeiten ergeben sich durch Multiplikation mit der Anzahl der Beobachtungen N. [Tafelbeispiel]
Häufigkeitsverteilungen zu Aufgabe 3 h(x) beobachtet h(x) erwartet als Normalverteilung 4000 4000 3000 3000 2000 2000 1000 1000 x x 100 300 500 700 900 1100 1300 1500 1700 1900 100 300 500 700 900 1100 1300 1500 1700 1900 h(x) 4000 3000 Vergleich: 2000 1000 x 100 300 500 700 900 1100 1300 1500 1700 1900