Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Forschungsstatistik II

Kopien: 1
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.

Ähnliche Präsentationen


Präsentation zum Thema: "Forschungsstatistik II"—  Präsentation transkript:

1 Forschungsstatistik II
Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24

2 Thema der Stunde I. Die Form der Stichprobenkennwerteverteilung
II. Schlüsse von der Stichprobe auf die Population III. t-Test für unabhängige und abhängige Stichproben

3 Stichprobenkennwerte
Population Verteilung von Stichprobenmittelwerten Stichprobe des Umfangs N Tue dies k - mal: „Kennwerteverteilung“ Kennwert (Erwartungswert) Erwartungswert Die Kennwerteverteilung hat denselben Erwartungswert wie die Population, aus der die Stichproben gezogen wurden. Schätzstatistiken, die denselben Erwartungswert haben wie die Population, heissen erwartungstreu. Stichprobenmittelwerte sind erwartungstreue Schätzungen des Populationsparameters m

4 Stichprobenkennwerte
Population Verteilung von Stichprobenvarianzen Tue dies k - mal: Stichprobe des Umfangs N Erwartungswert der Stichprobenvarianzen Varianz Die Stichprobenvarianz unterschätzt die Populationsvarianz tendenziell Stichprobenvarianzen sind keine erwartungstreuen Schätzungen des Populationsvarianz s2

5 Varianz der Stichprobenmittelwerte
Population Verteilung von Stichprobenmittelwerten Stichprobe des Umfangs N Tue dies k - mal: „Kennwerteverteilung“ Varianz Varianz Der Faktor 1/N bezieht die Populationsvarianz auf die Varianz der Stichprobenmittel Für N = 1 sind beide Varianzen gleich Für N ® ¥ geht die Varianz der Mittelwerte gegen Null.

6 Korrektur Der Bias bei der Schätzung der Pop.Varianz aus der Stichprobenvarianz ist die Varianz der Stichprobenmittelwerte. Korrektur: Die Stichprobenvarianz berechnet aus korrigiertem Umfang N-1 ist eine erwartungstreue Schätzung der Populationsvarianz Stichprobenvarianzen sind keine erwartungstreuen Schätzungen des Populationsvarianz s2

7 Form der Verteilung von Mittelwerten
( x ) Zentraler Grenzwertsatz: Die Verteilung von Mittelwerten aus Stichproben der Größe N ³ 30 geht mit wachsendem Stichprobenumfang in eine Normalverteilung über, unabhängig von der Verteilungsform der Werte in der Population. 0.10 Wahrscheinlichkeitsdichte 0.05 0.00 -15 -10 -5 5 10 15 Der zentrale Grenzwertsatz ermöglicht die Schätzung von Parametern unter Angabe statistischer Sicherheiten [Math-Beispiel]

8 Konfidenzintervalle in der Verteilung der Mittelwerte
Fragestellungen: Man habe einen Mittelwert aus einer Stichprobe der Größe N vorliegen. In welchem Bereich um den Mittelwert kann man den Populationsparameter m mit einer bestimmten Wahrscheinlichkeit erwarten ? Der Populationsparameter m sei bekannt. Mit welcher Wahrscheinlichkeit kann ein Mittelwert wie der beobachtete oder ein extremerer auftreten? 1. 2. Konfidenzintervalle geben Intervalle um einen Kennwert an, in denen ein gesuchter Wert mit einer bestimmten WK liegt.

9 Hypothesen Hypothesen als Aussagen über Populationsparameter
Wissenschaftliche Vermutung über einen Sachverhalt Aussage Gegenaussage (komplementär) A: Neue Unterrichtsmethode ist besser als die alte ØA: Neue Unterrichtsmethode ist schlechter oder gleich gut Statistisch: (gerichtet) (ungerichtet) Hypothesen als Aussagen über Populationsparameter

10 Entscheidungsregeln (ungerichtet)
Sei a ein vorgegebenes Signifikanzniveau (Konvention: a = 0.05) und z0 der beobachtete z- Wert. Regel 1 (Überschreitungswahrscheinlichkeit): Wenn verwerfe H0 Regel 2 (Kritischer Wert z1-a/2): Wenn verwerfe H0 Grundlage: Vergleich mit kritischem Wert oder Signifikanzniveau

11 Entscheidungsregeln (gerichtet)
Sei a ein vorgegebenes Signifikanzniveau (Konvention: a = 0.05) und z0 der beobachtete z- Wert. Regel 1 (Überschreitungswahrscheinlichkeit): Wenn verwerfe H0 Regel 2 (Kritischer Wert z1-a): Wenn verwerfe H0 Grundlage: Vergleich mit kritischem Wert oder Signifikanzniveau

12 Fehler 1. und 2. Art Hypothesenwahrscheinlichkeiten : bedingte WKn H0
In der Population gilt H0 H1 Correct Rejection Miss (Fehler 2. Art) False Alarm (Fehler 1. Art) Hit H0 Entscheidung für H1 [Entscheidungsaufgabe] Hypothesenwahrscheinlichkeiten : bedingte WKn

13 t - Test Prüfung des Mittelwerteunterschieds bei unabhängigen & abhängigen Stichproben

14 Aufbau Praktische Problemstellung
Logik der Schlussweise bei der Prüfung eines Mittelwertsunterschieds Praktische Durchführung am Beispiel

15 Problemstellung Gruppierungsvariable Messgröße Anzahl der gefundenen
Zielelemente in einem Konzentrationsleistungstest Geschlecht M J (verhältnisskaliert) Gibt es Unterschiede in der Leistung von Mädchen und Jungen? Frage

16 Problemstellung Wir untersuchen 20 Jungen und 20 Mädchen und berechnen Mittelwerte Geschlecht M J 26.7 17.2 26.7 – 17.2 = 9.5 Gibt es „wirkliche“ Unterschiede in der Leistung von Mädchen und Jungen oder ist der gefundene Unterschied rein zufällig? Frage

17 Modellvorstellung Verteilung der Differenzen von Mittelwerten
Population der Jungen Bilde Mittelwertsdifferenz Stichprobe des Umfangs N Tue dies k - mal: Population der Mädchen Stichprobe des Umfangs N Verteilung der Differenzen von Mittelwerten

18 Modellvorstellung Verteilung der Differenzen von Mittelwerten Annahme:
Die Populationsmittelwerte von Jungen und Mädchen sind gleich Der Erwartungswert der Differenzen von Mittelwerten ist Null (ungerichtet) Verteilung der Differenzen von Mittelwerten

19 Verteilung der Differenzen von Mittelwerten
3 Festlegungen für die Verteilung: -15 -10 -5 5 10 15 0.00 0.05 0.10 Wahrscheinlichkeitsdichte f ( x ) 1. Sie hat den Mittelwert 0 2. Die sind normalverteilt (für NM+ NJ  50) 3. Sie hat eine Standardabweichung („Standardfehler“) Wir können die Wahrscheinlichkeitsbestimmung vornehmen, wenn der Standardfehler bekannt ist

20 Bestimmung des Standardfehlers
Ist die Messvariable eine in beiden Populationen unabhängige ZV: Annahme: Jungen und Mädchen kommen aus derselben Population

21 Schätzung des Standardfehlers
Für die Populationsvarianz verwendet man eine Schätzung aus den Daten beider Stichproben: wobei und die Stichprobenvarianzen sind Für gleiche Stichprobenumfänge gilt: als beste Schätzung des Standardfehlers der Mittelwertsdifferenz

22 Prinzip der Testung Testung der Gültigkeit der „Nullhypothese“ über die Bestimmung der Auftretenswahrscheinlichkeit von in der theoretischen Verteilung der Differenzen von Mittelwerten mit dem Erwartungswert Fall 1: NM + NJ  50 (standardnormalverteilt) Fall 2: NM + NJ < 50 (t – verteilt mit NM + NJ - 2 Freiheitsgraden) Fall 2: NM + NJ < 50

23 Prinzip der Testung (zweiseitig)
-4 -2 2 4 0.1 0.2 t Prüfgrösse Signifikanzniveau Annahmebereich Ablehnungsbereich Testen zum sig level a heisst: Ist abs t grösser tcrit Testen zum Signifikanzniveau : Ist |t| > t1-a/2?

24 Die t- Verteilung t- Verteilung mit df = 10 Normalverteilung Testen zum sig level a heisst: Ist abs t grösser tcrit Kritische Werte sind bei der t- Verteilung im Vergleich zur N- Verteilung größer Ablehnung der H0 erst bei größeren Werten der Prüfgröße

25 Prüfgröße und Entscheidung
Gilt die Nullhypothese M = mJ (bzw. Dm = 0) so ist t - verteilt mit NM + NJ -2 Freiheitsgraden. Ist die Wahrscheinlichkeit einen extremeren Wert als den empirischen t - Wert zu erhalten, kleiner oder gleich 5%, so sehen wir die Nullhypothese als zu unwahrscheinlich an und vermuten, dass ein wirklicher Mittelwertsunterschied in den Populationen besteht.

26 Entscheidung 1. Berechne
2. Ermittle kritischen t - Wert nach der t - Verteilung 3. Entscheide A. Gilt Ablehnung von H0 (die Mittelwerte der J. und M. sind signifikant verschieden) B. Gilt Beibehalten von H0 (die Mittelwerte der J. und M. unterscheiden sich nur zufällig)

27 Praktische Berechnung
Geschlecht M J 26.7 17.2 173 106 26.7 – 17.2 = 9.5

28 Praktische Entscheidung
1. Berechne 2. Ermittle kritischen t - Wert nach der t- Verteilung: (a = 0.05, df =38) 3. Entscheide Es gilt Ablehnung von H0: Die Wahrscheinlichkeit der gefundenen Mittelwertsdifferenz ist kleiner als 5%. Der Mittelwertsunterschied der Jungen und Mädchen ist signifikant

29 Voraussetzungen des t- Tests für unabhängige Stichproben
Für N1 + N2 < 50 müssen die Werte aus normalverteilten Populationen stammen (Prüfung der Stichprobenwerte auf Normalverteilung) Die Populationsvarianzen, die beiden Stichproben zugrundeliegen müssen gleich (homogen) sein (Prüfung der geschätzen Populationsvarianzen auf Gleichheit mit F- Test. Bei 1 vielleicht mal die Simulation de´s Centrak Limit, wenn Zeit Bei 2 Vorrechenen an der tafel! Die Stichproben müssen unabhängig sein. (Messeinheiten untereinander und zwischen den Stichproben) t- Test ist relativ robust, selten progressive Entscheidungen

30 Abhängige Stichproben
Eine Gruppe von Schülern wird trainiert. Vorher und nachher wird ein Leistungstest gemacht. 1 89 2 93 94 3 98 100 4 102 -2 5 99 6 106 110 7 117 112 -5 8 104 9 92 10 103 Nr Test 1 Test 2 D Testung der H0: Bei 1 vielleicht mal die Simulation de´s Centrak Limit, wenn Zeit Bei 2 Vorrechenen an der tafel! Sind die Schüler nach dem Training besser als vorher? Frage

31 Verteilung der Mittelwerte von Differenzen
-15 -10 -5 5 10 15 0.00 0.05 0.10 Wahrscheinlichkeitsdichte f ( x ) 3 Festlegungen für die Verteilung: 2. Die sind normalverteilt (für N  30) 1. Sie hat den Mittelwert 0 3. Sie hat eine Standardabweichung („Standardfehler“) Standardfehler muss bestimmt werden

32 Schätzung des Standardfehlers
Es gilt: Aus Stichprobendaten: Standardfehler aus Stichprobendaten: Wobei N die Anzahl der Messwertpaare ist.

33 Prüfgröße und Entscheidung
Gilt die Nullhypothese 2 = m1 (bzw. mD = 0) so ist t - verteilt mit N - 1 Freiheitsgraden. Interpretation wie im Fall des t – Tests für unabhängige Stichproben

34 Voraussetzungen des t- Tests für abhängige Stichproben
Für N < 30 müssen die Werte aus normalverteilten Populationen stammen (Prüfung der Stichprobenwerte auf Normalverteilung) Die Populationsvarianzen, die beiden Stichproben zugrundeliegen müssen nicht gleich (homogen) sein. (Allerdings verliert der Test an Teststärke für stark verschiedene Varianzen) Bei 1 vielleicht mal die Simulation de´s Centrak Limit, wenn Zeit Bei 2 Vorrechenen an der tafel! Bei hohen Korrelationen der beiden Stichproben und gleichen Varianzen ist der t- Test für abhängige Stichproben weit mehr teststark als der t- Test für unabhängige Stichproben. [Tafelbeispiel für 2 und 3]


Herunterladen ppt "Forschungsstatistik II"

Ähnliche Präsentationen


Google-Anzeigen