Forschungsstatistik II

Slides:



Advertisements
Ähnliche Präsentationen
T - Test Prüfung des Mittelwerteunterschieds bei abhängigen und unabhängigen Stichproben.
Advertisements

Der U - Test Man hat ordinalskalierte Daten (Rangdaten) und testet, ob sich die Meßobjekte in 2 unabhängigen Gruppen in ihren Rängen unterscheiden. Beispiel:
Der F - Test Man prüft, ob sich 2 Varianzen unterscheiden, mit dem F-Quotienten: Geprüft werden stets die Schätzungen der Populationsvarianzen aufgrund.
Der F - Test Man prüft, ob sich 2 Varianzen unterscheiden, mit dem F-Quotienten: Geprüft werden stets die Schätzungen der Populationsvarianzen aufgrund.
Heute 1.F – Test zur Varianzhomogenität 2.Bartlett-Test zur Varianzhomogenität 3.Chi – Quadrat Tests für Häufigkeiten 4.Chi – Quadrat Tests zur Verteilungsanpassung.
Forschungsstrategien Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Methoden der Psychologie Multivariate Analysemethoden und Multivariates Testen Günter Meinhardt Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Thema der Stunde I. Einführung in die Varianzanalyse:
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Gliederung Vertrauensintervalle Arten von Hypothesen
Gliederung Der Begriff der Stichprobe, Stichprobenfehler
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-23.
Forschungsstatistik II
Heute Prüfung der Produkt-Moment Korrelation
Forschungsstatistik I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2005/2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2005/2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-28.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
A-Priori Kontraste Prüfung des Mittelwerteunterschieds von Faktorstufen bzw. Kombinationen von Faktorstufen: z.B.: oder.
Der Binomialtest Man habe einen wahren Anteil P.
Hypothesen testen: Grundidee
Prüfung statistischer Hypothesen
Deskriptive Statistik und Wahrscheinlichkeitstheorie
Statistische Methoden I
Nachholung der Vorlesung vom Freitag
Konfidenzintervalle Intervallschätzung
Ab nächster Woche wird die Übungsgruppe Gruppe 2: Henrike Berg Di SR 222 wegen Personalmangel eingestellt.
Statistische Methoden II SS 2008 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Makarenkostraße (Kiste)
TESTS. Worum es geht Man möchte testen, ob eine bestimmte Annahme (Hypothese) über Parameter der Realität entspricht oder nicht. Beobachtung (Stichprobe)
Die Student- oder t-Verteilung
Konfidenzintervalle Intervallschätzung Jeder Beobachtung wird ein Intervall C( ) der reellen Zahlen zugeordnet Niveau Dabei ist die Wahrscheinlichkeit,
Statistische Methoden I SS 2005
Klausurtermin (laut Prüfungsamt) Probeklausur Freitag, 13. Juni 2003 statt Vorlesung.
Achtung Vorlesung am Montag, den 21. Juni Zeit: Uhr Ort: Kiste.
Die Vorlesung am 14. Mai (Tag nach Himmelfahrt) wird auf Montag, den 17. Mai verlegt! Zeit: 16 Uhr Ort: Kiste Nächste Woche!!!!
Statistische Methoden II SS 2003 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.
Statistische Methoden II SS 2003
Test auf Normalverteilung
Sportwissenschaftliche Forschungsmethoden SS Statistischer Test.
Einführung in die Metaanalyse
Eigenschaften der OLS-Schätzer
Deutsch als Zweitsprache: Experimentelle Methoden WS 2013/2014
Formulierung und Überprüfung von Hypothesen
Vergleich der 3 Arten des t-Tests Testergebnisse berichten
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
STATISIK LV Nr.: 1375 SS März 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 0021 WS 2005/ Oktober 2005.
STATISIK LV Nr.: 0021 WS 2005/ Oktober 2005.
STATISIK LV Nr.: 1852 WS 2005/ Dezember 2005.
STATISIK LV Nr.: 1375 SS März 2005.
Konfidenzintervall und Testen für den Mittelwert und Anteile
Tutorium Statistik II Übung IV Philipp Schäpers Mi – 11.45
Stochastik ganz kurz Beispiel diskret Würfelwurf Beispiel stetig
Der Binomialtest Man habe einen wahren Anteil P. Kann man aufgrund von p sagen, daß in der Population tatsächlich der Anteil P zugrunde liegt? [Beispiele]
Thema der Stunde I. Die Form der Stichprobenkennwerteverteilung
Die Binomialverteilung
STATISIK LV Nr.: 1375 SS März 2005.
Prüft ebenfalls die Annahme der Varianzhomogenität (exakter)
Forschungsstrategien Johannes Gutenberg Universität Mainz
Forschungsstrategien Johannes Gutenberg Universität Mainz
 Präsentation transkript:

Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24

Thema der Stunde I. Die Form der Stichprobenkennwerteverteilung II. Schlüsse von der Stichprobe auf die Population III. t-Test für unabhängige und abhängige Stichproben

Stichprobenkennwerte Population Verteilung von Stichprobenmittelwerten Stichprobe des Umfangs N Tue dies k - mal: „Kennwerteverteilung“ Kennwert (Erwartungswert) Erwartungswert Die Kennwerteverteilung hat denselben Erwartungswert wie die Population, aus der die Stichproben gezogen wurden. Schätzstatistiken, die denselben Erwartungswert haben wie die Population, heissen erwartungstreu. Stichprobenmittelwerte sind erwartungstreue Schätzungen des Populationsparameters m

Stichprobenkennwerte Population Verteilung von Stichprobenvarianzen Tue dies k - mal: Stichprobe des Umfangs N Erwartungswert der Stichprobenvarianzen Varianz Die Stichprobenvarianz unterschätzt die Populationsvarianz tendenziell Stichprobenvarianzen sind keine erwartungstreuen Schätzungen des Populationsvarianz s2

Varianz der Stichprobenmittelwerte Population Verteilung von Stichprobenmittelwerten Stichprobe des Umfangs N Tue dies k - mal: „Kennwerteverteilung“ Varianz Varianz Der Faktor 1/N bezieht die Populationsvarianz auf die Varianz der Stichprobenmittel Für N = 1 sind beide Varianzen gleich Für N ® ¥ geht die Varianz der Mittelwerte gegen Null.

Korrektur Der Bias bei der Schätzung der Pop.Varianz aus der Stichprobenvarianz ist die Varianz der Stichprobenmittelwerte. Korrektur: Die Stichprobenvarianz berechnet aus korrigiertem Umfang N-1 ist eine erwartungstreue Schätzung der Populationsvarianz Stichprobenvarianzen sind keine erwartungstreuen Schätzungen des Populationsvarianz s2

Form der Verteilung von Mittelwerten ( x ) Zentraler Grenzwertsatz: Die Verteilung von Mittelwerten aus Stichproben der Größe N ³ 30 geht mit wachsendem Stichprobenumfang in eine Normalverteilung über, unabhängig von der Verteilungsform der Werte in der Population. 0.10 Wahrscheinlichkeitsdichte 0.05 0.00 -15 -10 -5 5 10 15 Der zentrale Grenzwertsatz ermöglicht die Schätzung von Parametern unter Angabe statistischer Sicherheiten [Math-Beispiel]

Konfidenzintervalle in der Verteilung der Mittelwerte Fragestellungen: Man habe einen Mittelwert aus einer Stichprobe der Größe N vorliegen. In welchem Bereich um den Mittelwert kann man den Populationsparameter m mit einer bestimmten Wahrscheinlichkeit erwarten ? Der Populationsparameter m sei bekannt. Mit welcher Wahrscheinlichkeit kann ein Mittelwert wie der beobachtete oder ein extremerer auftreten? 1. 2. Konfidenzintervalle geben Intervalle um einen Kennwert an, in denen ein gesuchter Wert mit einer bestimmten WK liegt.

Hypothesen Hypothesen als Aussagen über Populationsparameter Wissenschaftliche Vermutung über einen Sachverhalt Aussage Gegenaussage (komplementär) A: Neue Unterrichtsmethode ist besser als die alte ØA: Neue Unterrichtsmethode ist schlechter oder gleich gut Statistisch: (gerichtet) (ungerichtet) Hypothesen als Aussagen über Populationsparameter

Entscheidungsregeln (ungerichtet) Sei a ein vorgegebenes Signifikanzniveau (Konvention: a = 0.05) und z0 der beobachtete z- Wert. Regel 1 (Überschreitungswahrscheinlichkeit): Wenn verwerfe H0 Regel 2 (Kritischer Wert z1-a/2): Wenn verwerfe H0 Grundlage: Vergleich mit kritischem Wert oder Signifikanzniveau

Entscheidungsregeln (gerichtet) Sei a ein vorgegebenes Signifikanzniveau (Konvention: a = 0.05) und z0 der beobachtete z- Wert. Regel 1 (Überschreitungswahrscheinlichkeit): Wenn verwerfe H0 Regel 2 (Kritischer Wert z1-a): Wenn verwerfe H0 Grundlage: Vergleich mit kritischem Wert oder Signifikanzniveau

Fehler 1. und 2. Art Hypothesenwahrscheinlichkeiten : bedingte WKn H0 In der Population gilt H0 H1 Correct Rejection Miss (Fehler 2. Art) False Alarm (Fehler 1. Art) Hit H0 Entscheidung für H1 [Entscheidungsaufgabe] Hypothesenwahrscheinlichkeiten : bedingte WKn

t - Test Prüfung des Mittelwerteunterschieds bei unabhängigen & abhängigen Stichproben

Aufbau Praktische Problemstellung Logik der Schlussweise bei der Prüfung eines Mittelwertsunterschieds Praktische Durchführung am Beispiel

Problemstellung Gruppierungsvariable Messgröße Anzahl der gefundenen Zielelemente in einem Konzentrationsleistungstest Geschlecht M J (verhältnisskaliert) Gibt es Unterschiede in der Leistung von Mädchen und Jungen? Frage

Problemstellung Wir untersuchen 20 Jungen und 20 Mädchen und berechnen Mittelwerte Geschlecht M J 26.7 17.2 26.7 – 17.2 = 9.5 Gibt es „wirkliche“ Unterschiede in der Leistung von Mädchen und Jungen oder ist der gefundene Unterschied rein zufällig? Frage

Modellvorstellung Verteilung der Differenzen von Mittelwerten Population der Jungen Bilde Mittelwertsdifferenz Stichprobe des Umfangs N Tue dies k - mal: Population der Mädchen Stichprobe des Umfangs N Verteilung der Differenzen von Mittelwerten

Modellvorstellung Verteilung der Differenzen von Mittelwerten Annahme: Die Populationsmittelwerte von Jungen und Mädchen sind gleich Der Erwartungswert der Differenzen von Mittelwerten ist Null (ungerichtet) Verteilung der Differenzen von Mittelwerten

Verteilung der Differenzen von Mittelwerten 3 Festlegungen für die Verteilung: -15 -10 -5 5 10 15 0.00 0.05 0.10 Wahrscheinlichkeitsdichte f ( x ) 1. Sie hat den Mittelwert 0 2. Die sind normalverteilt (für NM+ NJ  50) 3. Sie hat eine Standardabweichung („Standardfehler“) Wir können die Wahrscheinlichkeitsbestimmung vornehmen, wenn der Standardfehler bekannt ist

Bestimmung des Standardfehlers Ist die Messvariable eine in beiden Populationen unabhängige ZV: Annahme: Jungen und Mädchen kommen aus derselben Population

Schätzung des Standardfehlers Für die Populationsvarianz verwendet man eine Schätzung aus den Daten beider Stichproben: wobei und die Stichprobenvarianzen sind Für gleiche Stichprobenumfänge gilt: als beste Schätzung des Standardfehlers der Mittelwertsdifferenz

Prinzip der Testung Testung der Gültigkeit der „Nullhypothese“ über die Bestimmung der Auftretenswahrscheinlichkeit von in der theoretischen Verteilung der Differenzen von Mittelwerten mit dem Erwartungswert Fall 1: NM + NJ  50 (standardnormalverteilt) Fall 2: NM + NJ < 50 (t – verteilt mit NM + NJ - 2 Freiheitsgraden) Fall 2: NM + NJ < 50

Prinzip der Testung (zweiseitig) -4 -2 2 4 0.1 0.2 t Prüfgrösse Signifikanzniveau Annahmebereich Ablehnungsbereich Testen zum sig level a heisst: Ist abs t grösser tcrit Testen zum Signifikanzniveau : Ist |t| > t1-a/2?

Die t- Verteilung t- Verteilung mit df = 10 Normalverteilung Testen zum sig level a heisst: Ist abs t grösser tcrit Kritische Werte sind bei der t- Verteilung im Vergleich zur N- Verteilung größer Ablehnung der H0 erst bei größeren Werten der Prüfgröße

Prüfgröße und Entscheidung Gilt die Nullhypothese M = mJ (bzw. Dm = 0) so ist t - verteilt mit NM + NJ -2 Freiheitsgraden. Ist die Wahrscheinlichkeit einen extremeren Wert als den empirischen t - Wert zu erhalten, kleiner oder gleich 5%, so sehen wir die Nullhypothese als zu unwahrscheinlich an und vermuten, dass ein wirklicher Mittelwertsunterschied in den Populationen besteht.

Entscheidung 1. Berechne 2. Ermittle kritischen t - Wert nach der t - Verteilung 3. Entscheide A. Gilt Ablehnung von H0 (die Mittelwerte der J. und M. sind signifikant verschieden) B. Gilt Beibehalten von H0 (die Mittelwerte der J. und M. unterscheiden sich nur zufällig)

Praktische Berechnung Geschlecht M J 26.7 17.2 173 106 26.7 – 17.2 = 9.5

Praktische Entscheidung 1. Berechne 2. Ermittle kritischen t - Wert nach der t- Verteilung: (a = 0.05, df =38) 3. Entscheide Es gilt Ablehnung von H0: Die Wahrscheinlichkeit der gefundenen Mittelwertsdifferenz ist kleiner als 5%. Der Mittelwertsunterschied der Jungen und Mädchen ist signifikant

Voraussetzungen des t- Tests für unabhängige Stichproben Für N1 + N2 < 50 müssen die Werte aus normalverteilten Populationen stammen (Prüfung der Stichprobenwerte auf Normalverteilung) Die Populationsvarianzen, die beiden Stichproben zugrundeliegen müssen gleich (homogen) sein (Prüfung der geschätzen Populationsvarianzen auf Gleichheit mit F- Test. Bei 1 vielleicht mal die Simulation de´s Centrak Limit, wenn Zeit Bei 2 Vorrechenen an der tafel! Die Stichproben müssen unabhängig sein. (Messeinheiten untereinander und zwischen den Stichproben) t- Test ist relativ robust, selten progressive Entscheidungen

Abhängige Stichproben Eine Gruppe von Schülern wird trainiert. Vorher und nachher wird ein Leistungstest gemacht. 1 89 2 93 94 3 98 100 4 102 -2 5 99 6 106 110 7 117 112 -5 8 104 9 92 10 103 Nr Test 1 Test 2 D Testung der H0: Bei 1 vielleicht mal die Simulation de´s Centrak Limit, wenn Zeit Bei 2 Vorrechenen an der tafel! Sind die Schüler nach dem Training besser als vorher? Frage

Verteilung der Mittelwerte von Differenzen -15 -10 -5 5 10 15 0.00 0.05 0.10 Wahrscheinlichkeitsdichte f ( x ) 3 Festlegungen für die Verteilung: 2. Die sind normalverteilt (für N  30) 1. Sie hat den Mittelwert 0 3. Sie hat eine Standardabweichung („Standardfehler“) Standardfehler muss bestimmt werden

Schätzung des Standardfehlers Es gilt: Aus Stichprobendaten: Standardfehler aus Stichprobendaten: Wobei N die Anzahl der Messwertpaare ist.

Prüfgröße und Entscheidung Gilt die Nullhypothese 2 = m1 (bzw. mD = 0) so ist t - verteilt mit N - 1 Freiheitsgraden. Interpretation wie im Fall des t – Tests für unabhängige Stichproben

Voraussetzungen des t- Tests für abhängige Stichproben Für N < 30 müssen die Werte aus normalverteilten Populationen stammen (Prüfung der Stichprobenwerte auf Normalverteilung) Die Populationsvarianzen, die beiden Stichproben zugrundeliegen müssen nicht gleich (homogen) sein. (Allerdings verliert der Test an Teststärke für stark verschiedene Varianzen) Bei 1 vielleicht mal die Simulation de´s Centrak Limit, wenn Zeit Bei 2 Vorrechenen an der tafel! Bei hohen Korrelationen der beiden Stichproben und gleichen Varianzen ist der t- Test für abhängige Stichproben weit mehr teststark als der t- Test für unabhängige Stichproben. [Tafelbeispiel für 2 und 3]