Prüfung statistischer Hypothesen

Slides:



Advertisements
Ähnliche Präsentationen
T - Test Prüfung des Mittelwerteunterschieds bei abhängigen und unabhängigen Stichproben.
Advertisements

Der F - Test Man prüft, ob sich 2 Varianzen unterscheiden, mit dem F-Quotienten: Geprüft werden stets die Schätzungen der Populationsvarianzen aufgrund.
Korrektur Tutoratsaufgaben V
Der F - Test Man prüft, ob sich 2 Varianzen unterscheiden, mit dem F-Quotienten: Geprüft werden stets die Schätzungen der Populationsvarianzen aufgrund.
Heute 1.F – Test zur Varianzhomogenität 2.Bartlett-Test zur Varianzhomogenität 3.Chi – Quadrat Tests für Häufigkeiten 4.Chi – Quadrat Tests zur Verteilungsanpassung.
Forschungsstrategien Johannes Gutenberg Universität Mainz
Thema der Stunde I. Einführung in die Varianzanalyse:
Klassische Hypothesenprüfung
EmPra Der Einfluss und die Verarbeitung von emotionalen Reizen
Einfaktorielle Varianzanalyse
Gliederung Vertrauensintervalle Arten von Hypothesen
Gliederung Der Begriff der Stichprobe, Stichprobenfehler
Forschungsstatistik II
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.
Forschungsstatistik II
Heute Prüfung der Produkt-Moment Korrelation
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
A-Priori Kontraste Prüfung des Mittelwerteunterschieds von Faktorstufen bzw. Kombinationen von Faktorstufen: z.B.: oder.
Der Binomialtest Man habe einen wahren Anteil P.
Mehrfachregressionen
Ein frohes und erfolgreiches Jahr
Hypothesen testen: Grundidee
Effektgrößen, Kontraste & Post-hoc-Tests
Deskriptive Statistik und Wahrscheinlichkeitstheorie
Fragen Was wird mit der Alphafehler-Kumulierung bzw. –inflation bezeichnet? Wie hoch ist die Wahrscheinlichkeit bei einer Untersuchung mit 4 Gruppen einen.
Strukturgleichungsmodelle
Konfidenzintervalle Intervallschätzung
Die Student- oder t-Verteilung
Konfidenzintervalle Intervallschätzung Jeder Beobachtung wird ein Intervall C( ) der reellen Zahlen zugeordnet Niveau Dabei ist die Wahrscheinlichkeit,
Achtung Vorlesung am Montag, den 21. Juni Zeit: Uhr Ort: Kiste.
Sportwissenschaftliche Forschungsmethoden SS Statistischer Test.
Tutorium
Tutorium Willkommen zurück, in der wunderbaren Welt der Statistik Teil II.
Tutorium
Vorlesung: ANOVA I
Einführung in die Metaanalyse
Eigenschaften der OLS-Schätzer
Wiederholung: Einfache Regressionsgleichung
Deutsch als Zweitsprache: Experimentelle Methoden WS 2013/2014
Formulierung und Überprüfung von Hypothesen
Einführung in die beurteilende Statistik
Vergleich der 3 Arten des t-Tests Testergebnisse berichten
Mittelwertvergleiche (T-Test)
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Chi Quadrat Test Tamara Katschnig.
Ausgleichungsrechnung I
Non-parametrische Testverfahren
Wahrscheinlichkeitsrechnung
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
t-Test für unabhängige Stichproben
Einführung in SPSS/PASW. Inhaltsübersicht 1. Intro ( ) 2. Deskriptive Statistik ( ) (In Buch 1 Seite 85ff.) Kennwerte (Erwartungswert,
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
STATISIK LV Nr.: 1375 SS März 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 0021 WS 2005/ Oktober 2005.
STATISIK LV Nr.: 1852 WS 2005/ Dezember 2005.
Modul Statistische Datenanalyse
Konfidenzintervall und Testen für den Mittelwert und Anteile
Tutorium Statistik II Übung IV Philipp Schäpers Mi – 11.45
Varianzanalyse Teststatistik: F – Test -> vergleich zweier Varianzen -> Grundlage der Varianzanalyse Welche „Varianzen“ werden miteinander verglichen?
Stochastik ganz kurz Beispiel diskret Würfelwurf Beispiel stetig
Der Binomialtest Man habe einen wahren Anteil P. Kann man aufgrund von p sagen, daß in der Population tatsächlich der Anteil P zugrunde liegt? [Beispiele]
Thema der Stunde I. Die Form der Stichprobenkennwerteverteilung
STATISIK LV Nr.: 1375 SS März 2005.
Prüft ebenfalls die Annahme der Varianzhomogenität (exakter)
Forschungsstrategien Johannes Gutenberg Universität Mainz
 Präsentation transkript:

Prüfung statistischer Hypothesen Die inferenzstatistische Hypothesenprüfung erlaubt Aus-sagen über Hypothesen in einer Population, aus welcher die untersuchten Stichproben gezogen wurden. Hierbei schätzt man über Stichprobenkennwerte Populations-kennwerte und führt mit Hilfe dieser Schätzungen eine Hypothesenprüfung durch. Hypothesen - 1

Was sind statistische Hypothesen? Statistische Hypothesen sind Erwartungen über Unterschiede zwischen oder Zusammenhänge von Variablen, die vor einer Untersuchung formuliert werden. Beispiele für statistische Hypothesen: Frauen sind ängstlicher als Männer. Frauen und Männer unterscheiden sich nicht in Ihrer Ängstlichkeit. Gerichtet/ Ungerichtet? H0? Hypothesen - 2

Nullhypothese und Alternativhypothese Bei statistischen Tests werden immer – unabhängig von der Erwartung des beteiligten Forschers – zwei gegensätzliche Hypothesen formuliert: Die Nullhypothese (H0) besagt, dass es keinen Unter-schied zwischen zwei Populationen (bzw. keinen Zu-sammenhang zwischen zwei Merkmalen) gibt. Die Alternativhypothese (H1) besagt dagegen, dass es einen Unterschied (bzw. einen Zusammenhang) gibt. Es kann also immer nur eine von beiden Hypothesen zutreffen! Die beiden statistischen Hypothesen (H0und H1) werden unabhängig von den tatsächlichen inhaltlichen Erwartungen formuliert. Hypothesen - 4

Zwei Formen der Alternativhypothese Formale Schreibweise Ungerichtete Alternativhypothese: H1: μ1≠ μ2 H0: μ1= μ2 Gerichtete Alternativhypothese (1.Möglichkeit): H1: μ1> μ2 H0: μ1≤ μ2 Gerichtete Alternativhypothese (2. Möglichkeit): H1: μ1< μ2 H0: μ1≥ μ2 => Die H0 hängt also von der Auswahl der H1 ab!

Zwei Fehler bei der Hypothesenprüfung α-Fehler/ Fehler erster Art Je nach der Entscheidung kann man zwei Fehler machen: α-Fehler/ Fehler erster Art Man entscheidet sich für die H1, obgleich zwischen den Populationsmittelwerten kein Unterschied existiert („α-Fehler“ bzw. „Fehler erster Art“). Ablehnung der richtigen Nullhypothese Bsp.: Es wird die bessere Wirkung eines neuen, teueren Medikaments angenommen, obwohl es in der Population keinen besseren Therapieeffekt gibt (großes N!).

2. „β-Fehler“ bzw. „Fehler zweiter Art“ Zwei Fehler bei der Hypothesenprüfung 2. „β-Fehler“ bzw. „Fehler zweiter Art“ Man entscheidet sich für die H0, obgleich es auf Populationsebene einen bedeutsamen Unterschied gibt Beibehaltung der falschen Nullhypothese Bei einer Studie mit N=10 soll der Einfluss des Mobilfunktelefonierens auf die Aufmerksamkeit der Fahrer während der Autofahrt überprüft werden. Aufgrund der kleinen Stichprobe kommt es zu keinen signifikanten Ergebnissen Für beide Fehlertypen sollte vor einer Untersuchung die gewünschte Wahrscheinlichkeit festgelegt werden!

Das α-Niveau Das α-Niveau gibt an, wie „unwahrscheinlich“ die H0 sein muss, damit die H1 angenommen wird. Wenn p ≤ α, wird die H1 angenommen. Konventionen für das α-Niveau: p ≤ 0.05  „signifikantes“ (statistisch bedeutsames) Ergebnis α ≤ 0.01  „hoch signifikantes“ Ergebnis α ≤ 0.10  „marginal signifikantes“ Ergebnis Hypothesen - 7

Das β-Niveau Das β-Niveau gibt an, wie wahrscheinlich es ist, dass in der Population kein Unterschied besteht, obwohl der Test zu einem signifikanten Ergebnis kommt. Mit der Wahrscheinlichkeit β wird also die H0 fälschlicher-weise angenommen. In vielen statistischen Untersuchungen wird nicht beachtet, dass der β-Fehler viel zu groß ist, um die Ergebnisse zu interpretieren. Wir werden später besprechen, wie man den β-Fehler verkleinern kann! Hypothesen - 8

Statistische Entscheidungen In der Population gilt die Testergebnis Ent-scheidung H0 H1 p > α „H0“ p < α „H1 “ korrekt β-Fehler α-Fehler korrekt Hypothesen - 9

Drei Formen des t-Tests 1)Der t-Test für unabhängige Stichproben: Dieser Test prüft, ob sich die Mittelwerte von zwei Gruppen unterscheiden (2)Der t-Test für abhängige Stichproben Dieser Test prüft, ob sich der Mittelwert einer Stichprobe zu zwei Messzeitpunktenunterscheidet (3)Der Ein-Gruppen t-Test Dieser Test prüft, ob sich der Mittelwert einer Gruppe von einem vorgegeben Wert unterscheidet

Der t-Test für unabhängige Stichproben Mit dem t-Test für unabhängige Stichproben wird ver-glichen, ob sich zwei Populationsmittelwerte voneinander unterscheiden. Der t-Test gehört zu den parametrischen Testverfahren. Parametrische Testverfahren setzen eine bestimmte Verteilungsform (in der Regel die Normalverteilung) des untersuchten Merkmals voraus. Daher bildet die Normalverteilung des untersuchten Merkmals eine Vorraussetzung für den t-Tests. Hypothesen – 10

Der Kennwert des t-Tests Kennwert des t-Tests ist die Differenz der Mittelwerte der beiden Stichproben: Der t-Test prüft die bedingte Wahrscheinlichkeit Wenn gilt p < α, wird die H0 verworfen und damit die H1 angenommen. Hypothesen – 11

Stichprobenkennwerteverteilung unter der H0 Um die Wahrscheinlichkeit zu bestimmen, wird eine theo-retische Stichprobenkennwerteverteilung der Mittel-wertsdifferenzen unter der Nullhypothese gebildet. Die theoretische Verteilung von Mittel-wertsdifferenzen ist nur bei großen Stich-proben normalverteilt. Bei kleineren Stichproben ergibt sich eine „schmalgipfligere“ Verteilung. gesucht: p(Δx) Hypothesen – 12

Der Standardfehler der Stichprobenkennwerteverteilung Der Standardfehler der Stichprobenkennwerteverteilung des t-Tests hängt von den Standardabweichungen und den Größen der beiden Teilstichproben ab: Hypothesen – 13

Der Standardfehler der Stichprobenkennwerteverteilung Jetzt kann der empirische Mittelwertsunterschied mit dem Standardfehler der verglichen werden: Achtung: Zur Bestimmung der Wahrscheinlichkeit eines solchen Wertes darf nicht die Standardnormalverteilungs-tabelle angewandt werden, da die Mittelwertsdifferenz nicht normalverteilt ist! Hypothesen – 14

Die t-Verteilung Analog zum Vorgehen bei der z-Standardisierung wird auch hier der Kennwert durch die Streuung geteilt. Dieses Verhältnis bildet die Teststatistik des t-Tests: df steht für „degree of freedom“, also für die Freiheitsgrade. Hypothesen – 15

Die Freiheitsgrade der t-Verteilung Die Freiheitsgrade der t-Verteilung berechnen sich als: Dabei beeinflussen die Freiheitsgrade die Form der t-Ver-teilung: Bei vielen Freiheitsgraden (df > 120) ist die t-Verteil-ung nahezu identisch mit der z-Verteilung. Je weniger Frei-heitsgrade gegeben sind, desto schmalgipfliger wird die t-Verteilung. Hypothesen – 16

Entscheidung über die Nullhypothese Aus einer Tabelle für die t-Verteilung (siehe Leonhart, S 438ff)wird ein kritischer t-Wert in Abhängigkeit der Freiheitsgrade und des α-Niveaus festgelegt. Weil keine Werte für df=76 angegeben sind, nehmen wir die nächst kleinere Zahl. So ergibt sich ein „konservativer“ Test. Wenn temp > tkrit, kann die H0 verworfen werden. Hypothesen – 18

Der t-Test für unabhängige Stichproben Formulierung der (inhaltlichen und statistischen) Hypothesen Operationalisierung des Merkmals Erfassung des gleichen Merkmal in zwei unabhängigen Stichproben Berechnung der Mittelwerte in beiden Stichproben Schätzung der Populationsvarianzen Berechnung des Standardfehlers der Mittelwertsdifferenz Berechnung des empirischen t-Werts Bestimmung des kritischen t-Werts Entscheidung über H0 und H1

Hinweise: Bei einer gerichteten Hypothese sollte die Differenz immer so gebildet werden, dass der als kleiner erwartete Wert von größeren Wert subtrahiert wird. Wenn die Hypothese zutrifft, muss der empirische t-Wert dann positiv sein. Bei einer ungerichteten Hypothese spielt die Richtung der Subtraktion keine Rolle (man nimmt den Betrag).

Der t-Test für unabhängige Stichproben Formulierung der (inhaltlichen und statistische) Hypo-thesen Operationalisierung des Merkmals Erfassung des glei-chen Merkmal in zwei unabhängigen Stichproben Berechnung der Mit-telwerte in beiden Stichproben Schätzung der Pop-ulationsvarianzen Berechnung des Stan-dardfehlers der Mittelwertsdifferenz Berechnung des empirischen t-Werts Bestimmung des kritischen t-Werts Entscheidung über H0 und H1 Inhaltliche Hypothese: Wörter werden besser erinnert, wenn sie tiefer verarbeitet werden. Statistische Hypothesen: H0: μemo = μstruk H1: μemo > μstruk Operationalisierung des Merkmals: Die Erinnerungsleistung wird als Anzahl der Wörter bestimmt, die in einem free recall Test erinnert werden. Der t-Test - 2

Der t-Test für unabhängige Stichproben Formulierung der (inhaltlichen und statistische) Hypo-thesen Operationalisierung des Merkmals Erfassung des glei-chen Merkmal in zwei unabhängigen Stichproben Berechnung der Mit-telwerte in beiden Stichproben Schätzung der Pop-ulationsvarianzen Berechnung des Stan-dardfehlers der Mittelwertsdifferenz Berechnung des empirischen t-Werts Bestimmung des kritischen t-Werts Entscheidung über H0 und H1 strukturell emotional 6 11 8 7 4 9 Der t-Test - 3

Der t-Test für unabhängige Stichproben Formulierung der (inhaltlichen und statistische) Hypo-thesen Operationalisierung des Merkmals Erfassung des glei-chen Merkmal in zwei unabhängigen Stichproben Berechnung der Mit-telwerte in beiden Stichproben Schätzung der Pop-ulationsvarianz Berechnung des Standardfehlers der Mittelwertsdifferenz Berechnung des empirischen t-Werts Bestimmung des kritischen t-Werts Entscheidung über H0 und H1 strukturell emotional 6 11 8 7 4 9 Der t-Test - 4

Der t-Test für unabhängige Stichproben Formulierung der (inhaltlichen und statistische) Hypo-thesen Operationalisierung des Merkmals Erfassung des glei-chen Merkmal in zwei unabhängigen Stichproben Berechnung der Mit-telwerte in beiden Stichproben Schätzung der Pop-ulationsvarianz Berechnung des Standardfehlers der Mittelwertsdifferenz Berechnung des empirischen t-Werts Bestimmung des kritischen t-Werts Entscheidung über H0 und H1 Der t-Test - 5

Der t-Test für unabhängige Stichproben Formulierung der (inhaltlichen und statistische) Hypo-thesen Operationalisierung des Merkmals Erfassung des glei-chen Merkmal in zwei unabhängigen Stichproben Berechnung der Mit-telwerte in beiden Stichproben Schätzung der Pop-ulationsvarianz Berechnung des Standardfehlers der Mittelwertsdifferenz Berechnung des empirischen t-Werts Bestimmung des kritischen t-Werts Entscheidung über H0 und H1 Der t-Test - 6

Der t-Test für unabhängige Stichproben Formulierung der (inhaltlichen und statistische) Hypo-thesen Operationalisierung des Merkmals Erfassung des glei-chen Merkmal in zwei unabhängigen Stichproben Berechnung der Mit-telwerte in beiden Stichproben Schätzung der Pop-ulationsvarianz Berechnung des Standardfehlers der Mittelwertsdifferenz Berechnung des empirischen t-Werts Bestimmung des kritischen t-Werts Entscheidung über H0 und H1 Festlegung des Alphaniveaus: α = .05 Art des Tests: einseitig vs. zweiseitig einseitig (wegen der gerichteten Alternativ-Hypothese) Der t-Test - 7

Ein- vs. Zweiseitiges Testen Einseitiger Test: Signifikant, wenn Zweiseitiger Test: Signifikant, wenn Betrag von t, d.h. das Vorzeichen spielt keine Rolle! Der t-Test 8

Die t-Verteilung α = .05 t(8) = 1.86 (einseitig) t(8) = 2.31 (zweis.) α = .01 t(8) = 2.90 (einseitig) t(8) = 3.36 (zweis.) Der t-Test - 9

Der t-Test für unabhängige Stichproben Formulierung der (inhaltlichen und statistische) Hypo-thesen Operationalisierung des Merkmals Erfassung des glei-chen Merkmal in zwei unabhängigen Stichproben Berechnung der Mit-telwerte in beiden Stichproben Schätzung der Pop-ulationsvarianz Berechnung des Standardfehlers der Mittelwertsdifferenz Berechnung des empirischen t-Werts Bestimmung des kritischen t-Werts Entscheidung über H0 und H1 Fazit: Der Test hat gezeigt, dass Wörter besser erinnert werden, wenn sie emotional verarbeitet wurden, als wenn sie strukturell verarbeitet wurden. Der t-Test - 10

Voraussetzungen des t-Tests für unabhängige Stichproben: (1)Intervallskalenniveau der Variable (2)Normalverteilung des Merkmals in der Grundgesamtheit (3)„Varianzhomogenität“ (Gleiche Varianzen des Merkmals in beiden Populationen) (4)Unabhängigkeit der Stichproben

Der t-Test für abhängige Stichproben Definition: Stichproben werden als abhängig bezeichnet, wenn die Ziehung eines Merkmalsträgers in die erste Stichprobe die Zugehörigkeit eines Merkmalsträgers zur zweiten Stichprobe beeinflusst. Abhängige Stichproben ergeben sich durch Messwieder-holung oder Parallelisierung bzw. Matching. Warum parallelisiert man Stichproben?  Ein Test für abhängige Stichproben hat eine höhere Power (Teststärke), d.h. es ist wahrscheinlicher, dass ein bestehender Unterschied nachgewiesen werden kann!

Der t-Test für abhängige Stichproben Nun wird die Verteilung der mittleren Differenzen benötigt. Diese berechnet sich nach dem Standardfehler für den Mittelwert wie folgt: Anschließend wird die mittlere Differenz an dem Standard-fehler relativiert. Das Ergebnis dieser Standardisierung ist wiederum t-verteilt. t-Tests für abh. Stichproben - 8

Hypothesen Die statistischen Hypothesen des t-Test für abhängige Stichproben beziehen sich auf den Mittelwert der Differenzen aller Personen Vorteil: Es ist nun unerheblich, ob innerhalb der Messzeitpunktegroße Varianz gegeben ist Ungerichtete Hypothese: H0: μ= 0 H1: μ≠ 0 Gerichtet Hypothese (1): H0: μ≤ 0 H1: μ> 0 Gerichtet Hypothese (2): H0: μ≥ 0 H1: μ< 0