Hypothesen testen: Grundidee

Slides:

Advertisements

Ähnliche Präsentationen

T - Test Prüfung des Mittelwerteunterschieds bei abhängigen und unabhängigen Stichproben.

Advertisements

Heute 1.F – Test zur Varianzhomogenität 2.Bartlett-Test zur Varianzhomogenität 3.Chi – Quadrat Tests für Häufigkeiten 4.Chi – Quadrat Tests zur Verteilungsanpassung.

Forschungsstrategien Johannes Gutenberg Universität Mainz

Thema der Stunde I. Einführung in die Varianzanalyse:

Einfaktorielle Varianzanalyse

Gliederung Vertrauensintervalle Arten von Hypothesen

Forschungsstatistik II

Forschungsstatistik II

Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.

Forschungsstatistik II

Heute Prüfung der Produkt-Moment Korrelation

Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26.

Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.

A-Priori Kontraste Prüfung des Mittelwerteunterschieds von Faktorstufen bzw. Kombinationen von Faktorstufen: z.B.: oder.

Der Binomialtest Man habe einen wahren Anteil P.

Prüfung statistischer Hypothesen

Deskriptive Statistik und Wahrscheinlichkeitstheorie

Induktive Statistik.

Statistische Methoden II

Nachholung der Vorlesung vom Freitag

Vorlesung Die Vorlesung Statistische Methoden II nächste Woche vom 6. Juni ( nächste Woche ) wird auf den 4. Juni (Mittwoch) vorverlegt ! 14 – 16 Zeit:

Nachholung der Vorlesung vom Freitag

Konfidenzintervalle Intervallschätzung

Ab nächster Woche wird die Übungsgruppe Gruppe 2: Henrike Berg Di SR 222 wegen Personalmangel eingestellt.

TESTS. Worum es geht Man möchte testen, ob eine bestimmte Annahme (Hypothese) über Parameter der Realität entspricht oder nicht. Beobachtung (Stichprobe)

Die Student- oder t-Verteilung

Konfidenzintervalle Intervallschätzung Jeder Beobachtung wird ein Intervall C( ) der reellen Zahlen zugeordnet Niveau Dabei ist die Wahrscheinlichkeit,

Kolmogorov-Smirnov-Test. A. N. Kolmogorov Geboren in Tambov, Russland. Begründer der modernen Wahrscheinlichkeitstheorie.

Klausurtermin (laut Prüfungsamt) Probeklausur Freitag, 13. Juni 2003 statt Vorlesung.

Achtung Vorlesung am Montag, den 21. Juni Zeit: Uhr Ort: Kiste.

Achtung Vorlesung am nächsten Montag (21. Juni) Zeit: Uhr Ort: Kiste.

Test auf Normalverteilung

Klausur am :00 bis 13:00 Hörsaal Loefflerstraße und Hörsaal Makarenkostraße.

Deskriptive Statistik

Sportwissenschaftliche Forschungsmethoden SS Statistischer Test.

Tutorium Willkommen zurück, in der wunderbaren Welt der Statistik Teil II.

Vorlesung: Biometrie für Studierende der Veterinärmedizin Prinzipien des statistischen Testens Entscheidungsfindung Exakter Binomialtest als.

Vorlesung: ANOVA I

Eigenschaften der OLS-Schätzer

Multikollinearität Wann spricht man von Multikollinearität?

Wiederholung: Einfache Regressionsgleichung

Deutsch als Zweitsprache: Experimentelle Methoden WS 2013/2014

Formulierung und Überprüfung von Hypothesen

Einführung in die beurteilende Statistik

Überblick Statistik Deskriptive Statistik=beschreibende Statistik

Chi Quadrat Test Tamara Katschnig.

Wahrscheinlichkeitsrechnung

Überblick Statistik Deskriptive Statistik=beschreibende Statistik

Galip Turan 5 ITK. Bsp.: Untersuchen Sie aus der folgenden Erhebung in einem Kaufhaus: Hängt die Zahlungsweise vom Geschlecht ab? ( Alpha =1%)

Überblick Statistik Deskriptive Statistik=beschreibende Statistik

Überblick Statistik Deskriptive Statistik=beschreibende Statistik

Überblick Statistik Deskriptive Statistik=beschreibende Statistik

STATISIK LV Nr.: 1375 SS März 2005.

Wiederholung BSP 2.1.

STATISIK LV Nr.: 0028 SS Mai 2005.

STATISIK LV Nr.: 0021 WS 2005/ Oktober 2005.

STATISIK LV Nr.: 1852 WS 2005/ Dezember 2005.

SStotal SStotal SStreat SSerror SStreat SSerror Biomasse (g) wenig

Konfidenzintervall und Testen für den Mittelwert und Anteile

Forschungsmethodik II, SS 2010 Vesna Pavlovski & Julia Pichlhöfer

Bioinformatik Vorlesung

Stochastik ganz kurz Beispiel diskret Würfelwurf Beispiel stetig

Zusammenhänge von Variablen ab Nominalskalenniveau

setzt Linearität des Zusammenhangs voraus

Phi-Koeffizient: Alternative Berechnungsart

STATISIK LV Nr.: 1375 SS März 2005.

Statistiken je nach Messniveau

Hypothesentests.

Präsentation transkript:

Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei einer zweistufigen nominalskalierten und einer intervallskalierten Variable: T-Test Bei einer mehrstufigen nominalskalierten und einer intervallskalierten Variable: Varianzanalyse (F-Test) Bei zwei intervallskalierten Variablen: Korrelation oder Regression

Eigentlich will man aber wissen, ob beide Variablen in der Grundgesamtheit zusammenhängen oder nicht. Hypothesen sind Behauptungen über die Grundgesamtheit. Man formuliert zwei entsprechende Hypothesen: Die Variablen hängen in der Grundgesamtheit nicht zusammen (Nullhypothese H0). Die Variablen hängen in der Grundgesamtheit zusammen (Alternativhypothese HA oder H1), die eigentlich interessierende Annahme!!

Geprüft wird immer die Nullhypothese. Grund: Die Nullhypothese ist genau spezifiziert (Zusammenhang ist Null), Alternativhypothese nicht (Zusammenhang ist vorhanden, ohne dass klar ist, wie hoch). Man prüft, wie wahrscheinlich das Stichprobenergebnis ist, wenn die Nullhypothese zutrifft. Ist diese gering, wird die Nullhypothese abgelehnt. Diese Entscheidung ist entweder richtig oder falsch.

α ist die Irrtumswahrscheinlichkeit bei der Ablehnung von H0, dafür wird vorher ein Grenzwert festgelegt: das Signifikanzniveau

Hypothesen testen: Vorgehen Null- und Alternativhypothese formulieren Festlegung der Irrtumswahrscheinlichkeit (Signifikanzniveau) Festlegung einer geeigneten Prüfgröße und Bestimmung ihrer Verteilung Berechnung des kritischen Werts, ab wann H0 als abgelehnt gelten soll Berechnung des empirischen Werts mit den Daten der Stichprobe Entscheidung über Annahme oder Ablehnung von H0 und Interpretation

Null- und Alternativhypothese formulieren H0: Geschlecht und Wahlabsicht hängen nicht zusammen H1: Geschlecht und Wahlabsicht hängen zusammen.

Festlegung der Irrtumswahrscheinlichkeit (Signifikanzniveau) Wir lehnen H0 ab, wenn die Wahrscheinlichkeit, dass wir uns dabei irren, kleiner ist als 5% (manchmal auch 1%). Das ist dann der Fall, wenn die Wahrscheinlichkeit, das Stichprobenergebnis, das wir erhalten haben, zu erhalten, kleiner ist als 5% (bzw. 1%). Wir testen also auf dem 5%-Signifikanzniveau (bzw. 1%). Notation: α = 5%

Festlegung einer geeigneten Prüfgröße und Bestimmung ihrer Verteilung Da Geschlecht und Wahlabsicht nominalskaliert sind, bietet sich Χ² als Prüfgröße an. Diese Größe ist annähernd Χ² - verteilt, wenn keine der erwarteten Häufigkeiten kleiner ist als 5.

Berechnung des kritischen Werts, ab wann H0 als abgelehnt gelten soll Man schaut in der Chi²-Tabelle nach, wie hoch der Chi²-Wert ist, der die unteren 95% von der oberen 5% trennt. Dabei muss man die Zeile mit den entsprechenden Freiheitsgraden auswählen. Freiheitsgrade sind hier (r-1) * (c-1) (Anzahl der Zeilen minus 1) mal (Anzahl der Spalten minus 1)

Berechnung des empirischen Werts mit den Daten der Stichprobe Χ2 =

Entscheidung über Annahme oder Ablehnung von H0 und Interpretation Ist der in der Stichprobe gefundene Wert für die Prüfgröße größer als der kritische Wert, wird die Nullhypothese abgelehnt. Ist die Prüfgröße kleiner oder gleich dem kritischen Wert, wird die Nullhypothese beibehalten. Wird H0 abgelehnt, heißt das bei einem Signifikanzniveau von 5%: Mit 95%iger Wahrscheinlichkeit besteht in der Grundgesamtheit ein Zusammenhang zwischen den beiden Variablen. H0 ablehnen: Der Zusammenhang ist signifikant.

Achtung Statistische Signifikanz ist nicht gleichbedeutend mit praktischer Bedeutsamkeit, daher hier noch Cramers V berechnen, da dieser immer zwischen 0 und 1 liegt und leichter interpretierbar ist.

Beispiel aus Gehring und Weins

Alle erwarteten Häufigkeiten sind größer als 5, daher kann man Χ²-Verteilung verwenden.

Prüfgröße ist kleiner als der kritische Wert von 3 Prüfgröße ist kleiner als der kritische Wert von 3.84, daher H0 annehmen

Ausblick für Computerauswertungen SPSS gibt p-Werte aus. Das ist die genaue Wahrscheinlichkeit, mit der das Stichproben-Ergebnis zustande kommen kann, wenn in der Grundgesamtheit die Nullhypothese gilt. Wenn p kleiner ist als das Signifikanzniveau α, wird die Nullhypothese abgelehnt. Ist p < .05: signifikant auf dem 5%-Niveau Ist p < .01: signifikant auf dem 1%-Niveau

Ausblick für weitere Tests Da Χ² immer positiv ist, haben wir die Richtung des Zusammenhangs noch vernachlässigt. Eigentlich gehört zur Interpretation noch die Aussage, in welcher Richtung das Ergebnis auftritt (z.B. Frauen wählen eher die Grünen als Männer). Bei anderen Tests ist das auch statistisch ein Unterschied bei der Berechnung. Daher führen wir die Unterscheidung zwischen einseitigen und zweiseitigen Alternativhypothesen ein.

Einseitige und zweiseitige Alternativhypothesen Bei nominalskalierten Variablen (Chi²) H0: Frauen und Männer sind gleich oft Vorgesetzte. Zweiseitig: Frauen und Männer sind unterschiedlich oft Vorgesetzte. Einseitig: Frauen sind seltener Vorgesetzte als Männer (setzt Theorie oder Vorwissen voraus).

Einseitige und zweiseitige Alternativhypothesen Bei einer nominalskalierten und einer intervallskalierten Variablen (T-Test) H0: Frauen und Männer sind gleich gut im Sprachtest. Zweiseitig: Frauen und Männer sind unterschiedlich gut im Sprachtest. Einseitig: Frauen sind besser im Sprachtest als Männer. D.h. hier wird die H0 auch angenommen, wenn die Männer viel besser als die Frauen sind.

Für SPSS: Bei einseitigen Fragestellungen p halbieren! Tipp Für SPSS: Bei einseitigen Fragestellungen p halbieren!

Lage des Ablehnungsbereichs Hypothese: Frauen sind besser als Männer. im Zähler der Formel: xquer Männer – xquer Frauen Prüfgröße wird einen negativen Wert annehmen – Ablehnungsbereich muss links sein, d.h. man sucht in der Tabelle die Fläche links von α (=0.05). Postuliert die Alternativhypothese dagegen positive Werte der Prüfgröße, liegt der Ablehnungsbereich rechts: Φ = 1 - α

Tipp Am besten nennt man immer die Gruppe, von denen man höhere Werte erwartet als erste und schreibt sie auch als erste in die Formel. Dann erwartet man immer positive Werte der Prüfgröße, und der Ablehnungsbereich ist immer rechts. H0: μ1 ≤ μ2 H1: μ1 > μ2

Tests für Mittelwertunterschiede Ziel: prüfen, ob der Unterschied zweier voneinander unabhängiger Substichproben (z.B. Männer, Frauen) in dem Mittelwert einer intervallskalierten Variable (z.B. Sprachtest) signifikant ist. Es geht also um den Zusammenhang zwischen einer nominalskalierten 2-stufigen Variable und einer intervallskalierten Variable. Die intervallskalierte Variable ist die abhängige Variable.

Versionen Die Standardabweichungen σ1 und σ2 der beiden Teil-Grundgesamtheiten können gleich oder ungleich sein (wir behandeln nur den Fall, dass sie gleich sind, ungleiche σ nur mit SPSS). Die Standardabweichungen σ1 und σ2 können bekannt oder unbekannt sein. Wenn sie bekannt sind, wird die z-Verteilung verwendet, wenn sie unbekannt sind, die T-Verteilung. Gehring und Weins verwenden aus didaktischen Gründen zunächst auch bei unbekannten σ die z-Verteilung, da sich T an z annähert, wenn beide Substichproben größer als N=30 sind.

Parameter der Prüfgröße Höhe des Mittelwertunterschieds im Vergleich zum Mittelwertunterschied bei Gültigkeit der Nullhypothese (meist 0) Standardabweichungen der beiden Teilstichproben Anzahl der Untersuchungseinheiten in beiden Teilstichproben

z-Test

Da μ1 – μ2 = 0, vereinfacht sich die Formel zu:

wird verwendet, wenn σ1 und σ2 unbekannt sind T-Test wird verwendet, wenn σ1 und σ2 unbekannt sind diese werden durch s1 und s2 der Stichprobe geschätzt wegen dieser Ungenauigkeit wird die T-Tabelle verwendet Freiheitsgrade: n1 + n2 – 2 s1 und s2 werden in Hinblick auf die Größen der beiden Teilstichproben gewichtet

Null- und Alternativhypothese formulieren Vorgehen: Null- und Alternativhypothese formulieren Festlegung der Irrtumswahrscheinlichkeit (Signifikanzniveau) Festlegung einer geeigneten Prüfgröße und Bestimmung ihrer Verteilung Berechnung des kritischen Werts, ab wann H0 als abgelehnt gelten soll Berechnung des empirischen Werts mit den Daten der Stichprobe Entscheidung über Annahme oder Ablehnung von H0 und Interpretation

H1: Frauen sind im Test besser als Männer. Beispiel 100 Frauen und 100 Männer machen einen Sprachtest, wobei die Frauen im Mittel 25 und die Männer 20 Punkte erreichen (s1=s2=10). H0: Frauen und Männer unterscheiden sich nicht im Test oder Männer sind besser. H1: Frauen sind im Test besser als Männer. Irrtumswahrscheinlichkeit 5% T-Test ist das geeignete Verfahren. Kritischer Wert: Φ = 1-α = 1.653 (bei 200 df, da 198 nicht tabelliert ist) Empirischer Wert T = 3.55 Ablehnung der Nullhypothese

SPSS SPSS berechnet, ob beide Varianzen statistisch gleich oder verschieden sind: F = s²1 / s²2 und gibt für beide Möglichkeiten unterschiedliche T-Werte an. Diese unterscheiden sich nur in der Berechnung der Freiheitsgrade.