Konfidenzintervall und Testen für den Mittelwert und Anteile

Slides:



Advertisements
Ähnliche Präsentationen
Gliederung Vertrauensintervalle Arten von Hypothesen
Advertisements

Gliederung Definition des Wahrscheinlichkeitsbegriffes
Gliederung Der Begriff der Stichprobe, Stichprobenfehler
Die t-Verteilung Jonathan Harrington.
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Der Binomialtest Man habe einen wahren Anteil P.
Hypothesen testen: Grundidee
Die Standardnormalverteilung
Induktive Statistik.
Statistische Methoden I
Statistische Methoden II
Die Vorlesung Statistische Methoden II findet am (nächste Woche) nicht nicht statt. Diese Vorlesung wird zu einem späteren Termin, der noch bekannt.
Konfidenzintervalle Intervallschätzung
Statistische Methoden II SS 2008 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Makarenkostraße (Kiste)
M-L-Schätzer Erwartungswert
TESTS. Worum es geht Man möchte testen, ob eine bestimmte Annahme (Hypothese) über Parameter der Realität entspricht oder nicht. Beobachtung (Stichprobe)
Die Student- oder t-Verteilung
Konfidenzintervalle Intervallschätzung Jeder Beobachtung wird ein Intervall C( ) der reellen Zahlen zugeordnet Niveau Dabei ist die Wahrscheinlichkeit,
Statistische Methoden I SS 2005 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.
Statistische Methoden I SS 2005
Klausurtermin (laut Prüfungsamt) Probeklausur Freitag, 13. Juni 2003 statt Vorlesung.
Achtung Vorlesung am Montag, den 21. Juni Zeit: Uhr Ort: Kiste.
II. Wahrscheinlichkeitstheorie
Die Vorlesung am 14. Mai (Tag nach Himmelfahrt) wird auf Montag, den 17. Mai verlegt! Zeit: 16 Uhr Ort: Kiste Nächste Woche!!!!
Statistische Methoden II SS 2003 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.
III. Induktive Statistik
Induktive Statistik. Statistische Struktur (diskreter Fall) Dabei sind:
Die Vorlesung am 14. Mai (Tag nach Himmelfahrt) wird verlegt. Der Nachholtermin wird noch bekannt gegeben.
Statistische Methoden II SS 2003
Extra-SPSS-Kurse Durchführung: Birte Holtfreter Termine Di Mi Mi Ort PC-Pool Loefflerstarße.
Maximum-Likelihood-Schätzer ( diskreter Fall) Likelihood-Funktion mit oder M-L-Schätzer.
Wahrscheinlich-keitsrechnung
Bedingte Wahrscheinlichkeiten und diagnostische Tests II
Sportwissenschaftliche Forschungsmethoden SS Statistischer Test.
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Eigenschaften der OLS-Schätzer
Deutsch als Zweitsprache: Experimentelle Methoden WS 2013/2014
Histogramm/empirische Verteilung Verteilungen
Peter Hackl, Abteilung für Wirtschaftsstatistik, UZA II, 4. Ebene
Formulierung und Überprüfung von Hypothesen
Ausgleichungsrechnung I
Die t-Verteilung und die Prüfstatistik
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
Die Gaußverteilung.
STATISIK LV Nr.: 1375 SS März 2005.
Wiederholung BSP 2.1.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 1852 WS 2005/ Dezember 2005.
STATISIK LV Nr.: 0021 WS 2005/ Oktober 2005.
STATISIK LV Nr.: 1852 WS 2005/ Dezember 2005.
STATISIK LV Nr.: 0021 WS 2005/ Oktober 2005.
STATISIK LV Nr.: 1852 WS 2005/ Dezember 2005.
Modul Statistische Datenanalyse
STATISIK LV Nr.: 1375 SS März 2005.
Kapitel 9 Analyse der Modellstruktur Hackl, Einführung in die Ökonometrie 2 Rekursive OLS-Schätzung Spezifiziertes Modell: y = X + u y, u:
Arbeiten mit der Normalverteilung
Peter Hackl, Abteilung für Wirtschaftsstatistik, UZA II, 4. Ebene
Arbeiten mit der Normalverteilung
Mehr zum Testen von Hypothesen
1 Stichprobenverfahren zur Qualitätssicherung Hilfestellung der Statistik in der Wirtschaftsprüfung.
Tutorium Statistik II Übung IV Philipp Schäpers Mi – 11.45
6.6 Normalverteilung Die Normalverteilung kann als das wichtigste Verteilungsmodell der Statistik ange-sehen werden. Sie wird nach ihrem Entdecker auch.
Bioinformatik Vorlesung
Stochastik ganz kurz Beispiel diskret Würfelwurf Beispiel stetig
Thema der Stunde I. Die Form der Stichprobenkennwerteverteilung
STATISIK LV Nr.: 1375 SS März 2005.
 Präsentation transkript:

Konfidenzintervall und Testen für den Mittelwert und Anteile Statistik: 17.3.04 Konfidenzintervall und Testen für den Mittelwert und Anteile

Schließende Statistik oder Statistische Inferenz: Rückschluss aus den Ergebnissen einer Zufallsstichprobe auf die Grundgesamtheit oder ihre Parameter (m, p, etc.) Das Schätzen von Parametern: für den unbekann-ten Wert eines Parameters (m, p, etc.) ist zu bestimmen ein numerischer Wert (Punktschätzer) oder ein Intervall, in dem der unbekannte Wert mit vorgegebener Wahrscheinlichkeit enthalten ist (Konfidenzintervall) Entscheidung zwischen Behauptungen (Hypothesen) 17.3.04 PI Statistik, SS 2004 (8)

Beispiel A: Abfüllmenge Der unbekannte Mittelwert μ der Füllmenge soll geschätzt werden Stichprobe (n = 25): = 126.7, s = 0.5. Punktschätzer für μ ist Konfidenzintervall für μ: ± c. Testen von H0: μ = 126.4 gegen H1: μ > 126.4 17.3.04 PI Statistik, SS 2004 (8)

Beispiel B: Anteil der Berufstätigen unter Studierenden Anteil θ ist unbekannt Stichprobe (n = 200) gibt Anteil von p = 32% Punktschätzer für θ ist p = 0.32 Konfidenzintervall p ± c Testen die Nullhypothese H0: θ = 0.20 gegen H1: µ > 0.20 17.3.04 PI Statistik, SS 2004 (8)

Stichprobenverteilungen Wahrscheinlichkeitsverteilungen von und p sind Basis von statistischen Entscheidungsverfahren Zentraler Grenzwertsatz 17.3.04 PI Statistik, SS 2004 (8)

Stichprobenmittelwert Grundgesamtheit: X mit (beliebiger) Verteilung,  und . Stichprobenmittelwert : Mittelwert von ist  Standardabweichung (Standardfehler, standard error) von ist StdAbw( ) = /n Für nicht zu kleines n: ist näherungsweise normalverteilt 17.3.04 PI Statistik, SS 2004 (8)

Konfidenzintervall für μ Konfidenzintervall zur Konfidenzzahl γ Mit γ = 0.95 c = 2/n genauer: c = 1.96 /n 99.7%-iges KI: ± 3 /n 90%-iges KI: ± 1.645 /n 17.3.04 PI Statistik, SS 2004 (8)

Beispiel A: Abfüllmenge Stichprobe (n = 25): = 126.7, s = 0.5. Punktschätzer für μ ist = 126.7 95%-iges Konfidenzintervall für μ : Einsetzen gibt oder: 126.5 ≤ m ≤ 126.9 17.3.04 PI Statistik, SS 2004 (8)

Konfidenzintervall: Wahl von c Näherungsweise gilt Wahl von c0 so, dass oder Aus folgt und das 0.975-Perzentil c0 = 1.96 17.3.04 PI Statistik, SS 2004 (8)

100g%iges Konfidenzintervall für μ Symmetrisches Intervall um so, dass 100g% aller so konstruierten Intervalle das wahre m enthalten 0.90 1.645 0.95 1.96 0.99 2.58 Wahl von z für gegebenes g : 17.3.04 PI Statistik, SS 2004 (8)

Wahl des Stichprobenumfanges Halbe Länge c des Konfidenzintervalls hängt ab von n, g und s Bei Vorgabe von c und g kann n berechnet werden: n =(z(1+g)/2σ/c)2 17.3.04 PI Statistik, SS 2004 (8)

Unbekanntes s Verwendung der t -Verteilung statt der standardisierten Normalverteilung Student‘sche t -Verteilung: hat einen Parameter (n-1), die „Zahl der Freiheitsgrade“ tabelliert, in EXCEL: Funktionen TVERT, TINV symmetrisch, glockenförmig für wachsendes n der Normalverteilung immer ähnlicher 17.3.04 PI Statistik, SS 2004 (8)

t -Verteilung: Perzentile p-Quantile der t -Verteilung für wachsende Zahl der Freiheitsgrade und der Normalverteilung p t(2) t(10) t(20) t(30) t(100) N(0,1) 0.95 2.920 1.812 1.725 1.697 1.660 1.645 0.975 4.303 2.228 2.086 2.042 1.984 1.96 0.995 9.925 3.169 2.845 2.750 2.626 2.58 17.3.04 PI Statistik, SS 2004 (8)

Test für μ Verfahren Lege die Nullhypothese H0 (μ = μ0) und die Alternative H1 fest Wähle den maximal tolerierten p-Wert (probability value), d.i. die Wahrscheinlichkeit, den Fehler 1. Art zu begehen (das Signifikanzniveau, auch mit  bezeichnet); z.B. 0.05 Ziehe die Stichprobe, berechne Berechne den p-Wert Verwerfe H0, wenn der p -Wert kleiner als  ist 17.3.04 PI Statistik, SS 2004 (8)

Beispiel A: Abfüllmenge Nullhypothese H0: μ = 125g Alternative H1: μ > 125g Die Entscheidung soll für a = 0.05 getroffen werden Stichprobe (n = 9): = 126.0, s = 1.5 Wir verwerfen H0! 17.3.04 PI Statistik, SS 2004 (8)

Testen von Hypothesen Methode, auf Basis einer Zufallsstichprobe eine Entscheidung zwischen zwei Behauptungen (Vermutungen) zu treffen Nullhypothese H0: ist jene Vermutung, über die entschieden werden soll (z.B. m = 125) Alternativhypothese: eine konkurrierende Vermutung p -Wert: Wahrscheinlichkeit, den erhaltenen oder einen noch extremeren Wert für die Teststatistik zu erhalten, wenn H0 zutrifft; ein Maß für die Glaubwürdigkeit von H0 Fehlentscheidungen: Fehler 1. Art (a-Fehler): richtige H0 wird nicht akzeptiert; der p -Wert ist die Wahrscheinlichkeit, diesen Fehler zu begehen Fehler 2. Art: zutreffende Alternativhypothese wird nicht akzeptiert Signifikanzniveau a: maximal tolerierter p -Wert 17.3.04 PI Statistik, SS 2004 (8)

Wahl der Alternativhypothese Das, was ich „beweisen“ möchte Beispiel: Abfüllmenge; H0: m=125g Konsumentenschützer möchte erkennen, wenn m<125g; er möchte ziemlich sicher sein, dass er recht hat, wenn er „m<125g“behauptet Test mit Signifikanzniveau a=0.05: er irrt höchstens in 5 von 100 Entscheidungen Analog: Produzent möchte erkennen, wenn m>125g oder wenn m≠125g 17.3.04 PI Statistik, SS 2004 (8)

Inferenz bei Anteilen Schätzwert für Anteil aus Stichprobe (Umfang n): relative Häufigkeit pn Stichprobenverteilung von pn (Zentraler Grenzwert-satz): mit Faustregel für „großes n'': n q > 5, n (1-q) > 5 17.3.04 PI Statistik, SS 2004 (8)

100g%iges Konfidenzintervall für q Symmetrisches Intervall um pn so, dass 100g% aller so konstruierten Intervalle das wahre q enthalten Wahl von z für gegebenes g : 0.90 1.645 0.95 1.96 0.99 2.58 In sp ist q durch pn zu ersetzen! 17.3.04 PI Statistik, SS 2004 (8)

Beispiel B: Berufstätige Anteil der Berufstätigen unter den Studierenden θ ist unbekannt Stichprobe (n = 200) gibt Anteil von p200 = 32% Punktschätzer für θ ist p = 0.32 95%-iges Konfidenzintervall für θ : oder: 0.255 ≤ θ ≤ 0.385 Achtung! nθ ≈ 200 (0.32) = 64 > 5, n(1-θ) ≈ 200 (0.68) = 136 > 5 17.3.04 PI Statistik, SS 2004 (8)

Beispiel B: Berufstätige Nullhypothese H0: θ = 30% Alternative H1: μ > 30% Die Entscheidung soll für a = 0.05 getroffen werden Stichprobe (n = 200): p200 = 0.32 Wir verwerfen H0 nicht! Beachten Sie! 17.3.04 PI Statistik, SS 2004 (8)