Konfidenzintervalle und Tests auf Normalverteilung

Slides:



Advertisements
Ähnliche Präsentationen
T - Test Prüfung des Mittelwerteunterschieds bei abhängigen und unabhängigen Stichproben.
Advertisements

Der F - Test Man prüft, ob sich 2 Varianzen unterscheiden, mit dem F-Quotienten: Geprüft werden stets die Schätzungen der Populationsvarianzen aufgrund.
Heute 1.F – Test zur Varianzhomogenität 2.Bartlett-Test zur Varianzhomogenität 3.Chi – Quadrat Tests für Häufigkeiten 4.Chi – Quadrat Tests zur Verteilungsanpassung.
Forschungsstrategien Johannes Gutenberg Universität Mainz
Forschungsstatistik II
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.
Forschungsstatistik II
Heute Prüfung der Produkt-Moment Korrelation
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
A-Priori Kontraste Prüfung des Mittelwerteunterschieds von Faktorstufen bzw. Kombinationen von Faktorstufen: z.B.: oder.
Der Binomialtest Man habe einen wahren Anteil P.
Hypothesen testen: Grundidee
Induktive Statistik.
Nachholung der Vorlesung vom Freitag
Statistische Methoden II SS 2008
Vorlesung Die Vorlesung Statistische Methoden II nächste Woche vom 6. Juni ( nächste Woche ) wird auf den 4. Juni (Mittwoch) vorverlegt ! 14 – 16 Zeit:
Nachholung der Vorlesung vom Freitag
Konfidenzintervalle Intervallschätzung
Ab nächster Woche wird die Übungsgruppe Gruppe 2: Henrike Berg Di SR 222 wegen Personalmangel eingestellt.
Chi-Quadrat-Test auf Unabhängigkeit I
TESTS. Worum es geht Man möchte testen, ob eine bestimmte Annahme (Hypothese) über Parameter der Realität entspricht oder nicht. Beobachtung (Stichprobe)
Die Student- oder t-Verteilung
Kolmogorov-Smirnov-Test. A. N. Kolmogorov Geboren in Tambov, Russland. Begründer der modernen Wahrscheinlichkeitstheorie.
Achtung Vorlesung am Montag, den 21. Juni Zeit: Uhr Ort: Kiste.
Die Vorlesung am 14. Mai (Tag nach Himmelfahrt) wird auf Montag, den 17. Mai verlegt! Zeit: 16 Uhr Ort: Kiste Nächste Woche!!!!
Probeklausur Die Probeklausur findet am anstelle der Vorlesung statt. 13. Juni 2003 Nächste Woche!!
Test auf Normalverteilung
Klausur am :00 bis 13:00 Hörsaal Loefflerstraße und Hörsaal Makarenkostraße.
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Eigenschaften der OLS-Schätzer
Chi Quadrat Test Tamara Katschnig.
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Wiederholung BSP 2.1.
STATISIK LV Nr.: 1375 SS März 2005.
Konfidenzintervall und Testen für den Mittelwert und Anteile
Zusammengestellt von Mag. Raimund Hermann
Tutorium Statistik II Übung IV Philipp Schäpers Mi – 11.45
Der Binomialtest Man habe einen wahren Anteil P. Kann man aufgrund von p sagen, daß in der Population tatsächlich der Anteil P zugrunde liegt? [Beispiele]
Thema der Stunde I. Die Form der Stichprobenkennwerteverteilung
Prüft ebenfalls die Annahme der Varianzhomogenität (exakter)
Forschungsstrategien Johannes Gutenberg Universität Mainz
Statistik im Labor BFB-tech Workshop Eugen Lounkine.
Signifikanzprüfung Peter Wilhelm Herbstsemester 2015.
Kapitel 2: Testtheorie / Testmodelle  Multivariate (p-variate) Normalverteil- ung :  Mittelwertstruktur: p Mittelwerte  Kovarianzstruktur: p·(p+1)/2.
SPSS – Kurs Lösungen. Lösung 1 2) z.B. über Transformieren  Werte in Fällen zählen dann noch bei der Schalt- fläche „Werte definieren“ die „1“ angeben.
Exkurs: Chi-quadrat und Modellgüte 1. ist ein Distanzmaß, welches die Distanz zwischen Modellvorhersage und Daten misst.  Je kleiner desto besser ist.
/ SES.125 Parameterschätzung
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Analysen univariater Stichproben
Signifikanz – was ist das überhaupt?
Kovarianz, Korrelation, (lineare) Regression
Ökonometrie und Statistik Mehrfachregression
Kapitel 2: Testtheorie / Testmodelle
Vergleich Eindimensionaler Stichproben
10 Statistisches Schätzen
Forschungsstrategien Johannes Gutenberg Universität Mainz
Ökonometrie und Statistik Wiederholung
Ökonometrie und Statistik Unabhängigkeitstest, c² - Test (Chi Quadrat Test) Dr. Bertram Wassermann.
Die Varianzanalyse Jonathan Harrington library(ggplot2) library(dplyr)
Übersicht Etwas Mathematik (ganz ohne geht es nicht).
Fortgeschrittene Statistische Methoden Cordula Hunt
ANOVA für unabhängige Daten.
Johann D. Müller, Merlin Dwenger , Mats Böttrich
Fortgeschrittene statistische Methoden SS2020
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Ökonometrie und Statistik Unabhängigkeitstest, c² - Test (Chi Quadrat Test) Dr. Bertram Wassermann.
 Präsentation transkript:

Konfidenzintervalle und Tests auf Normalverteilung Ein Referat von Laura Lellig, Nadezda Malinina und Ann-Kathrin Otte

Aufbau Konfidenzintervalle Tests auf Normalverteilung Optische Verfahren, QQ-Plot Shapiro-Wilks, Kolmogorov-Smirnov Chi-Quadrat-Test

Konfidenzintervalle

Was wisst ihr schon über Konfidenzintervalle? Grundlagen Berechnung Mit bekannter Varianz Mit unbekannter Varianz Rechenbeispiel

Wozu braucht man Konfidenzintervalle? Population Stichprobe 𝜇 ≠ 𝑥

Was sind Konfidenzintervalle? Neymann (1937): Konfidenzintervalle = Wertebereiche, in denen, ausgehend von einem gemessenen Stichprobenparameter (z.B. 𝑥 ), der zugrundeliegende Populationsparameter (= „wahrer Wert“, z.B. 𝜇) mit einer gewissen Wahrscheinlichkeit liegt

𝛼=𝑆𝑖𝑔𝑛𝑖𝑓𝑖𝑘𝑎𝑛𝑧𝑛𝑖𝑣𝑒𝑎𝑢 Konfidenzkoeffizienten: 1 - 𝛼 = 1- 0,05 = 95% 1 - 𝛼 = 1- 0,01 = 99% Untere Grenze 𝑈𝐺= 𝑥 −1,96∗ 𝜎 𝑥 𝑈𝐺= 𝑥 −2,58∗ 𝜎 𝑥 Obere Grenze 𝑂𝐺= 𝑥 +1,96∗ 𝜎 𝑥 𝑂𝐺= 𝑥 +2,58∗ 𝜎 𝑥

Voraussetzung: normalverteilte Stichprobe Die Fläche von 1-α wird auch von anderen Perzentil-Paaren eingefasst, aber: 𝑧 𝛼/2 und 𝑧 1−𝛼/2 bilden das kürzeste Intervall 𝑧 𝛼/2 und 𝑧 1−𝛼/2 bilden ein um 𝑥 symmetrisches Intervall In einer standardnormalverteilten Stichprobe ergeben sich daher: Bei α=5%: 𝑧 2,5% =−1,96 𝑢𝑛𝑑 𝑧 97,5% =1,96 Bei α=1%: 𝑧 1% =−2,58 𝑢𝑛𝑑 𝑧 99% =2,58

Wovon hängt die Länge des Konfidenzintervalls ab? Konfidenzkoeffizient je größer, desto länger Merkmalsvarianz Stichprobenumfang je geringer, desto länger, s.u.

Allgemeine Formel ∆ 𝒌𝒓𝒊𝒕(𝟏−𝜶) = 𝒙 ± 𝒛 𝜶/𝟐 ∗ 𝒔 𝒆 𝑠 𝑒 = Standardfehler (Messfehler zw. Stichprobe und Population): 𝒔 𝒆 = 𝝈 𝒏

Berechnung mit bekannter Varianz Schritt 1: Daten auf Normalverteilung überprüfen Schritt 2: in Formel enthaltene Parameter bestimmen Mittelwert, Standardfehler Standardabweichung, Stichprobengröße Schritt 3: OG und UG bestimmen

Berechnung mit unbekannter Varianz? Grundlage: t-Verteilung Formel deshalb: 𝐶𝐼= 𝑥 ± 𝑡 ( 𝛼 2 ,𝑑𝑓) ∗ 𝜎 𝑥 Kritischer t-Wert abhängig von n und Freiheitsgraden (df = n – 1), daher nicht einheitlich (in Tabelle nachschlagen) Die Standardabweichung wird geschätzt: 𝜎 𝑥 = 𝑖 𝑥 𝑖 − 𝑥 2 /(𝑛−1)

Tests auf Normalverteilung Warum das Ganze? Wie würdet Ihr das machen? Parametrische Verfahren zB Anova, T-Test haben Normalverteilung als Voraussetzung Wenn Normalverteilung nicht erfüllt  anderen Test benutzen, Daten transformieren Diagramm in Excel: Daten gruppieren mit Zählenwenns Bietet Überblick über die Daten. Erkennen ob es nur einen Gipfel gibt, ob sie symmetrisch sind Problem: subjektiv

Q-Q-Plot Durch Bildung des Mittelwertes aus den quadrierten Differenzen lässt sich die Fehlervarianz berechnen 1- Fehlervarianz = Eta²=aufgeklärte Varianz mindestens 70% akzeptabel mindestens 80% gut mindestens 90% sehr gut

Kolmogorov-Smirnov-Test H0=Daten sind normalverteilt p<.05  H1= Daten sind NICHT normalverteilt Könnte auch testen, ob die Daten einer anderen Verteilung folgen (z.B. Poisson)

H0=Daten sind normalverteilt Shapiro-Wilks-Test H0=Daten sind normalverteilt p<.05  H1= Daten sind NICHT normalverteilt Höhere statistische Power  vertrauenswürdiger als KS-Test Nur für Normalverteilung geeignet Statistische Power: findet eher, wenn die Daten nicht normalverteilt sind

Und jetzt Ihr Testet in SPSS, ob die Variable Körpergröße normalverteilt ist Berechnet in Excel beobachtete und erwartete Z-Werte und bewertet Eta²

Der 𝜒2-Test auf Normalverteilung

Der 𝜒2-Test auf Normalverteilung H0= Die Zufallsvariable besitzt die angegebene Verteilung H1=Die Zufallsvariable besitzt nicht die angegebene Verteilung Die Freiheitsgrade df=k-1

Der 𝜒2-Test In Excel berechnen -Beobachtete Häufigkeiten -Erwartete Häufigkeiten, aus den Wahrscheinlichkeiten (E=n*p) -Differenz Beobachtete und Erwartete Häufigkeiten -Diese Differenz zum Quadrat -Um 𝜒2 zu berechnen, teilt man Quadrat durch Erw. Häufigkeit -Signifikanz überprüfen mit p=CHIQ.VERT.RE(𝜒2;df) -Wenn p<0.05 H0 ist abzulehnen Normalverteilung liegt vor

Beispiel: Wir haben IQ Test durchgeführt und wollen wissen, welche IQ Werte im Durchschnitt am häufigsten vorkommen.

Der Test ist signifikant H0 verworfen KEINE Normalverteilung

Nachteile von 𝜒2 Test -nicht besonders trennscharf -benötigen eine große Stichprobe -abhängig von der Anzahl der Freiheitsgrade Alternative: QQ-Plots

Quellen Bortz, J., Schuster, C.: Statistik für Human- und Sozialwissenschaftler. Springer, 2010, 7. Aufl. Fahrmeir, L., Heumann, C., Künstler, R., Pigeot, I., Tutz, G.: Statistik. Der Weg zur Datenanalyse. Springer, 2016, 8. Aufl. Folien von David Kurbel: „Evaluation & Forschungsstrategien, B.Sc.-Seminar Sitzung V: Konfidenzintervalle // Normalverteilungstests“, SoSe 2017. Folien von Malte zum QQ-Plot www.statistikguru.de