Konfidenzintervalle und Tests auf Normalverteilung

Konfidenzintervalle und Tests auf Normalverteilung
Ein Referat von Laura Lellig, Nadezda Malinina und Ann-Kathrin Otte

Aufbau Konfidenzintervalle Tests auf Normalverteilung
Optische Verfahren, QQ-Plot Shapiro-Wilks, Kolmogorov-Smirnov Chi-Quadrat-Test

Konfidenzintervalle

Was wisst ihr schon über Konfidenzintervalle?
Grundlagen Berechnung Mit bekannter Varianz Mit unbekannter Varianz Rechenbeispiel

Wozu braucht man Konfidenzintervalle?
Population Stichprobe 𝜇 ≠ 𝑥

Was sind Konfidenzintervalle?
Neymann (1937): Konfidenzintervalle = Wertebereiche, in denen, ausgehend von einem gemessenen Stichprobenparameter (z.B. 𝑥 ), der zugrundeliegende Populationsparameter (= „wahrer Wert“, z.B. 𝜇) mit einer gewissen Wahrscheinlichkeit liegt

𝛼=𝑆𝑖𝑔𝑛𝑖𝑓𝑖𝑘𝑎𝑛𝑧𝑛𝑖𝑣𝑒𝑎𝑢 Konfidenzkoeffizienten: 1 - 𝛼 = 1- 0,05 = 95% 1 - 𝛼 = 1- 0,01 = 99% Untere Grenze 𝑈𝐺= 𝑥 −1,96∗ 𝜎 𝑥 𝑈𝐺= 𝑥 −2,58∗ 𝜎 𝑥 Obere Grenze 𝑂𝐺= 𝑥 +1,96∗ 𝜎 𝑥 𝑂𝐺= 𝑥 +2,58∗ 𝜎 𝑥

Voraussetzung: normalverteilte Stichprobe
Die Fläche von 1-α wird auch von anderen Perzentil-Paaren eingefasst, aber: 𝑧 𝛼/2 und 𝑧 1−𝛼/2 bilden das kürzeste Intervall 𝑧 𝛼/2 und 𝑧 1−𝛼/2 bilden ein um 𝑥 symmetrisches Intervall In einer standardnormalverteilten Stichprobe ergeben sich daher: Bei α=5%: 𝑧 2,5% =−1,96 𝑢𝑛𝑑 𝑧 97,5% =1,96 Bei α=1%: 𝑧 1% =−2,58 𝑢𝑛𝑑 𝑧 99% =2,58

Wovon hängt die Länge des Konfidenzintervalls ab?
Konfidenzkoeffizient je größer, desto länger Merkmalsvarianz Stichprobenumfang je geringer, desto länger, s.u.

Allgemeine Formel ∆ 𝒌𝒓𝒊𝒕(𝟏−𝜶) = 𝒙 ± 𝒛 𝜶/𝟐 ∗ 𝒔 𝒆
𝑠 𝑒 = Standardfehler (Messfehler zw. Stichprobe und Population): 𝒔 𝒆 = 𝝈 𝒏

Berechnung mit bekannter Varianz
Schritt 1: Daten auf Normalverteilung überprüfen Schritt 2: in Formel enthaltene Parameter bestimmen Mittelwert, Standardfehler Standardabweichung, Stichprobengröße Schritt 3: OG und UG bestimmen

Berechnung mit unbekannter Varianz?
Grundlage: t-Verteilung Formel deshalb: 𝐶𝐼= 𝑥 ± 𝑡 ( 𝛼 2 ,𝑑𝑓) ∗ 𝜎 𝑥 Kritischer t-Wert abhängig von n und Freiheitsgraden (df = n – 1), daher nicht einheitlich (in Tabelle nachschlagen) Die Standardabweichung wird geschätzt: 𝜎 𝑥 = 𝑖 𝑥 𝑖 − 𝑥 2 /(𝑛−1)

Tests auf Normalverteilung
Warum das Ganze? Wie würdet Ihr das machen? Parametrische Verfahren zB Anova, T-Test haben Normalverteilung als Voraussetzung Wenn Normalverteilung nicht erfüllt  anderen Test benutzen, Daten transformieren Diagramm in Excel: Daten gruppieren mit Zählenwenns Bietet Überblick über die Daten. Erkennen ob es nur einen Gipfel gibt, ob sie symmetrisch sind Problem: subjektiv

Q-Q-Plot Durch Bildung des Mittelwertes aus den quadrierten Differenzen lässt sich die Fehlervarianz berechnen 1- Fehlervarianz = Eta²=aufgeklärte Varianz mindestens 70% akzeptabel mindestens 80% gut mindestens 90% sehr gut

Kolmogorov-Smirnov-Test
H0=Daten sind normalverteilt p<.05  H1= Daten sind NICHT normalverteilt Könnte auch testen, ob die Daten einer anderen Verteilung folgen (z.B. Poisson)

H0=Daten sind normalverteilt
Shapiro-Wilks-Test H0=Daten sind normalverteilt p<.05  H1= Daten sind NICHT normalverteilt Höhere statistische Power  vertrauenswürdiger als KS-Test Nur für Normalverteilung geeignet Statistische Power: findet eher, wenn die Daten nicht normalverteilt sind

Und jetzt Ihr Testet in SPSS, ob die Variable Körpergröße normalverteilt ist Berechnet in Excel beobachtete und erwartete Z-Werte und bewertet Eta²

Der 𝜒2-Test auf Normalverteilung

Der 𝜒2-Test auf Normalverteilung
H0= Die Zufallsvariable besitzt die angegebene Verteilung H1=Die Zufallsvariable besitzt nicht die angegebene Verteilung Die Freiheitsgrade df=k-1

Der 𝜒2-Test In Excel berechnen -Beobachtete Häufigkeiten
-Erwartete Häufigkeiten, aus den Wahrscheinlichkeiten (E=n*p) -Differenz Beobachtete und Erwartete Häufigkeiten -Diese Differenz zum Quadrat -Um 𝜒2 zu berechnen, teilt man Quadrat durch Erw. Häufigkeit -Signifikanz überprüfen mit p=CHIQ.VERT.RE(𝜒2;df) -Wenn p<0.05 H0 ist abzulehnen Normalverteilung liegt vor

Beispiel: Wir haben IQ Test durchgeführt und wollen wissen, welche IQ Werte im Durchschnitt am häufigsten vorkommen.

Der Test ist signifikant H0 verworfen KEINE Normalverteilung

Nachteile von 𝜒2 Test -nicht besonders trennscharf
-benötigen eine große Stichprobe -abhängig von der Anzahl der Freiheitsgrade Alternative: QQ-Plots

Quellen Bortz, J., Schuster, C.: Statistik für Human- und Sozialwissenschaftler. Springer, 2010, 7. Aufl. Fahrmeir, L., Heumann, C., Künstler, R., Pigeot, I., Tutz, G.: Statistik. Der Weg zur Datenanalyse. Springer, 2016, 8. Aufl. Folien von David Kurbel: „Evaluation & Forschungsstrategien, B.Sc.-Seminar Sitzung V: Konfidenzintervalle // Normalverteilungstests“, SoSe 2017. Folien von Malte zum QQ-Plot

Konfidenzintervalle und Tests auf Normalverteilung

Ähnliche Präsentationen

Präsentation zum Thema: "Konfidenzintervalle und Tests auf Normalverteilung"— Präsentation transkript:

Ähnliche Präsentationen

Über Projekt

Feedback

Anmelden

Anmeldung über soziales Netzwerk:

Konfidenzintervalle und Tests auf Normalverteilung

Ähnliche Präsentationen

Präsentation zum Thema: "Konfidenzintervalle und Tests auf Normalverteilung"— Präsentation transkript:

Ähnliche Präsentationen

Über Projekt

Feedback