Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
Veröffentlicht von:Markus Fiedler Geändert vor über 5 Jahren
1
Konfidenzintervalle und Tests auf Normalverteilung
Ein Referat von Laura Lellig, Nadezda Malinina und Ann-Kathrin Otte
2
Aufbau Konfidenzintervalle Tests auf Normalverteilung
Optische Verfahren, QQ-Plot Shapiro-Wilks, Kolmogorov-Smirnov Chi-Quadrat-Test
3
Konfidenzintervalle
4
Was wisst ihr schon über Konfidenzintervalle?
Grundlagen Berechnung Mit bekannter Varianz Mit unbekannter Varianz Rechenbeispiel
5
Wozu braucht man Konfidenzintervalle?
Population Stichprobe 𝜇 ≠ 𝑥
6
Was sind Konfidenzintervalle?
Neymann (1937): Konfidenzintervalle = Wertebereiche, in denen, ausgehend von einem gemessenen Stichprobenparameter (z.B. 𝑥 ), der zugrundeliegende Populationsparameter (= „wahrer Wert“, z.B. 𝜇) mit einer gewissen Wahrscheinlichkeit liegt
7
𝛼=𝑆𝑖𝑔𝑛𝑖𝑓𝑖𝑘𝑎𝑛𝑧𝑛𝑖𝑣𝑒𝑎𝑢 Konfidenzkoeffizienten: 1 - 𝛼 = 1- 0,05 = 95% 1 - 𝛼 = 1- 0,01 = 99% Untere Grenze 𝑈𝐺= 𝑥 −1,96∗ 𝜎 𝑥 𝑈𝐺= 𝑥 −2,58∗ 𝜎 𝑥 Obere Grenze 𝑂𝐺= 𝑥 +1,96∗ 𝜎 𝑥 𝑂𝐺= 𝑥 +2,58∗ 𝜎 𝑥
8
Voraussetzung: normalverteilte Stichprobe
Die Fläche von 1-α wird auch von anderen Perzentil-Paaren eingefasst, aber: 𝑧 𝛼/2 und 𝑧 1−𝛼/2 bilden das kürzeste Intervall 𝑧 𝛼/2 und 𝑧 1−𝛼/2 bilden ein um 𝑥 symmetrisches Intervall In einer standardnormalverteilten Stichprobe ergeben sich daher: Bei α=5%: 𝑧 2,5% =−1,96 𝑢𝑛𝑑 𝑧 97,5% =1,96 Bei α=1%: 𝑧 1% =−2,58 𝑢𝑛𝑑 𝑧 99% =2,58
9
Wovon hängt die Länge des Konfidenzintervalls ab?
Konfidenzkoeffizient je größer, desto länger Merkmalsvarianz Stichprobenumfang je geringer, desto länger, s.u.
10
Allgemeine Formel ∆ 𝒌𝒓𝒊𝒕(𝟏−𝜶) = 𝒙 ± 𝒛 𝜶/𝟐 ∗ 𝒔 𝒆
𝑠 𝑒 = Standardfehler (Messfehler zw. Stichprobe und Population): 𝒔 𝒆 = 𝝈 𝒏
11
Berechnung mit bekannter Varianz
Schritt 1: Daten auf Normalverteilung überprüfen Schritt 2: in Formel enthaltene Parameter bestimmen Mittelwert, Standardfehler Standardabweichung, Stichprobengröße Schritt 3: OG und UG bestimmen
12
Berechnung mit unbekannter Varianz?
Grundlage: t-Verteilung Formel deshalb: 𝐶𝐼= 𝑥 ± 𝑡 ( 𝛼 2 ,𝑑𝑓) ∗ 𝜎 𝑥 Kritischer t-Wert abhängig von n und Freiheitsgraden (df = n – 1), daher nicht einheitlich (in Tabelle nachschlagen) Die Standardabweichung wird geschätzt: 𝜎 𝑥 = 𝑖 𝑥 𝑖 − 𝑥 2 /(𝑛−1)
13
Tests auf Normalverteilung
Warum das Ganze? Wie würdet Ihr das machen? Parametrische Verfahren zB Anova, T-Test haben Normalverteilung als Voraussetzung Wenn Normalverteilung nicht erfüllt anderen Test benutzen, Daten transformieren Diagramm in Excel: Daten gruppieren mit Zählenwenns Bietet Überblick über die Daten. Erkennen ob es nur einen Gipfel gibt, ob sie symmetrisch sind Problem: subjektiv
15
Q-Q-Plot Durch Bildung des Mittelwertes aus den quadrierten Differenzen lässt sich die Fehlervarianz berechnen 1- Fehlervarianz = Eta²=aufgeklärte Varianz mindestens 70% akzeptabel mindestens 80% gut mindestens 90% sehr gut
16
Kolmogorov-Smirnov-Test
H0=Daten sind normalverteilt p<.05 H1= Daten sind NICHT normalverteilt Könnte auch testen, ob die Daten einer anderen Verteilung folgen (z.B. Poisson)
17
H0=Daten sind normalverteilt
Shapiro-Wilks-Test H0=Daten sind normalverteilt p<.05 H1= Daten sind NICHT normalverteilt Höhere statistische Power vertrauenswürdiger als KS-Test Nur für Normalverteilung geeignet Statistische Power: findet eher, wenn die Daten nicht normalverteilt sind
18
Und jetzt Ihr Testet in SPSS, ob die Variable Körpergröße normalverteilt ist Berechnet in Excel beobachtete und erwartete Z-Werte und bewertet Eta²
19
Der 𝜒2-Test auf Normalverteilung
20
Der 𝜒2-Test auf Normalverteilung
H0= Die Zufallsvariable besitzt die angegebene Verteilung H1=Die Zufallsvariable besitzt nicht die angegebene Verteilung Die Freiheitsgrade df=k-1
21
Der 𝜒2-Test In Excel berechnen -Beobachtete Häufigkeiten
-Erwartete Häufigkeiten, aus den Wahrscheinlichkeiten (E=n*p) -Differenz Beobachtete und Erwartete Häufigkeiten -Diese Differenz zum Quadrat -Um 𝜒2 zu berechnen, teilt man Quadrat durch Erw. Häufigkeit -Signifikanz überprüfen mit p=CHIQ.VERT.RE(𝜒2;df) -Wenn p<0.05 H0 ist abzulehnen Normalverteilung liegt vor
22
Beispiel: Wir haben IQ Test durchgeführt und wollen wissen, welche IQ Werte im Durchschnitt am häufigsten vorkommen.
29
Der Test ist signifikant H0 verworfen KEINE Normalverteilung
30
Nachteile von 𝜒2 Test -nicht besonders trennscharf
-benötigen eine große Stichprobe -abhängig von der Anzahl der Freiheitsgrade Alternative: QQ-Plots
31
Quellen Bortz, J., Schuster, C.: Statistik für Human- und Sozialwissenschaftler. Springer, 2010, 7. Aufl. Fahrmeir, L., Heumann, C., Künstler, R., Pigeot, I., Tutz, G.: Statistik. Der Weg zur Datenanalyse. Springer, 2016, 8. Aufl. Folien von David Kurbel: „Evaluation & Forschungsstrategien, B.Sc.-Seminar Sitzung V: Konfidenzintervalle // Normalverteilungstests“, SoSe 2017. Folien von Malte zum QQ-Plot
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.