Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
1
Statistische Methoden I
WS 2001/2002 Zur Geschichte der Statistik I. Beschreibende Statistik 1. Grundlegende Begriffe 2. Eindimensionales Datenmaterial 2.1. Der Häufigkeitsbegriff 2.2. Lage- und Streuungsparameter 2.3. Konzentrationsmaße (Lorenz-Kurve) 3. Mehrdimensionales Datenmaterial 3.1. Korrelations- und Regressionsrechnung 3.2. Indexzahlen 3.3. Saisonbereinigung
2
II. Wahrscheinlichkeitstheorie
1. Laplacesche Wahrscheinlicheitsräume 1.1. Kombinatorische Formeln 1.2. Berechnung von Laplace-Wahrschein- lichkeiten 2. Allgemeine Wahrscheinlichkeitsräume 2.1. Der diskrete Fall 2.2. Der stetige Fall 2.3. Unabhängigkeit und bedingte Wahrscheinlichkeit 3. Zufallsvariablen 3.1. Grundbegriffe 3.2. Erwartungswert und Varianz 3.3. Binomial- und Poisson-Verteilung 3.4. Die Normalverteilung und der Zentrale Grenzwertsatz
3
III. Induktive Statistik
1. Schätztheorie 1.1. Grundbegriffe, Stichproben 1.2. Maximum-Likelihood-Schätzer 1.3. Erwartungstreue Schätzer 1.4. Konfidenzintervalle 1.5. Spezialfall Binomial-Verteilung 2. Spezialfall Normalverteilung 2.1. Student- und Chi-Quadrat-Verteilung 2.2. Konfidenzintervalle 3. Tests 3.1. Grundbergriffe 3.2. Tests einfacher Hypothesen (Neyman-Pearson-Test) 3.3. Tests zusammengesetzter Hypothesen 3.4. Vergleich zweier unabhängiger Stichproben 3.5. Chi-Quadrat-Tests 3.6. Kolmogorov-Smirnov-Test 3.7. Einfache Varianzanalyse
4
Wahrscheinlich- keitstheorie Beschreibende Statistik
(= Deskriptive Statistik) Beschreibung von Datenmaterial Teil I Wahrscheinlich- keitstheorie Teil II Schließenden Statistik (= Induktive Statistik) Analyse von Datenmaterial, Hypothesen, Prognosen Teil III
5
Statistische Struktur
(diskreter Fall) Dabei sind:
6
Schätzproblem Schätzer
7
Stichprobe (diskreter Fall)
8
Mathematischer Rahmen
9
Stichprobenfunktionen
Beispiele
10
Stichproben (stetiger Fall)
11
Mathematischer Rahmen
12
Statistische Struktur
diskret stetig
13
Maximum-Likelihood-Schätzer
(diskreter Fall) Likelihood-Funktion M-L-Schätzer mit oder
14
ist die beste Erklärung
Der Parameter ist die beste Erklärung für die Beobachtung
15
M-L-Schätzer Erwarungswert
Normalverteilte Stichprobenvariable M-L-Schätzer Erwarungswert Hier spielt es keine Rolle, ob die Varianz bekannt ist oder nicht. In jedem Fall gilt:
16
Normalverteilte Stichprobenvariable M-L-Schätzer Varianz bekannt
17
Normalverteilte Stichprobenvariable M-L-Schätzer Varianz unbekannt
18
Übersicht
19
Beispiel Gewicht von Äpfeln Gewicht von Äpfeln der Sorte Cox-Orange
aus einem bestimmten italienischen Anbaugebiet
20
Erwartungstreue Schätzer
Wenn der Parameter selbst geschätzt werden soll: Wenn ein allgemeines statistisches Problem vorliegt: Dabei bedeutet der Index , dass der Erwartungswert bzgl. des W.maßes zum Parameter genommen wird.
21
Schätzung des Erwartungswertes der Stichprobenvariablen X
Statistisches Problem gegeben durch: Erwartungstreuer Schätzer:
22
Schätzung der Varianz der Stichprobenvariablen X
Erwartungswert bekannt Statistisches Problem gegeben durch: Erwartungstreuer Schätzer:
23
Schätzung der Varianz der Stichprobenvariablen X
Erwartungswert unbekannt Statistisches Problem gegeben durch: Erwartungstreuer Schätzer:
24
Erwartungstreuer Schätzer für den Erwarungswert
Normalverteilte Stichprobenvariable Erwartungstreuer Schätzer für den Erwarungswert Hier spielt es wieder keine Rolle, ob die Varianz bekannt ist oder nicht. In jedem Fall gilt: ist erwartungstreu
25
Erwartungstreuer Schätzer
Normalverteilte Stichprobenvariable Erwartungstreuer Schätzer für die Varianz bekannt ist erwartungstreu
26
Erwartungstreuer Schätzer
Normalverteilte Stichprobenvariable Erwartungstreuer Schätzer für die Varianz unbekannt ist erwartungstreu Kein M-L-Schätzer!!
27
Übersicht erwartungstreu erwartungstreu erwartungstreu nicht
28
Achtung Aufgabe!
29
Konfidenzintervalle Intervallschätzung Jeder Beobachtung wird
ein Intervall C() der reellen Zahlen zugeordnet Niveau Dabei ist die Wahrscheinlichkeit. eine Beobachtung zu machen, für die der wahre Parameter im zugehörigen Intervall liegt, größer oder gleich 1 -
30
Niveau Das Niveau wird „klein“ gewählt.
(Wir nehmen in unseren Beispielen in den meisten Fällen = 0.05 oder = 0.1) Die Intervallbreite soll möglichst gering sein. Es gibt aber einen Zusammen- hang zwischen der Breite der Konfidenzintervalle und dem Niveau: Niveau kleiner Intervall breiter
31
Beispiel Kaufhaus-Konzern Kauf würde in Erwägung gezogen Kauf würde nicht in Erwägung gezogen 572 1428
32
Der Zentrale Grenzwertsatz
33
Approximative Konfidenzintervalle im Bernoulli-Fall I
Konfidenzintervall zum Niveau
34
Approximative Konfidenzintervalle im Bernoulli-Fall II
Vereinfachung für großes n (n 100)
35
Achtung Aufgabe!
36
für den Erwartungswert
Fall Normalverteilung Konfidenzintervall für den Erwartungswert Varianz bekannt Annahme: Varianz ist bekannt Konfidenzintervalle: wobei
37
für den Erwartungswert
Fall Normalverteilung Konfidenzintervall für den Erwartungswert Varianz unbekannt Student-Verteilung (oder t-Verteilung)
38
Konfidenzintervall für die Varianz Erwartungswert bekannt Einseitig
Fall Normalverteilung Konfidenzintervall für die Varianz Erwartungswert bekannt Einseitig Chi-Quadrat- Verteilung
39
Konfidenzintervall für die Varianz Erwartungswert bekannt zweiseitig
Fall Normalverteilung Konfidenzintervall für die Varianz Erwartungswert bekannt zweiseitig Chi-Quadrat- Verteilung
40
Konfidenzintervall für die Varianz Erwartungswert unbekannt Einseitig
Fall Normalverteilung Konfidenzintervall für die Varianz Erwartungswert unbekannt Einseitig Chi-Quadrat- Verteilung
41
Konfidenzintervall für die Varianz Erwartungswert unbekannt Zweiseitig
Fall Normalverteilung Konfidenzintervall für die Varianz Erwartungswert unbekannt Zweiseitig Chi-Quadrat- Verteilung
42
Achtung Aufgabe!
43
TESTS TESTS TESTS TESTS TESTS TESTS TESTS
44
Worum es geht Man möchte „testen“, ob eine bestimmte
Annahme (Hypothese) über Parameter der Realität entspricht oder nicht. Formulierung einer Hypothese Da man sich in der Statistik nie ganz sicher sein kann: Die „Irrtumswahr- scheinlichkeit“ sollte klein sein. Beobachtung (Stichprobe) Vorgabe: „Irrtumswahr- scheinlichkeit“ Entscheidung
45
Mathematischer Rahmen I
TESTS Mathematischer Rahmen I Gegeben sind: Statistische Struktur Stetiger Fall Diskreter Fall Testproblem (Hypothese) Niveau
46
Ablehnungsbereich Mathematischer Rahmen II Test gegeben durch:
TESTS Mathematischer Rahmen II Test gegeben durch: Ablehnungsbereich Teilmenge der Grund- gesamtheit : Menge aller Beobachtungen , die zur Ablehnung der Hypothese führen
47
Mathematischer Rahmen III
TESTS Mathematischer Rahmen III Beobachtung (Stichprobe) Entweder Oder Beobachtung liegt im Annahmebereich Beobachtung liegt im Ablehnungsbereich Hypothese annehmen! Hypothese ablehnen!
48
Fehler erster und zweiter Art
Entschei- dung Hypothese akzeptiert Hypothese abgelehnt Realität Hypothese wahr Fehler 1. Art Hypothese falsch Fehler 2. Art
49
2 Würfel Fairer Würfel ? 1/6 Gezinkter Würfel ? 1/5
50
für den Erwartungswert
Fall Normalverteilung Test für den Erwartungswert Varianz bekannt
51
für den Erwartungswert
Fall Normalverteilung Test für den Erwartungswert Varianz unbekannt
52
Achtung Aufgabe!
53
Achtung noch eine Aufgabe!
54
Vergleich zweier unabhängiger
Stichproben
55
Vergleich zweier unabhängiger Stichproben 1. Fall
2 unabhängige Stichproben mit Stichprobenvariablen X und Y Annahmen: X und Y normalverteilt Varianz von X = Varianz von Y Hypothese: Erwartungswert von X = Erwartungswert von Y
56
Vergleich zweier unabhängiger Stichproben 1. Fall
Prüfgröße n: Umfang der Stichprobe 1 (Stichprobenvariable X) m: Umfang der Stichprobe 2 (Stichprobenvariable Y) Ablehnungsbereich bestimmt durch
57
Achtung Aufgabe!
58
Vergleich zweier unabhängiger Stichproben 2. Fall
2 unabhängige Stichproben mit Stichprobenvariablen X und Y Annahmen: X und Y normalverteilt n und m groß (> 30), damit Approximation der Varianzen sinnvoll Hypothese: Erwartungswert von X = Erwartungswert von Y
59
Vergleich zweier unabhängiger
Stichproben 2. Fall Ausgangspunkt Approximation Prüfgröße Ablehnungsbereich bestimmt durch
60
Achtung Aufgabe!
61
Chi-Quadrat-Tests
62
Stichprobe vom Umfang n:
Satz von Karl Pearson I X: Stichprobenvariable, die r > 2 verschieden Werte annehmen kann: Die Verteilung von X ist durch einen Wahrscheinlichkeitsvektor gegeben. Stichprobe vom Umfang n:
63
Satz von Karl Pearson II
Dann hat man: Dabei ist:
64
Chi-Quadrat-Test auf Anpassung Hypothese Ablehnungsbereich
65
Fairer Würfel? Hypothese verwerfen!
66
Bakterielle Infektion durch Stämme I, II, III
(siehe: Gelbrich) Vermutung Typ I II III Prozentsatz 30 50 20 Konkrete Stichprobe (80 Infektionen) Typ I II III Anzahl 30 32 18
67
Krankmeldungen Wochentag Mo Di Mi Do Fr n Anzahl Krankmeldungen
68
Achtung Aufgabe!
69
Chi-Quadrat-Test auf Unabhängigkeit I Hypothese Ablehnungsbereich
70
Chi-Quadrat-Test auf Unabhängigkeit II
71
auf Unabhängigkeit III
Chi-Quadrat-Test auf Unabhängigkeit III
72
Berufsstatus Vater - Sohn
38
73
Achtung Aufgabe!
74
Chi-Quadrat-Test auf Homogenität Hypothese Ablehnungsbereich
75
Produktion zweier Betriebe
76
Zusammenhang zwischen Geschlecht und Schulbildung
77
Mathe-Test Klasse 9 1. Versuch
78
Mathe-Test Klasse 9 2. Versuch
79
Achtung Aufgabe!
80
Übersicht Chi-Quadrat-Tests
81
Test auf Unabhängigkeit
Faustregeln Chi-Quadrat-Tests Test auf Anpassung Test auf Unabhängigkeit Test auf Homogenität
82
Kolmogorov-Smirnov-Test
83
Testen, ob die Stichproben- variable eine vorgegebene
Problem: Testen, ob die Stichproben- variable eine vorgegebene stetige Verteilung besitzt
84
Kolmogorov-Smirnov-Test I
Durchführung Kolmogorov-Smirnov-Test I Berechnung Hypothese Abstände berechnen und )
85
Kolmogorov-Smirnov-Test II
Durchführung Kolmogorov-Smirnov-Test II Arbeitstabelle Maximum der Werte der letzten beiden Spalten
86
Kolmogorov-Smirnov-Test III
Durchführung Kolmogorov-Smirnov-Test III Ablehnungsbereich Niveau 0.05
87
Einfache Varianzanalyse
88
Stichprobenvariablen
Problem: Testen, ob unabhängige Stichprobenvariablen die selbe Normal- verteilung besitzen
89
Mittelwerte der Klassen
und Gesamtmittelwert
90
Durchführung der einfachen Varianzanalyse I
N: Gesamtumfang der Stichproben r: Zahl der Betriebe Benötigte Daten: Mittelwerte und Varianzen der einzelnen Betriebe Gesamtmittelwert Berechnung von Q : Maß für die Varianz innerhalb der einzelnen Betriebe 1 1 Q : Maß für die Varianz zwischen den Betrieben 2 2
91
Durchführung der einfachen
Varianzanalyse II
92
Durchführung der einfachen
Varianzanalyse III Berechnung von Bestimmung von Ablehnungsbereich
93
Viel Erfolg bei der Klausur!!!
Ähnliche Präsentationen
© 2025 SlidePlayer.org Inc.
All rights reserved.