Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
Veröffentlicht von:Walborg Radmacher Geändert vor über 11 Jahren
1
Induktive Statistik
2
Statistische Struktur (diskreter Fall) Dabei sind:
3
Schätzproblem Schätzer
4
Ω Θ Modell Beobachtung (Stichprobe) Grundgesamtheit (mögliche Beobachtungen) Schätzung
5
Ω Θ Modell Beobachtung (Stichprobe) Grundgesamtheit (mögliche Beobachtungen) Schätzung E g
6
Stichprobe (diskreter Fall)
7
Mathematischer Rahmen
8
Statistische Struktur diskret stetig
9
Maximum-Likelihood-Schätzer ( diskreter Fall) Likelihood-Funktion mit oder M-L-Schätzer
10
Der Parameter ist die beste Erklärung für die Beobachtung
11
Likelihood-Funktion
12
Der Logharithmus ln x ist streng monoton wachsend
13
Beispiel Poisson-Verteilung Stichprobe vom Umfang n mit Poisson-verteilter Stich- Probenvariablen (Intensität: ) M-L-Schätzer für oder
14
Beispiel Bernoulli-Verteilung Stichprobe vom Umfang n mit Bernoulli- verteilter Stichprobenvariablen (p: Wahrscheinlichkeit des Ereignisses) M-L-Schätzer für p wieder gegeben durch:
15
Maximum-Likelihood-Schätzer (stetiger Fall) Likelihood-Funktion mit oder M-L-Schätzer
16
Der Parameter ist die beste Erklärung für die Beobachtung
17
Normalverteilte Stichprobenvariable M-L-Schätzer Erwartungswert Hier spielt es keine Rolle, ob die Varianz bekannt ist oder nicht. In jedem Fall gilt:
18
Normalverteilte Stichprobenvariable M-L-Schätzer Varianz bekannt
19
Normalverteilte Stichprobenvariable M-L-Schätzer Varianz unb ekannt
20
Übersicht
21
Erwartungstreue Schätzer Wenn der Parameter selbst geschätzt werden soll: Wenn ein allgemeines statistisches Problem vorliegt: Dabei bedeutet der Index, dass der Erwartungswert bzgl. des W.maßes zum Parameter genommen wird.
22
Schätzung des Erwartungswertes der Stichprobenvariablen X Statistisches Problem gegeben durch: Erwartungstreuer Schätzer:
23
Schätzung der Varianz der Stichprobenvariablen X Statistisches Problem gegeben durch: Erwartungstreuer Schätzer: Erwartungswert bekannt
24
Schätzung der Varianz der Stichprobenvariablen X Statistisches Problem gegeben durch: Erwartungstreuer Schätzer: Erwartungswert unbekannt
25
Normalverteilte Stichprobenvariable Erwartungstreuer Schätzer für den Erwarungswert Hier spielt es wieder keine Rolle, ob die Varianz bekannt ist oder nicht. In jedem Fall gilt: erwartungstreu ist erwartungstreu
26
Normalverteilte Stichprobenvariable Erwartungstreuer Schätzer für die Varianz bekannt erwartungstreu ist erwartungstreu
27
Normalverteilte Stichprobenvariable Erwartungstreuer Schätzer für die Varianz unb ekannt erwartungstreu ist erwartungstreu Kein M-L-Schätzer!!
28
Übersicht erwartungstreu erwartungstreu erwartungstreu nicht erwartungstreu
29
Aufgabe 1
30
0,5156 bzw. 0,5457 0,4879 0,5156 0,7745 In (a) ergeben sich M-L-Schätzer bzw. erwartungstreuer Schätzer des Erwartungswertes zu
31
0,0534 bzw. 0,06 0,00534 bzw. 0,006 0,333 bzw. 0,523 0,1234 bzw. 0,4321 In (a) ergeben sich M-L-Schätzer bzw. erwartungstreuer Schätzer der Varianz zu
32
Konfidenzintervalle Intervallschätzung Jeder Beobachtung wird ein Intervall C( ) der reellen Zahlen zugeordnet Niveau Dabei ist die Wahrscheinlichkeit, eine Beobachtung zu machen, für die der wahre Parameter im zugehörigen Intervall liegt, größer oder gleich 1 -
33
Niveau klein Das Niveau wird klein gewählt. (Wir nehmen in unseren Beispielen in den meisten Fällen = 0.05 oder = 0.1) Zusammenhang Es gibt aber einen Zusammenhang zwischen der Breite der Konfidenzintervalle und dem Niveau: Niveau kleiner Intervall breiter Die Intervallbreite soll möglichst gering sein.
34
Konfidenzintervall für den Erwartungswert Varianz bekannt Annahme: Konfidenzintervalle: wobei
35
Die Gauß- oder Normalverteilung
36
Dichte Verteilung Verteilungsfunktion
37
Erwartungswert Varianz
38
Approximative Konfidenzintervalle im Bernoulli-Fall I Konfidenzintervall zum Niveau
39
Approximative Konfidenzintervalle im Bernoulli-Fall II Vereinfachung für großes n (n 100)
40
Aufgabe 2
41
Die Punktschätzung für den Anteil der Verkehrsunfälle mit Fahrerflucht beträgt 0,9722 0,6225 0,3476 0,2628
42
Welchen γ–Wert legen Sie der Bestimmung des approximativen 95%-Konfidenzintervalls zu Grunde? t-Verteilung mit 1,76 t-Veretilung mit 2,96 Normalverteilung mit 1,67 Normalverteilung mit 1,96
43
Geben Sie das approximative 95%-Konfidenzintervall an: [0,345; 0,789] [0,25; 0,30] [0,244; 0,282] [0,264; 0,274]
44
Die Student- oder t-Verteilung Hängt von Parameter n ab!
45
Die Student- oder t-Verteilung Wahrscheinlichkeitsdichte Die Konstante d ist dabei:
46
Die Chi-Quadrat-Verteilung Hängt ebenfalls von Parameter n ab!
47
Die Chi-Quadrat-Verteilung Wahrscheinlichkeitsdichte Die Konstante c ist dabei: : Gamma-Funktion
48
unabhängige Für n unabhängige Zufallsvariablen mit hat man: Mathematische Bedeutung der Chi-Quadrat-Verteilung
49
unabhängige Für unabhängige Zufallsvariablen W und U mit hat man: Mathematische Bedeutung der t-Verteilung
50
Konfidenzintervall für den Erwartungswert Varianz unbekannt Student-Verteilung (oder t-Verteilung)
51
Übersicht Konfidenzintervalle für den Erwartungswert
52
Aufgabe 3
53
Verwendung der Tafel für die Normalvertreilung
54
TESTS
55
Worum es geht Man möchte testen, ob eine bestimmte Annahme (Hypothese) über Parameter der Realität entspricht oder nicht. Beobachtung (Stichprobe) Entscheidung Vorgabe: Irrtumswahrscheinlichkeit Formulierung einer HypotheseNullhypothese In der Statistik kann man nie ganz sicher sein. Die Irrtumswahrscheinlichkeit sollte wenigstens klein sein.
56
Mathematischer Rahmen I TESTS Statistische Struktur Testproblem (Hypothese)Nullhypothese Gegeben sind: Stetiger Fall Diskreter Fall Niveau
57
Mathematischer Rahmen II TESTS Test Test gegeben durch: Ablehnungsbereich Teilmenge der Grundgesamtheit : Menge aller Beobachtungen, die zur Ablehnung der Hypothese führen
58
Mathematischer Rahmen III TESTS Beobachtung (Stichprobe) Entweder Oder Beobachtung liegt im Annahmebereich Beobachtung liegt im Ablehnungsbereich Hypothese annehmen! Hypothese ablehnen!
59
Fehler erster und zweiter Art
60
Hypotheseakzeptiert Hypothese abgelehnt Hypothesewahr Hypothese falschEntscheidungRealität Fehler 1. Art Fehler 2. Art
61
Niveau und Macht Obere Grenze für die Wahrscheinlichkeit, Fehler 1. Art einen Fehler 1. Art zu begehen Niveau Wahrscheinlichkeit, Fehler 2. Art keinen Fehler 2. Art zu begehen, wenn der wahre Parameterwert in dem Punkt liegt Macht Macht in einem Punkt der Alternative
62
Test für den Erwartungswert Varianz bekannt Fall Normalverteilung
63
Test für den Erwartungswert Varianz unbekannt Fall Normalverteilung
64
Aufgabe 4
65
Formulieren Sie in (a) die richtige Nullhypothese! H 0 = {µ 220} H 0 = {µ = 220} H 1 = {µ 220} H 0 = {µ > 220}
66
In (a) beträgt der kritische Wert für den Ablehnungsbereich: γ = 1,96 γ = 2,03 γ = 3,262 γ = 2,262
67
In (a) ist der zutreffende Wert der Prüfgröße T = 1,1678 T = 0,923 T = -2,546 T = 2,247
68
Treffen Sie die passende Testentscheidung! T > γ : Nullhypothese wird verworfen T γ : Nullhypothese wird angenommen T = γ : Nullhypothese wird angenommen T > γ : Nullhypothese wird angenommen
69
Aufgabe 5
70
1. Fall Vergleich zweier unabhängiger Stichproben 1. Fall 2 unabhängige Stichproben mit Stichprobenvariablen X und Y Annahmen: X und Y normalverteilt Varianz von X = Varianz von Y Hypothese: Erwartungswert von X = Erwartungswert von Y
71
1. Fall Vergleich zweier unabhängiger Stichproben 1. Fall Prüfgröße n: Umfang der Stichprobe 1 (Stichprobenvariable X) m: Umfang der Stichprobe 2 (Stichprobenvariable Y) Ablehnungsbereich bestimmt durch
72
Aufgabe 6
73
2. Fall Vergleich zweier unabhängiger Stichproben 2. Fall 2 unabhängige Stichproben mit Stichprobenvariablen X und Y Annahmen: X und Y normalverteilt n und m groß (> 30), damit Approximation der Varianzen sinnvoll Hypothese: Erwartungswert von X = Erwartungswert von Y
74
2. Fall Vergleich zweier unabhängiger Stichproben 2. Fall Ausgangspunkt Approximation Prüfgröße Ablehnungsbereich bestimmt durch
75
Aufgabe 7
76
Formulieren Sie die richtige Nullhypothese! H 0 : µ x µ y H 0 : µ x = µ y H 0 : µ x = 0 H 0 : µ x < µ y
77
Geben Sie den korrekten Ablehnungsbereich an! γ } A 1 = { |Z| < γ } γ } A 1 = { |Z| = γ } γ } A 1 = { |Z| > γ } γ } A 1 = { |Z| γ }
78
Der zutreffende Wert der Prüfgröße ist: |Z| = 1,22 |Z| = 3,44 |Z| = 2,11 |Z| = 1,45
79
Treffen Sie die passende Testentscheidung! H 0 wird abgelehnt, da |Z| < 2 H 0 wird angenommen, da |Z| γ H 0 wird abgelehnt, da |Z| = 244,8 H 0 wird angenommen, da |Z| > γ
80
Chi-Quadrat-Tests
81
Chi-Quadrat-Test auf Anpassung Hypothese Ablehnungsbereich
82
Fairer Würfel? Hypothese verwerfen!
83
Bakterielle Infektion durch Stämme I, II, III Vermutung Konkrete Stichprobe (80 Infektionen) (siehe: Gelbrich) Typ Prozentsatz IIIIII 30 5020 Anzahl IIIIII Typ 303218
84
Mendelsche Gesetze rund und gelb runzelig runzelig und gelb rund und grün runzelig runzelig und grün 0.5625 0.1875 0.0625 Prozentsätze nach der Theorie
85
rund und gelb runzelig runzelig und gelb rund und grün runzelig runzelig und grün 271 88 93 28 Beobachtete Häufigkeiten Summe 480
86
Krankmeldungen Wochentag Mo Di Mi Do Fr n 44 28 24 20 34 150 Anzahl Krankmeldungen
87
Aufgabe 8
88
Die Faustregel ist erfüllt, da 0,03 x 210 = 6,3 5 0,3 x 210 = 63 50 2 x 21 = 42 50 0,2 x 21 = 4,2 1
89
Geben Sie den korrekten Ablehnungsbereich an! A 1 = {V 2 > 10,456} A 1 = {V 2 > 9,488} A 1 = {V 2 > 0} A 1 = {V 2 > -9,488}
90
Man kann hier den folgenden Test einsetzen: χ 2 -Test auf Homogenität χ 2 -Test auf Freiheitsgrade χ 2 -Test auf Unabhängigkeit χ 2 -Test auf Anpassung
91
Bestimmen Sie den zutreffenden Prüfgrößenwert! V 2 = 4,34 V 2 = 5,34 V 2 = 6,34 V 2 = 3,34
92
Zu testen ist hier die Verteilung: (0,22; 0,15; 0,5; 0,1; 0,03) (0,12; 0,25; 0,5; 0,1; 0,03) (0,12; 0,25; 0,6; 0,1; 0,03) (0,12; 0,2; 0,55; 0,1; 0,03)
93
Treffen Sie die korrekte Testentscheidung! V 2 γ : H 0 wird angenommen V 2 < γ : H 0 wird verworfen V 2 > γ : H 0 wird angenommen V 2 > γ : H 1 wird angenommen
94
Chi-Quadrat-Test auf Unabhängigkeit I
95
Chi-Quadrat-Test auf Unabhängigkeit II Hypothese Ablehnungsbereich
96
Chi-Quadrat-Test auf Unabhängigkeit III
97
Berufsstatus Vater - Sohn 38 X Y
99
Sonntagsfrage (Fahrmeir/Künstler/Pigeot/Tutz) Die Ergebnisse der Sonntagsfrage: Welche Partei würden Sie wählen, wenn am nächsten Sonntag Bundestagswahlen wären? sind für den Be- fragungszeitraum 11.1. - 24.1.1995 in der folgenden Tabelle wiedergegeben:
100
Das Untersuchungsziel ist festzustellen, ob die voneinander abweichenden Häufigkeiten für Männer und Frauen rein zufällige Schwankungen Darstellen oder ob zwischen Geschlecht und Partei- präferenz ein Zusammenhang besteht. Nullhypothese: Zwischen Geschlecht und Parteipräferenz besteht kein Zusammenhang
101
Chi-Quadrat-Test auf Unabhängigkeit zum Niveau = 0.05
102
Aufgabe 9
103
Chi-Quadrat-Test auf Homogenität Hypothese Ablehnungsbereich
104
Produktion zweier Betriebe
105
KREDITWÜRDIGKEIT Eine Bank steht vor dem Problem, einen potentiellen Kreditnehmer einzuschätzen und den Kredit zu vergeben, oder ihn der Klasse der Problemfälle zuzuordnen und auf das Kreditgeschäft zu verzichten bzw.eine genauere Prüfung vorzunehmen. Gesucht wird ein Prädikator für die Kreditwürdigkeit. Hierzu werden 1000 Konsumentenkredite betrachtet. Für jeden Kunden aus dieser Stichprobe ist seine Kredit- würdigkeit X bekannt. Als weiteres Merkmal Y wird notiert, ob der Kunde ein laufendes Konto bei der Bank unterhält und, wenn ja, ob es gut oder mittel geführt wird. (Fahrmeir/Künstler/Pigeot/Tutz)
106
Kreditwürdigkeit Merkmal X: Kreditwürdigkeit Konto Merkmal Y: Konto Wertungen kein Konto gut geführt mittel gut geführt
107
Chi-Quadrat-Test auf Homogenität zum Niveau = 0.05 Nullhypothese: Verteilung auf die Kategorien des Merkmals Konto ist für unproblematische Kreditnehmer und für Problemkunden gleich
108
Aufgabe 10
109
Aufgabe 11
110
Aufgabe 12
111
Chi-Quadrat-Tests Übersicht
112
Faustregeln Chi-Quadrat-Tests Test auf Anpassung Test auf Unabhängigkeit Test auf Homogenität
113
Kolmogorov-Smirnov-Test wird eingesetzt, wenn getestet werden soll, ob eine bestimmte stetige Verteilung vorliegt.
114
Durchführung Kolmogorov-Smirnov-Test I Berechnung Abstände berechnen ) Hypothese
115
Durchführung Kolmogorov-Smirnov-Test II Arbeitstabelle Maximum der Werte der letzten beiden Spalten
116
Durchführung Kolmogorov-Smirnov-Test III Ablehnungsbereich Niveau 0.05
117
Durchmesser von Schrauben
118
Arbeitstabelle
119
Durchmesser von Schrauben und nicht spezifiziert Arbeitstabelle
120
Einfache Varianzanalyse wird eingesetzt, wenn mehr als 2 unabhängige normalverteilte Stichproben verglichen werden sollen, deren Varianz als übereinstimmend angenommen werden kann.
121
Datenliste
122
Gewicht eines Werkstückes bei 3 Betrieben (in kg)
123
Mittelwerte der Klassen und Gesamtmittelwert
124
Mittelwert Betrieb 1 Mitttelwert Betrieb 2 Mittelwert Betrieb 3 Gesamt- Mittelwert
125
F-Verteilung für verschiedene Freiheitsgrade m, n
126
Die F-Verteilung Wahrscheinlichkeitsdichte : Gamma-Funktion
127
Durchführung der einfachen Varianzanalyse I Mittelwerte und Varianzen der einzelnen Betriebe Gesamtmittelwert N: Gesamtumfang der Stichproben; r: Zahl der Betriebe 1 2 Q : Maß für die Varianz innerhalb der einzelnen Betriebe Q : Maß für die Varianz zwischen den Betrieben 1 2 Berechnung von Benötigte Daten:
128
Durchführung der einfachen Varianzanalyse II
129
Durchführung der einfachen Varianzanalyse III Bestimmung von Ablehnungsbereich Berechnung von
130
Viel Erfolg bei der Klausur!!!
Ähnliche Präsentationen
© 2025 SlidePlayer.org Inc.
All rights reserved.