Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
1
Induktive Statistik
2
Statistische Struktur
(diskreter Fall) Dabei sind:
3
Schätzproblem Schätzer
4
(mögliche Beobachtungen)
Grundgesamtheit (mögliche Beobachtungen) Ω Beobachtung (Stichprobe) Schätzung Modell Θ
5
(mögliche Beobachtungen)
Grundgesamtheit (mögliche Beobachtungen) Ω Beobachtung (Stichprobe) Schätzung Modell g Θ E
6
Stichprobe (diskreter Fall)
7
Mathematischer Rahmen
8
Statistische Struktur
diskret stetig
9
Maximum-Likelihood-Schätzer
(diskreter Fall) Likelihood-Funktion M-L-Schätzer mit oder
10
ist die beste Erklärung für die
Der Parameter ist die beste Erklärung für die Beobachtung
11
Likelihood-Funktion
12
Der Logharithmus ln x ist streng monoton wachsend
13
Beispiel Poisson-Verteilung
Stichprobe vom Umfang n mit Poisson-verteilter Stich- Probenvariablen (Intensität: ) M-L-Schätzer für oder
14
Beispiel Bernoulli-Verteilung
Stichprobe vom Umfang n mit Bernoulli- verteilter Stichprobenvariablen (p: Wahrscheinlichkeit des Ereignisses) M-L-Schätzer für p wieder gegeben durch:
15
Maximum-Likelihood-Schätzer
(stetiger Fall) Likelihood-Funktion M-L-Schätzer mit oder
16
ist die beste Erklärung für die
Der Parameter ist die beste Erklärung für die Beobachtung
17
Beispiel Bernoulli-Verteilung
Stichprobe vom Umfang n mit Bernoulli- verteilter Stichprobenvariablen (p: Wahrscheinlichkeit des Ereignisses) M-L-Schätzer für p wieder gegeben durch:
18
M-L-Schätzer Erwartungswert
Normalverteilte Stichprobenvariable M-L-Schätzer Erwartungswert Hier spielt es keine Rolle, ob die Varianz bekannt ist oder nicht. In jedem Fall gilt:
19
Normalverteilte Stichprobenvariable M-L-Schätzer Varianz bekannt
20
Normalverteilte Stichprobenvariable M-L-Schätzer Varianz unbekannt
21
Übersicht
22
Aufgabe 1
23
Erwartungstreue Schätzer
Wenn der Parameter selbst geschätzt werden soll: Wenn ein allgemeines statistisches Problem vorliegt: Dabei bedeutet der Index , dass der Erwartungswert bzgl. des W.maßes zum Parameter genommen wird.
24
Schätzung des Erwartungswertes der Stichprobenvariablen X
Statistisches Problem gegeben durch: Erwartungstreuer Schätzer:
25
Schätzung der Varianz der Stichprobenvariablen X
Erwartungswert bekannt Statistisches Problem gegeben durch: Erwartungstreuer Schätzer:
26
Schätzung der Varianz der Stichprobenvariablen X
Erwartungswert unbekannt Statistisches Problem gegeben durch: Erwartungstreuer Schätzer:
27
Normalverteilte Stichprobenvariable Erwartungstreuer Schätzer
für den Erwarungswert Hier spielt es wieder keine Rolle, ob die Varianz bekannt ist oder nicht. In jedem Fall gilt: ist erwartungstreu
28
Normalverteilte Stichprobenvariable Erwartungstreuer Schätzer
für die Varianz bekannt ist erwartungstreu
29
Normalverteilte Stichprobenvariable Erwartungstreuer Schätzer
für die Varianz unbekannt ist erwartungstreu Kein M-L-Schätzer!!
30
Übersicht nicht erwartungstreu erwartungstreu erwartungstreu
31
Konfidenzintervalle Intervallschätzung
Jeder Beobachtung wird ein Intervall C() der reellen Zahlen zugeordnet Niveau Dabei ist die Wahrscheinlichkeit, eine Beobachtung zu machen, für die der wahre Parameter im zugehörigen Intervall liegt, größer oder gleich 1 -
32
Niveau Das Niveau wird „klein“ gewählt.
(Wir nehmen in unseren Beispielen in den meisten Fällen = 0.05 oder = 0.1) Die Intervallbreite soll möglichst gering sein. Es gibt aber einen Zusammenhang zwischen der Breite der Konfidenzintervalle und dem Niveau: Niveau kleiner Intervall breiter
33
Konfidenzintervall für den Erwartungswert
Varianz bekannt Annahme: Konfidenzintervalle: wobei
34
Die Gauß- oder Normalverteilung
35
Dichte Verteilung Verteilungsfunktion
36
Erwartungswert Varianz
37
Approximative Konfidenzintervalle im Bernoulli-Fall I
Konfidenzintervall zum Niveau
38
Approximative Konfidenzintervalle im Bernoulli-Fall II
Vereinfachung für großes n (n 100)
39
Aufgabe 2
40
Die Student- oder t-Verteilung
Hängt von Parameter n ab!
41
Die Student- oder t-Verteilung
Wahrscheinlichkeitsdichte Die Konstante d ist dabei:
42
Die Chi-Quadrat-Verteilung
Hängt ebenfalls von Parameter n ab!
43
Die Chi-Quadrat-Verteilung
Wahrscheinlichkeitsdichte Die Konstante c ist dabei: : Gamma-Funktion
44
Mathematische Bedeutung der Chi-Quadrat-Verteilung
Für n unabhängige Zufallsvariablen mit hat man:
45
Mathematische Bedeutung der t-Verteilung
Für unabhängige Zufallsvariablen W und U mit hat man:
46
Konfidenzintervall für den Erwartungswert
Varianz unbekannt Student-Verteilung (oder t-Verteilung)
47
Übersicht Konfidenzintervalle für den Erwartungswert
48
Aufgabe 3
49
für die Normalvertreilung
Verwendung der Tafel für die Normalvertreilung
50
TESTS TESTS TESTS TESTS TESTS TESTS TESTS
51
Worum es geht Man möchte „testen“, ob eine bestimmte Annahme (Hypothese) über Parameter der Realität entspricht oder nicht. Formulierung einer Hypothese Nullhypothese In der Statistik kann man nie ganz sicher sein. Die „Irrtumswahrscheinlichkeit“ sollte wenigstens klein sein. Beobachtung (Stichprobe) Vorgabe: „Irrtumswahrscheinlichkeit“ Entscheidung
52
Mathematischer Rahmen I
TESTS Mathematischer Rahmen I Gegeben sind: Statistische Struktur Stetiger Fall Diskreter Fall Testproblem (Hypothese) Nullhypothese Niveau
53
Ablehnungsbereich Mathematischer Rahmen II Test gegeben durch:
TESTS Mathematischer Rahmen II Test gegeben durch: Ablehnungsbereich Teilmenge der Grundgesamtheit : Menge aller Beobachtungen , die zur Ablehnung der Hypothese führen
54
Mathematischer Rahmen III
TESTS Mathematischer Rahmen III Beobachtung (Stichprobe) Entweder Oder Beobachtung liegt im Annahmebereich Beobachtung liegt im Ablehnungsbereich Hypothese annehmen! Hypothese ablehnen!
55
Fehler erster und zweiter Art
56
Entscheidung Hypothese akzeptiert Hypothese abgelehnt Realität Hypothese wahr Fehler 1. Art Hypothese falsch Fehler 2. Art
57
Niveau und Macht Obere Grenze für die Wahrscheinlichkeit,
einen Fehler 1. Art zu begehen Niveau Wahrscheinlichkeit, keinen Fehler 2. Art zu begehen, wenn der wahre Parameterwert in dem Punkt liegt Macht in einem Punkt der Alternative
58
Test für den Erwartungswert
Fall Normalverteilung Test für den Erwartungswert Varianz bekannt
59
Test für den Erwartungswert
Fall Normalverteilung Test für den Erwartungswert Varianz unbekannt
60
Aufgabe 4
61
Aufgabe 5
62
Vergleich zweier unabhängiger Stichproben 1. Fall
2 unabhängige Stichproben mit Stichprobenvariablen X und Y Annahmen: X und Y normalverteilt Varianz von X = Varianz von Y Hypothese: Erwartungswert von X = Erwartungswert von Y
63
Vergleich zweier unabhängiger Stichproben 1. Fall
Prüfgröße n: Umfang der Stichprobe 1 (Stichprobenvariable X) m: Umfang der Stichprobe 2 (Stichprobenvariable Y) Ablehnungsbereich bestimmt durch
64
Aufgabe 6
65
Vergleich zweier unabhängiger Stichproben 2. Fall
2 unabhängige Stichproben mit Stichprobenvariablen X und Y Annahmen: X und Y normalverteilt n und m groß (> 30), damit Approximation der Varianzen sinnvoll Erwartungswert von X = Erwartungswert von Y Hypothese:
66
Vergleich zweier unabhängiger Stichproben 2. Fall
Ausgangspunkt Approximation Prüfgröße Ablehnungsbereich bestimmt durch
67
Aufgabe 7
68
Chi-Quadrat-Tests
69
Chi-Quadrat-Test auf Anpassung
Hypothese Ablehnungsbereich
70
Fairer Würfel? Hypothese verwerfen!
71
Bakterielle Infektion durch Stämme I, II, III
(siehe: Gelbrich) Typ I II III Vermutung Prozentsatz 30 50 20 Konkrete Stichprobe (80 Infektionen) Typ I II III Anzahl 30 32 18
72
Prozentsätze nach der Theorie
Mendelsche Gesetze Prozentsätze nach der Theorie rund und gelb runzelig und gelb rund und grün runzelig und grün 0.5625 0.1875 0.0625
73
Beobachtete Häufigkeiten
rund und gelb runzelig und gelb rund und grün runzelig und grün 271 88 93 28 Summe 480
74
Krankmeldungen Wochentag Mo Di Mi Do Fr n Anzahl Krankmeldungen
75
Aufgabe 8
76
Chi-Quadrat-Test auf Unabhängigkeit I
77
Chi-Quadrat-Test auf Unabhängigkeit II
Hypothese Ablehnungsbereich
78
Chi-Quadrat-Test auf Unabhängigkeit III
79
Berufsstatus Vater - Sohn
Y X 38
81
Sonntagsfrage Die Ergebnisse der Sonntagsfrage:
(Fahrmeir/Künstler/Pigeot/Tutz) Die Ergebnisse der Sonntagsfrage: „Welche Partei würden Sie wählen, wenn am nächsten Sonntag Bundestagswahlen wären?“ sind für den Be- fragungszeitraum in der folgenden Tabelle wiedergegeben:
82
Zwischen Geschlecht und Parteipräferenz besteht
Das Untersuchungsziel ist festzustellen, ob die voneinander abweichenden Häufigkeiten für Männer und Frauen rein zufällige Schwankungen Darstellen oder ob zwischen Geschlecht und Partei- präferenz ein Zusammenhang besteht. Nullhypothese: Zwischen Geschlecht und Parteipräferenz besteht kein Zusammenhang
83
Chi-Quadrat-Test auf Unabhängigkeit
zum Niveau = 0.05
84
Aufgabe 9
85
Chi-Quadrat-Test auf Homogenität
Hypothese Ablehnungsbereich
86
Produktion zweier Betriebe
87
(Fahrmeir/Künstler/Pigeot/Tutz)
KREDITWÜRDIGKEIT (Fahrmeir/Künstler/Pigeot/Tutz) Eine Bank steht vor dem Problem, einen potentiellen Kreditnehmer einzuschätzen und den Kredit zu vergeben, oder ihn der Klasse der Problemfälle zuzuordnen und auf das Kreditgeschäft zu verzichten bzw.eine genauere Prüfung vorzunehmen. Gesucht wird ein Prädikator für die Kreditwürdigkeit. Hierzu werden 1000 Konsumentenkredite betrachtet. Für jeden Kunden aus dieser Stichprobe ist seine Kredit- würdigkeit X bekannt. Als weiteres Merkmal Y wird notiert, ob der Kunde ein laufendes Konto bei der Bank unterhält und, wenn ja, ob es „gut“ oder „mittel“ geführt wird.
88
Merkmal X: Kreditwürdigkeit
Merkmal Y: Konto Wertungen kein Konto gut geführt mittel gut geführt
89
Chi-Quadrat-Test auf Homogenität zum Niveau = 0.05 Nullhypothese:
Verteilung auf die Kategorien des Merkmals „Konto“ ist für unproblematische Kreditnehmer und für Problemkunden gleich
90
Aufgabe 10
91
Aufgabe 11
92
Aufgabe 12
93
Übersicht Chi-Quadrat-Tests
94
Test auf Unabhängigkeit
Faustregeln Chi-Quadrat-Tests Test auf Anpassung Test auf Unabhängigkeit Test auf Homogenität
95
Kolmogorov-Smirnov-Test
wird eingesetzt, wenn getestet werden soll, ob eine bestimmte stetige Verteilung vorliegt.
96
Durchführung Kolmogorov-Smirnov-Test I
Berechnung Hypothese Abstände berechnen )
97
Durchführung Kolmogorov-Smirnov-Test II
Arbeitstabelle Maximum der Werte der letzten beiden Spalten
98
Durchführung Kolmogorov-Smirnov-Test III
Ablehnungsbereich Niveau 0.05
99
Durchmesser von Schrauben
100
Durchmesser von Schrauben
Arbeitstabelle
101
Durchmesser von Schrauben
und nicht spezifiziert Arbeitstabelle
102
Einfache Varianzanalyse
wird eingesetzt, wenn mehr als 2 unabhängige normalverteilte Stichproben verglichen werden sollen, deren Varianz als übereinstimmend angenommen werden kann.
103
Datenliste
104
Gewicht eines Werkstückes bei 3 Betrieben
(in kg)
105
Mittelwerte der Klassen
und Gesamtmittelwert
106
Mittelwert Betrieb 1 Mitttelwert Betrieb 2 Gesamt- Mittelwert Mittelwert Betrieb 3
107
F-Verteilung für verschiedene Freiheitsgrade m, n
108
Wahrscheinlichkeitsdichte
Die F-Verteilung Wahrscheinlichkeitsdichte : Gamma-Funktion
109
Durchführung der einfachen Varianzanalyse I
N: Gesamtumfang der Stichproben; r: Zahl der Betriebe Benötigte Daten: Mittelwerte und Varianzen der einzelnen Betriebe Gesamtmittelwert Berechnung von Q : Maß für die Varianz innerhalb der einzelnen Betriebe Q : Maß für die Varianz zwischen den Betrieben 1 2 1 2
110
Durchführung der einfachen Varianzanalyse II
111
Durchführung der einfachen Varianzanalyse III
Berechnung von Bestimmung von Ablehnungsbereich
112
Viel Erfolg bei der Klausur!!!
Ähnliche Präsentationen
© 2025 SlidePlayer.org Inc.
All rights reserved.