Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Induktive Statistik. Statistische Struktur (diskreter Fall) Dabei sind:

Kopien: 2
Statistische Methoden I WS 2007/2008 Donnerstag, 31. Januar 2008 und Freitag, 1. Februar 2008 Probeklausur nächste Woche - statt Vorlesungen -

Induktive Statistik. Statistische Struktur (diskreter Fall) Dabei sind:

Ähnliche Präsentationen


Präsentation zum Thema: "Induktive Statistik. Statistische Struktur (diskreter Fall) Dabei sind:"—  Präsentation transkript:

1 Induktive Statistik

2 Statistische Struktur (diskreter Fall) Dabei sind:

3 Schätzproblem Schätzer

4 Ω Θ Modell Beobachtung (Stichprobe) Grundgesamtheit (mögliche Beobachtungen) Schätzung

5 Ω Θ Modell Beobachtung (Stichprobe) Grundgesamtheit (mögliche Beobachtungen) Schätzung E g

6 Stichprobe (diskreter Fall)

7 Mathematischer Rahmen

8 Statistische Struktur diskret stetig

9 Maximum-Likelihood-Schätzer ( diskreter Fall) Likelihood-Funktion mit oder M-L-Schätzer

10 Der Parameter ist die beste Erklärung für die Beobachtung

11 Likelihood-Funktion

12 Der Logharithmus ln x ist streng monoton wachsend

13 Beispiel Poisson-Verteilung Stichprobe vom Umfang n mit Poisson-verteilter Stich- Probenvariablen (Intensität: ) M-L-Schätzer für oder

14 Beispiel Bernoulli-Verteilung Stichprobe vom Umfang n mit Bernoulli- verteilter Stichprobenvariablen (p: Wahrscheinlichkeit des Ereignisses) M-L-Schätzer für p wieder gegeben durch:

15 Maximum-Likelihood-Schätzer (stetiger Fall) Likelihood-Funktion mit oder M-L-Schätzer

16 Der Parameter ist die beste Erklärung für die Beobachtung

17 Beispiel Bernoulli-Verteilung Stichprobe vom Umfang n mit Bernoulli- verteilter Stichprobenvariablen (p: Wahrscheinlichkeit des Ereignisses) M-L-Schätzer für p wieder gegeben durch:

18 Normalverteilte Stichprobenvariable M-L-Schätzer Erwartungswert Hier spielt es keine Rolle, ob die Varianz bekannt ist oder nicht. In jedem Fall gilt:

19 Normalverteilte Stichprobenvariable M-L-Schätzer Varianz bekannt

20 Normalverteilte Stichprobenvariable M-L-Schätzer Varianz unb ekannt

21 Übersicht

22 Aufgabe 1

23 Erwartungstreue Schätzer Wenn der Parameter selbst geschätzt werden soll: Wenn ein allgemeines statistisches Problem vorliegt: Dabei bedeutet der Index, dass der Erwartungswert bzgl. des W.maßes zum Parameter genommen wird.

24 Schätzung des Erwartungswertes der Stichprobenvariablen X Statistisches Problem gegeben durch: Erwartungstreuer Schätzer:

25 Schätzung der Varianz der Stichprobenvariablen X Statistisches Problem gegeben durch: Erwartungstreuer Schätzer: Erwartungswert bekannt

26 Schätzung der Varianz der Stichprobenvariablen X Statistisches Problem gegeben durch: Erwartungstreuer Schätzer: Erwartungswert unbekannt

27 Normalverteilte Stichprobenvariable Erwartungstreuer Schätzer für den Erwarungswert Hier spielt es wieder keine Rolle, ob die Varianz bekannt ist oder nicht. In jedem Fall gilt: erwartungstreu ist erwartungstreu

28 Normalverteilte Stichprobenvariable Erwartungstreuer Schätzer für die Varianz bekannt erwartungstreu ist erwartungstreu

29 Normalverteilte Stichprobenvariable Erwartungstreuer Schätzer für die Varianz unb ekannt erwartungstreu ist erwartungstreu Kein M-L-Schätzer!!

30 Übersicht erwartungstreu erwartungstreu erwartungstreu nicht erwartungstreu

31 Konfidenzintervalle Intervallschätzung Jeder Beobachtung wird ein Intervall C( ) der reellen Zahlen zugeordnet Niveau Dabei ist die Wahrscheinlichkeit, eine Beobachtung zu machen, für die der wahre Parameter im zugehörigen Intervall liegt, größer oder gleich 1 -

32 Niveau klein Das Niveau wird klein gewählt. (Wir nehmen in unseren Beispielen in den meisten Fällen = 0.05 oder = 0.1) Zusammenhang Es gibt aber einen Zusammenhang zwischen der Breite der Konfidenzintervalle und dem Niveau: Niveau kleiner Intervall breiter Die Intervallbreite soll möglichst gering sein.

33 Konfidenzintervall für den Erwartungswert Varianz bekannt Annahme: Konfidenzintervalle: wobei

34 Die Gauß- oder Normalverteilung

35 Dichte Verteilung Verteilungsfunktion

36 Erwartungswert Varianz

37 Approximative Konfidenzintervalle im Bernoulli-Fall I Konfidenzintervall zum Niveau

38 Approximative Konfidenzintervalle im Bernoulli-Fall II Vereinfachung für großes n (n 100)

39 Aufgabe 2

40 Die Student- oder t-Verteilung Hängt von Parameter n ab!

41 Die Student- oder t-Verteilung Wahrscheinlichkeitsdichte Die Konstante d ist dabei:

42 Die Chi-Quadrat-Verteilung Hängt ebenfalls von Parameter n ab!

43 Die Chi-Quadrat-Verteilung Wahrscheinlichkeitsdichte Die Konstante c ist dabei: : Gamma-Funktion

44 unabhängige Für n unabhängige Zufallsvariablen mit hat man: Mathematische Bedeutung der Chi-Quadrat-Verteilung

45 unabhängige Für unabhängige Zufallsvariablen W und U mit hat man: Mathematische Bedeutung der t-Verteilung

46 Konfidenzintervall für den Erwartungswert Varianz unbekannt Student-Verteilung (oder t-Verteilung)

47 Übersicht Konfidenzintervalle für den Erwartungswert

48 Aufgabe 3

49 Verwendung der Tafel für die Normalvertreilung

50 TESTS

51 Worum es geht Man möchte testen, ob eine bestimmte Annahme (Hypothese) über Parameter der Realität entspricht oder nicht. Beobachtung (Stichprobe) Entscheidung Vorgabe: Irrtumswahrscheinlichkeit Formulierung einer HypotheseNullhypothese In der Statistik kann man nie ganz sicher sein. Die Irrtumswahrscheinlichkeit sollte wenigstens klein sein.

52 Mathematischer Rahmen I TESTS Statistische Struktur Testproblem (Hypothese)Nullhypothese Gegeben sind: Stetiger Fall Diskreter Fall Niveau

53 Mathematischer Rahmen II TESTS Test Test gegeben durch: Ablehnungsbereich Teilmenge der Grundgesamtheit : Menge aller Beobachtungen, die zur Ablehnung der Hypothese führen

54 Mathematischer Rahmen III TESTS Beobachtung (Stichprobe) Entweder Oder Beobachtung liegt im Annahmebereich Beobachtung liegt im Ablehnungsbereich Hypothese annehmen! Hypothese ablehnen!

55 Fehler erster und zweiter Art

56 Hypotheseakzeptiert Hypothese abgelehnt Hypothesewahr Hypothese falschEntscheidungRealität Fehler 1. Art Fehler 2. Art

57 Niveau und Macht Obere Grenze für die Wahrscheinlichkeit, Fehler 1. Art einen Fehler 1. Art zu begehen Niveau Wahrscheinlichkeit, Fehler 2. Art keinen Fehler 2. Art zu begehen, wenn der wahre Parameterwert in dem Punkt liegt Macht Macht in einem Punkt der Alternative

58 Test für den Erwartungswert Varianz bekannt Fall Normalverteilung

59 Test für den Erwartungswert Varianz unbekannt Fall Normalverteilung

60 Aufgabe 4

61 Aufgabe 5

62 1. Fall Vergleich zweier unabhängiger Stichproben 1. Fall 2 unabhängige Stichproben mit Stichprobenvariablen X und Y Annahmen: X und Y normalverteilt Varianz von X = Varianz von Y Hypothese: Erwartungswert von X = Erwartungswert von Y

63 1. Fall Vergleich zweier unabhängiger Stichproben 1. Fall Prüfgröße n: Umfang der Stichprobe 1 (Stichprobenvariable X) m: Umfang der Stichprobe 2 (Stichprobenvariable Y) Ablehnungsbereich bestimmt durch

64 Aufgabe 6

65 2. Fall Vergleich zweier unabhängiger Stichproben 2. Fall 2 unabhängige Stichproben mit Stichprobenvariablen X und Y Annahmen: X und Y normalverteilt n und m groß (> 30), damit Approximation der Varianzen sinnvoll Hypothese: Erwartungswert von X = Erwartungswert von Y

66 2. Fall Vergleich zweier unabhängiger Stichproben 2. Fall Ausgangspunkt Approximation Prüfgröße Ablehnungsbereich bestimmt durch

67 Aufgabe 7

68 Chi-Quadrat-Tests

69 Chi-Quadrat-Test auf Anpassung Hypothese Ablehnungsbereich

70 Fairer Würfel? Hypothese verwerfen!

71 Bakterielle Infektion durch Stämme I, II, III Vermutung Konkrete Stichprobe (80 Infektionen) (siehe: Gelbrich) Typ Prozentsatz IIIIII Anzahl IIIIII Typ

72 Mendelsche Gesetze rund und gelb runzelig runzelig und gelb rund und grün runzelig runzelig und grün Prozentsätze nach der Theorie

73 rund und gelb runzelig runzelig und gelb rund und grün runzelig runzelig und grün Beobachtete Häufigkeiten Summe 480

74 Krankmeldungen Wochentag Mo Di Mi Do Fr n Anzahl Krankmeldungen

75 Aufgabe 8

76 Chi-Quadrat-Test auf Unabhängigkeit I

77 Chi-Quadrat-Test auf Unabhängigkeit II Hypothese Ablehnungsbereich

78 Chi-Quadrat-Test auf Unabhängigkeit III

79 Berufsstatus Vater - Sohn 38 X Y

80

81 Sonntagsfrage (Fahrmeir/Künstler/Pigeot/Tutz) Die Ergebnisse der Sonntagsfrage: Welche Partei würden Sie wählen, wenn am nächsten Sonntag Bundestagswahlen wären? sind für den Be- fragungszeitraum in der folgenden Tabelle wiedergegeben:

82 Das Untersuchungsziel ist festzustellen, ob die voneinander abweichenden Häufigkeiten für Männer und Frauen rein zufällige Schwankungen Darstellen oder ob zwischen Geschlecht und Partei- präferenz ein Zusammenhang besteht. Nullhypothese: Zwischen Geschlecht und Parteipräferenz besteht kein Zusammenhang

83 Chi-Quadrat-Test auf Unabhängigkeit zum Niveau = 0.05

84 Aufgabe 9

85 Chi-Quadrat-Test auf Homogenität Hypothese Ablehnungsbereich

86 Produktion zweier Betriebe

87 KREDITWÜRDIGKEIT Eine Bank steht vor dem Problem, einen potentiellen Kreditnehmer einzuschätzen und den Kredit zu vergeben, oder ihn der Klasse der Problemfälle zuzuordnen und auf das Kreditgeschäft zu verzichten bzw.eine genauere Prüfung vorzunehmen. Gesucht wird ein Prädikator für die Kreditwürdigkeit. Hierzu werden 1000 Konsumentenkredite betrachtet. Für jeden Kunden aus dieser Stichprobe ist seine Kredit- würdigkeit X bekannt. Als weiteres Merkmal Y wird notiert, ob der Kunde ein laufendes Konto bei der Bank unterhält und, wenn ja, ob es gut oder mittel geführt wird. (Fahrmeir/Künstler/Pigeot/Tutz)

88 Kreditwürdigkeit Merkmal X: Kreditwürdigkeit Konto Merkmal Y: Konto Wertungen kein Konto gut geführt mittel gut geführt

89 Chi-Quadrat-Test auf Homogenität zum Niveau = 0.05 Nullhypothese: Verteilung auf die Kategorien des Merkmals Konto ist für unproblematische Kreditnehmer und für Problemkunden gleich

90 Aufgabe 10

91 Aufgabe 11

92 Aufgabe 12

93 Chi-Quadrat-Tests Übersicht

94 Faustregeln Chi-Quadrat-Tests Test auf Anpassung Test auf Unabhängigkeit Test auf Homogenität

95 Kolmogorov-Smirnov-Test wird eingesetzt, wenn getestet werden soll, ob eine bestimmte stetige Verteilung vorliegt.

96 Durchführung Kolmogorov-Smirnov-Test I Berechnung Abstände berechnen ) Hypothese

97 Durchführung Kolmogorov-Smirnov-Test II Arbeitstabelle Maximum der Werte der letzten beiden Spalten

98 Durchführung Kolmogorov-Smirnov-Test III Ablehnungsbereich Niveau 0.05

99 Durchmesser von Schrauben

100 Arbeitstabelle

101 Durchmesser von Schrauben und nicht spezifiziert Arbeitstabelle

102 Einfache Varianzanalyse wird eingesetzt, wenn mehr als 2 unabhängige normalverteilte Stichproben verglichen werden sollen, deren Varianz als übereinstimmend angenommen werden kann.

103 Datenliste

104 Gewicht eines Werkstückes bei 3 Betrieben (in kg)

105 Mittelwerte der Klassen und Gesamtmittelwert

106 Mittelwert Betrieb 1 Mitttelwert Betrieb 2 Mittelwert Betrieb 3 Gesamt- Mittelwert

107 F-Verteilung für verschiedene Freiheitsgrade m, n

108 Die F-Verteilung Wahrscheinlichkeitsdichte : Gamma-Funktion

109 Durchführung der einfachen Varianzanalyse I Mittelwerte und Varianzen der einzelnen Betriebe Gesamtmittelwert N: Gesamtumfang der Stichproben; r: Zahl der Betriebe 1 2 Q : Maß für die Varianz innerhalb der einzelnen Betriebe Q : Maß für die Varianz zwischen den Betrieben 1 2 Berechnung von Benötigte Daten:

110 Durchführung der einfachen Varianzanalyse II

111 Durchführung der einfachen Varianzanalyse III Bestimmung von Ablehnungsbereich Berechnung von

112 Viel Erfolg bei der Klausur!!!


Herunterladen ppt "Induktive Statistik. Statistische Struktur (diskreter Fall) Dabei sind:"

Ähnliche Präsentationen


Google-Anzeigen