Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Statistische Methoden I

Ähnliche Präsentationen


Präsentation zum Thema: "Statistische Methoden I"—  Präsentation transkript:

1 Statistische Methoden I
WS 2001/2002 Zur Geschichte der Statistik I. Beschreibende Statistik 1. Grundlegende Begriffe 2. Eindimensionales Datenmaterial 2.1. Der Häufigkeitsbegriff 2.2. Lage- und Streuungsparameter 2.3. Konzentrationsmaße (Lorenz-Kurve) 3. Mehrdimensionales Datenmaterial 3.1. Korrelations- und Regressionsrechnung 3.2. Indexzahlen 3.3. Saisonbereinigung

2 II. Wahrscheinlichkeitstheorie
1. Laplacesche Wahrscheinlicheitsräume 1.1. Kombinatorische Formeln 1.2. Berechnung von Laplace-Wahrschein- lichkeiten 2. Allgemeine Wahrscheinlichkeitsräume 2.1. Der diskrete Fall 2.2. Der stetige Fall 2.3. Unabhängigkeit und bedingte Wahrscheinlichkeit 3. Zufallsvariablen 3.1. Grundbegriffe 3.2. Erwartungswert und Varianz 3.3. Binomial- und Poisson-Verteilung 3.4. Die Normalverteilung und der Zentrale Grenzwertsatz

3 III. Induktive Statistik
1. Schätztheorie 1.1. Grundbegriffe, Stichproben 1.2. Maximum-Likelihood-Schätzer 1.3. Erwartungstreue Schätzer 1.4. Konfidenzintervalle 1.5. Spezialfall Binomial-Verteilung 2. Spezialfall Normalverteilung 2.1. Student- und Chi-Quadrat-Verteilung 2.2. Konfidenzintervalle 3. Tests 3.1. Grundbergriffe 3.2. Tests einfacher Hypothesen (Neyman-Pearson-Test) 3.3. Tests zusammengesetzter Hypothesen 3.4. Vergleich zweier unabhängiger Stichproben 3.5. Chi-Quadrat-Tests 3.6. Kolmogorov-Smirnov-Test 3.7. Einfache Varianzanalyse

4 Wahrscheinlich- keitstheorie Beschreibende Statistik
(= Deskriptive Statistik) Beschreibung von Datenmaterial Teil I Wahrscheinlich- keitstheorie Teil II Schließenden Statistik (= Induktive Statistik) Analyse von Datenmaterial, Hypothesen, Prognosen Teil III

5 Statistische Struktur
(diskreter Fall) Dabei sind:

6 Schätzproblem Schätzer

7 Stichprobe (diskreter Fall)

8 Mathematischer Rahmen

9 Stichprobenfunktionen
Beispiele

10 Stichproben (stetiger Fall)

11 Mathematischer Rahmen

12 Statistische Struktur
diskret stetig

13 Maximum-Likelihood-Schätzer
(diskreter Fall) Likelihood-Funktion M-L-Schätzer mit oder

14 ist die beste Erklärung
Der Parameter ist die beste Erklärung für die Beobachtung 

15 M-L-Schätzer Erwarungswert
Normalverteilte Stichprobenvariable M-L-Schätzer Erwarungswert Hier spielt es keine Rolle, ob die Varianz bekannt ist oder nicht. In jedem Fall gilt:

16 Normalverteilte Stichprobenvariable M-L-Schätzer Varianz  bekannt

17 Normalverteilte Stichprobenvariable M-L-Schätzer Varianz  unbekannt

18 Übersicht

19 Beispiel Gewicht von Äpfeln Gewicht von Äpfeln der Sorte Cox-Orange
aus einem bestimmten italienischen Anbaugebiet

20 Erwartungstreue Schätzer
Wenn der Parameter selbst geschätzt werden soll: Wenn ein allgemeines statistisches Problem vorliegt: Dabei bedeutet der Index  , dass der Erwartungswert bzgl. des W.maßes zum Parameter  genommen wird.

21 Schätzung des Erwartungswertes der Stichprobenvariablen X
Statistisches Problem gegeben durch: Erwartungstreuer Schätzer:

22 Schätzung der Varianz der Stichprobenvariablen X
Erwartungswert bekannt Statistisches Problem gegeben durch: Erwartungstreuer Schätzer:

23 Schätzung der Varianz der Stichprobenvariablen X
Erwartungswert unbekannt Statistisches Problem gegeben durch: Erwartungstreuer Schätzer:

24 Erwartungstreuer Schätzer für den Erwarungswert
Normalverteilte Stichprobenvariable Erwartungstreuer Schätzer für den Erwarungswert Hier spielt es wieder keine Rolle, ob die Varianz bekannt ist oder nicht. In jedem Fall gilt: ist erwartungstreu

25 Erwartungstreuer Schätzer
Normalverteilte Stichprobenvariable Erwartungstreuer Schätzer für die Varianz  bekannt ist erwartungstreu

26 Erwartungstreuer Schätzer
Normalverteilte Stichprobenvariable Erwartungstreuer Schätzer für die Varianz  unbekannt ist erwartungstreu Kein M-L-Schätzer!!

27 Übersicht erwartungstreu erwartungstreu erwartungstreu nicht

28 Achtung Aufgabe!

29 Konfidenzintervalle Intervallschätzung Jeder Beobachtung  wird
ein Intervall C() der reellen Zahlen zugeordnet Niveau  Dabei ist die Wahrscheinlichkeit. eine Beobachtung zu machen, für die der wahre Parameter im zugehörigen Intervall liegt, größer oder gleich 1 - 

30 Niveau Das Niveau  wird „klein“ gewählt.
(Wir nehmen in unseren Beispielen in den meisten Fällen  = 0.05 oder  = 0.1) Die Intervallbreite soll möglichst gering sein. Es gibt aber einen Zusammen- hang zwischen der Breite der Konfidenzintervalle und dem Niveau: Niveau kleiner Intervall breiter

31 Beispiel Kaufhaus-Konzern Kauf würde in Erwägung gezogen Kauf würde nicht in Erwägung gezogen 572 1428

32 Der Zentrale Grenzwertsatz

33 Approximative Konfidenzintervalle im Bernoulli-Fall I
Konfidenzintervall zum Niveau 

34 Approximative Konfidenzintervalle im Bernoulli-Fall II
Vereinfachung für großes n (n  100)

35 Achtung Aufgabe!

36 für den Erwartungswert
Fall Normalverteilung Konfidenzintervall für den Erwartungswert Varianz bekannt Annahme: Varianz ist bekannt Konfidenzintervalle: wobei

37 für den Erwartungswert
Fall Normalverteilung Konfidenzintervall für den Erwartungswert Varianz unbekannt Student-Verteilung (oder t-Verteilung)

38 Konfidenzintervall für die Varianz Erwartungswert bekannt Einseitig
Fall Normalverteilung Konfidenzintervall für die Varianz Erwartungswert bekannt Einseitig Chi-Quadrat- Verteilung

39 Konfidenzintervall für die Varianz Erwartungswert bekannt zweiseitig
Fall Normalverteilung Konfidenzintervall für die Varianz Erwartungswert bekannt zweiseitig Chi-Quadrat- Verteilung

40 Konfidenzintervall für die Varianz Erwartungswert unbekannt Einseitig
Fall Normalverteilung Konfidenzintervall für die Varianz Erwartungswert unbekannt Einseitig Chi-Quadrat- Verteilung

41 Konfidenzintervall für die Varianz Erwartungswert unbekannt Zweiseitig
Fall Normalverteilung Konfidenzintervall für die Varianz Erwartungswert unbekannt Zweiseitig Chi-Quadrat- Verteilung

42 Achtung Aufgabe!

43 TESTS TESTS TESTS TESTS TESTS TESTS TESTS

44 Worum es geht Man möchte „testen“, ob eine bestimmte
Annahme (Hypothese) über Parameter der Realität entspricht oder nicht. Formulierung einer Hypothese Da man sich in der Statistik nie ganz sicher sein kann: Die „Irrtumswahr- scheinlichkeit“ sollte klein sein. Beobachtung (Stichprobe) Vorgabe: „Irrtumswahr- scheinlichkeit“ Entscheidung

45 Mathematischer Rahmen I
TESTS Mathematischer Rahmen I Gegeben sind: Statistische Struktur Stetiger Fall Diskreter Fall Testproblem (Hypothese) Niveau 

46 Ablehnungsbereich Mathematischer Rahmen II Test gegeben durch:
TESTS Mathematischer Rahmen II Test gegeben durch: Ablehnungsbereich Teilmenge der Grund- gesamtheit : Menge aller Beobachtungen , die zur Ablehnung der Hypothese führen

47 Mathematischer Rahmen III
TESTS Mathematischer Rahmen III Beobachtung    (Stichprobe) Entweder Oder Beobachtung liegt im Annahmebereich Beobachtung liegt im Ablehnungsbereich Hypothese annehmen! Hypothese ablehnen!

48 Fehler erster und zweiter Art
Entschei- dung Hypothese akzeptiert Hypothese abgelehnt Realität Hypothese wahr Fehler 1. Art Hypothese falsch Fehler 2. Art

49 2 Würfel Fairer Würfel ? 1/6 Gezinkter Würfel ? 1/5

50 für den Erwartungswert
Fall Normalverteilung Test für den Erwartungswert Varianz bekannt

51 für den Erwartungswert
Fall Normalverteilung Test für den Erwartungswert Varianz unbekannt

52 Achtung Aufgabe!

53 Achtung noch eine Aufgabe!

54 Vergleich zweier unabhängiger
Stichproben

55 Vergleich zweier unabhängiger Stichproben 1. Fall
2 unabhängige Stichproben mit Stichprobenvariablen X und Y Annahmen: X und Y normalverteilt Varianz von X = Varianz von Y Hypothese: Erwartungswert von X = Erwartungswert von Y

56 Vergleich zweier unabhängiger Stichproben 1. Fall
Prüfgröße n: Umfang der Stichprobe 1 (Stichprobenvariable X) m: Umfang der Stichprobe 2 (Stichprobenvariable Y) Ablehnungsbereich  bestimmt durch

57 Achtung Aufgabe!

58 Vergleich zweier unabhängiger Stichproben 2. Fall
2 unabhängige Stichproben mit Stichprobenvariablen X und Y Annahmen: X und Y normalverteilt n und m groß (> 30), damit Approximation der Varianzen sinnvoll Hypothese: Erwartungswert von X = Erwartungswert von Y

59 Vergleich zweier unabhängiger
Stichproben 2. Fall Ausgangspunkt Approximation Prüfgröße Ablehnungsbereich  bestimmt durch

60 Achtung Aufgabe!

61 Chi-Quadrat-Tests

62 Stichprobe vom Umfang n:
Satz von Karl Pearson I X: Stichprobenvariable, die r > 2 verschieden Werte annehmen kann: Die Verteilung von X ist durch einen Wahrscheinlichkeitsvektor gegeben. Stichprobe vom Umfang n:

63 Satz von Karl Pearson II
Dann hat man: Dabei ist:

64 Chi-Quadrat-Test auf Anpassung Hypothese Ablehnungsbereich

65 Fairer Würfel? Hypothese verwerfen!

66 Bakterielle Infektion durch Stämme I, II, III
(siehe: Gelbrich) Vermutung Typ I II III Prozentsatz 30 50 20 Konkrete Stichprobe (80 Infektionen) Typ I II III Anzahl 30 32 18

67 Krankmeldungen Wochentag Mo Di Mi Do Fr n Anzahl Krankmeldungen

68 Achtung Aufgabe!

69 Chi-Quadrat-Test auf Unabhängigkeit I Hypothese Ablehnungsbereich

70 Chi-Quadrat-Test auf Unabhängigkeit II

71 auf Unabhängigkeit III
Chi-Quadrat-Test auf Unabhängigkeit III

72 Berufsstatus Vater - Sohn
38

73 Achtung Aufgabe!

74 Chi-Quadrat-Test auf Homogenität Hypothese Ablehnungsbereich

75 Produktion zweier Betriebe

76 Zusammenhang zwischen Geschlecht und Schulbildung

77 Mathe-Test Klasse 9 1. Versuch

78 Mathe-Test Klasse 9 2. Versuch

79 Achtung Aufgabe!

80 Übersicht Chi-Quadrat-Tests

81 Test auf Unabhängigkeit
Faustregeln Chi-Quadrat-Tests Test auf Anpassung Test auf Unabhängigkeit Test auf Homogenität

82 Kolmogorov-Smirnov-Test

83 Testen, ob die Stichproben- variable eine vorgegebene
Problem: Testen, ob die Stichproben- variable eine vorgegebene stetige Verteilung besitzt

84 Kolmogorov-Smirnov-Test I
Durchführung Kolmogorov-Smirnov-Test I Berechnung Hypothese Abstände berechnen und )

85 Kolmogorov-Smirnov-Test II
Durchführung Kolmogorov-Smirnov-Test II Arbeitstabelle Maximum der Werte der letzten beiden Spalten

86 Kolmogorov-Smirnov-Test III
Durchführung Kolmogorov-Smirnov-Test III Ablehnungsbereich Niveau 0.05

87 Einfache Varianzanalyse

88 Stichprobenvariablen
Problem: Testen, ob unabhängige Stichprobenvariablen die selbe Normal- verteilung besitzen

89 Mittelwerte der Klassen
und Gesamtmittelwert

90 Durchführung der einfachen Varianzanalyse I
N: Gesamtumfang der Stichproben r: Zahl der Betriebe Benötigte Daten: Mittelwerte und Varianzen der einzelnen Betriebe Gesamtmittelwert Berechnung von Q : Maß für die Varianz innerhalb der einzelnen Betriebe 1 1 Q : Maß für die Varianz zwischen den Betrieben 2 2

91 Durchführung der einfachen
Varianzanalyse II

92 Durchführung der einfachen
Varianzanalyse III Berechnung von Bestimmung von  Ablehnungsbereich

93 Viel Erfolg bei der Klausur!!!


Herunterladen ppt "Statistische Methoden I"

Ähnliche Präsentationen


Google-Anzeigen