Statistische Methoden II SS 2008 Vorlesung: Prof. Dr. Michael Schürmann Zeit: Freitag 10.00 - 12.30 (Pause: 11.30 - 11.45) Ort: Hörsaal Makarenkostraße (Kiste) Übungen Gruppe 2: Henrike Berg Di 8.00 - 10.00 SR 222 Gruppe 1: Hermann Haase Di 10.00 - 12.00 SR 222 Gruppe 5: Svenja Schützhold Di 12.00 - 14.00 SR 222 Gruppe 7: Sebastian Grapenthin Di 14:00 - 16:00 SR 4 ?? Gruppe 8: Svenja Schützhold Di 16:00 - 18:00 SR 5 Gruppe 4: Sabine Storandt Mi 8.00 - 10.00 SR 222 Gruppe 3: Hermann Haase Mi 10.00 - 12.00 SR 222 Gruppe 6: Sebastian Grapenthin Mi 12.00 - 14.00 SR 3 SR 222 : Fleischmannstraße 6 SR 3, 4 + 5: Loefflerstraße 70
http://www.math-inf.uni-greifswald.de/algebra/
Statistische Methoden I WS 2007/2008 Literatur 1) G. Bamberg, F. Baur: Statistik. Oldenbourg 2) G. Bamberg, F. Baur: Statistik-Arbeitsbuch. Oldenbourg 3) L. Fahrmeir, R. Künstler, I. Pigeot, G. Tutz: Statistik. Springer 4) J. Schira: Statistische Methoden der VWL und BWL. Pearson Education 5) H. Haase: Stochastik für Betriebswirte. Shaker 6) J. Hartung: Statistik. Oldenbourg 7) R. Schlittgen: Einführung in die Statistik. Oldenbourg 8) A. Quatember: Statistik ohne Angst vor Formeln. Pearson Studium 9) H.-D. Radke: Statistik mit Excel. Markt + Technik
Statistische Methoden I + II 2007/2008 Einleitung: Wie schätzt man die Zahl der Fische in einem See? Zur Geschichte der Statistik I. Beschreibende Statistik 1. Grundlegende Begriffe 2. Eindimensionales Datenmaterial 2.1. Der Häufigkeitsbegriff 2.2. Lage- und Streuungsparameter 2.3. Konzentrationsmaße (Lorenz-Kurve) 3. Mehrdimensionales Datenmaterial 3.1. Korrelations- und Regressionsrechnung 3.2. Indexzahlen 3.3. Saisonbereinigung
II. Wahrscheinlichkeitstheorie 1. Laplacesche Wahrscheinlicheitsräume 1.1. Kombinatorische Formeln 1.2. Berechnung von Laplace-Wahrschein- lichkeiten 2. Allgemeine Wahrscheinlichkeitsräume 2.1. Der diskrete Fall 2.2. Der stetige Fall 2.3. Unabhängigkeit und bedingte Wahrscheinlichkeit 3. Zufallsvariablen 3.1. Grundbegriffe 3.2. Erwartungswert und Varianz 3.3. Binomial- und Poisson-Verteilung 3.4. Die Normalverteilung und der Zentrale Grenzwertsatz
4. Markov-Ketten 4.1. Übergangsmatrizen 4.2. Grenzverhalten irreduzibler Markov-Ketten 4.3. Gewinnwahrscheinlichkeiten 4.4. Beispiel „Ruin der Spieler“ 4.5. Anwendungen
III. Induktive Statistik 1. Schätztheorie 1.1. Grundbegriffe, Stichproben 1.2. Maximum-Likelihood-Schätzer 1.3. Erwartungstreue Schätzer 1.4. Konfidenzintervalle 1.5. Spezialfall Binomial-Verteilung 2. Spezialfall Normalverteilung 2.1. Student- und Chi-Quadrat-Verteilung 2.2. Konfidenzintervalle
3. Tests 3.1. Grundbegriffe 3.2. Tests einfacher Hypothesen (Neyman-Pearson-Test) 3.3. Tests zusammengesetzter Hypothesen 3.4. Vergleich zweier unabhängiger Stichproben 3.5. Chi-Quadrat-Tests 3.6. Kolmogorov-Smirnov-Test 3.7. Einfache Varianzanalyse
Beschreibende Statistik (= Deskriptive Statistik) Beschreibung von Datenmaterial 1. Semester Vorstufe zur Schließenden Statistik (= Induktive Statistik) Analyse von Datenmaterial, Hypothesen, Prognosen 2. Semester
Statistische Struktur diskret stetig
Maximum-Likelihood-Schätzer (diskreter Fall) Likelihood-Funktion M-L-Schätzer mit oder
ist die beste Erklärung für die Der Parameter ist die beste Erklärung für die Beobachtung
Beispiel Poisson-Verteilung Stichprobe vom Umfang n mit Poisson-verteilter Stich- Probenvariablen (Intensität: ) M-L-Schätzer für oder
Beispiel Bernoulli-Verteilung Stichprobe vom Umfang n mit Bernoulli- verteilter Stichprobenvariablen (p: Wahrscheinlichkeit des Ereignisses) M-L-Schätzer für p wieder gegeben durch:
Maximum-Likelihood-Schätzer (stetiger Fall) Likelihood-Funktion M-L-Schätzer mit oder
ist die beste Erklärung für die Der Parameter ist die beste Erklärung für die Beobachtung
M-L-Schätzer Erwartungswert Normalverteilte Stichprobenvariable M-L-Schätzer Erwartungswert Hier spielt es keine Rolle, ob die Varianz bekannt ist oder nicht. In jedem Fall gilt:
Normalverteilte Stichprobenvariable M-L-Schätzer Varianz bekannt
Normalverteilte Stichprobenvariable M-L-Schätzer Varianz unbekannt
Übersicht
Erwartungstreue Schätzer Wenn der Parameter selbst geschätzt werden soll: Wenn ein allgemeines statistisches Problem vorliegt: Dabei bedeutet der Index , dass der Erwartungswert bzgl. des W.maßes zum Parameter genommen wird.
Schätzung des Erwartungswertes der Stichprobenvariablen X Statistisches Problem gegeben durch: Erwartungstreuer Schätzer:
Schätzung der Varianz der Stichprobenvariablen X Erwartungswert bekannt Statistisches Problem gegeben durch: Erwartungstreuer Schätzer:
Schätzung der Varianz der Stichprobenvariablen X Erwartungswert unbekannt Statistisches Problem gegeben durch: Erwartungstreuer Schätzer:
Normalverteilte Stichprobenvariable Erwartungstreuer Schätzer für den Erwarungswert Hier spielt es wieder keine Rolle, ob die Varianz bekannt ist oder nicht. In jedem Fall gilt: ist erwartungstreu
Normalverteilte Stichprobenvariable Erwartungstreuer Schätzer für die Varianz bekannt ist erwartungstreu
Normalverteilte Stichprobenvariable Erwartungstreuer Schätzer für die Varianz unbekannt ist erwartungstreu Kein M-L-Schätzer!!
Übersicht nicht erwartungstreu erwartungstreu erwartungstreu
Beispiel Gewicht von Äpfeln Gewicht von Äpfeln der Sorte Cox-Orange aus einem bestimmten italienischen Anbaugebiet
Konfidenzintervalle Intervallschätzung Jeder Beobachtung wird ein Intervall C() der reellen Zahlen zugeordnet Niveau Dabei ist die Wahrscheinlichkeit, eine Beobachtung zu machen, für die der wahre Parameter im zugehörigen Intervall liegt, größer oder gleich 1 -
Die Ungleichung von Tschebyschev
Niveau Das Niveau wird „klein“ gewählt. (Wir nehmen in unseren Beispielen in den meisten Fällen = 0.05 oder = 0.1) Die Intervallbreite soll möglichst gering sein. Es gibt aber einen Zusammenhang zwischen der Breite der Konfidenzintervalle und dem Niveau: Niveau kleiner Intervall breiter
Beispiel Gewicht von Äpfeln Schätzer von Gewicht von Äpfeln der Sorte Cox-Orange aus einem bestimmten italienischen Anbaugebiet Schätzer von
Wichtige Eigenschaft der Normalverteilung Für unabhängige normalverteilte Zufallsvariablen X und Y hat man
Konfidenzintervall für den Erwartungswert Varianz bekannt Annahme: Konfidenzintervalle: wobei
In unserem Beispiel: Bei einem Niveau von = 0.05 ist 1 - /2 = 0.975. Es ergibt sich: und
für die Normalvertreilung Verwendung der Tafel für die Normalvertreilung