III. Induktive Statistik 1. Schätztheorie 1.1. Grundbegriffe, Stichproben 1.2. Maximum-Likelihood-Schätzer 1.3. Erwartungstreue Schätzer 1.4. Konfidenzintervalle 1.5. Spezialfall Binomial-Verteilung 2. Spezialfall Normalverteilung 2.1. Student- und Chi-Quadrat-Verteilung 2.2. Konfidenzintervalle 3. Tests 3.1. Grundbergriffe 3.2. Tests einfacher Hypothesen (Neyman-Pearson-Test) 3.3. Tests zusammengesetzter Hypothesen 3.4. Vergleich zweier unabhängiger Stichproben 3.5. Chi-Quadrat-Tests 3.6. Kolmogorov-Smirnov-Test 3.7. Einfache Varianzanalyse
Wahrscheinlich- keitstheorie Beschreibende Statistik (= Deskriptive Statistik) Beschreibung von Datenmaterial Teil I Wahrscheinlich- keitstheorie Teil II Schließenden Statistik (= Induktive Statistik) Analyse von Datenmaterial, Hypothesen, Prognosen Teil III
Sie beträgt gerade H(n, N, m)(k)! Eine Urne enthält n Kugeln, davon N weiße und n - N schwarze. Aus der Urne werden nacheinander m Kugeln ohne Zurücklegen gezogen. Wie groß ist die Wahrscheinlichkeit, genau k weiße Kugeln zu ziehen? Sie beträgt gerade H(n, N, m)(k)!
Die hypergeometrische Verteilung Notation
Schätzung der Zahl der Fische in einem See in Mecklenburg N Fische werden gefangen und markiert Die Fische werden in den See zurück- gegeben. Man wartet, bis die markierten Fische sich (möglichst gleichmäßig) im See verteilt haben. Man geht erneut auf Fischzug und fängt m Fische. Von diesen seien k markiert.
Schätzung für die Gesamtzahl der Fische im See:
Statistische Struktur (diskreter Fall) Dabei sind:
Schätzproblem Schätzer
(mögliche Beobachtungen) Grundgesamtheit (mögliche Beobachtungen) Ω Beobachtung (Stichprobe) Schätzung Modell Θ
(mögliche Beobachtungen) Grundgesamtheit (mögliche Beobachtungen) Ω Beobachtung (Stichprobe) Schätzung Modell g Θ E
Stichprobe (diskreter Fall)
Mathematischer Rahmen
Stichprobenfunktionen
Sonntagseinsätze Feuerwache
Stichproben (stetiger Fall)
Mathematischer Rahmen
Statistische Struktur diskret stetig
Maximum-Likelihood-Schätzer (diskreter Fall) Likelihood-Funktion M-L-Schätzer mit oder
ist die beste Erklärung Der Parameter ist die beste Erklärung für die Beobachtung
Schätzung der Zahl der Fische in einem See in Mecklenburg N Fische werden gefangen und markiert Die Fische werden in den See zurück- gegeben. Man wartet, bis die markierten Fische sich (möglichst gleichmäßig) im See verteilt haben. Man geht erneut auf Fischzug und fängt m Fische. Von diesen seien k markiert.
ist M-L-Schätzer !
Likelihood-Funktion
Der Logharithmus ln x ist streng monoton wachsend
Beispiel Bernoulli-Verteilung Stichprobe vom Umfang n mit Bernoulli- verteilter Stichprobenvariablen (p: Wahrscheinlichkeit des Ereignisses) M-L-Schätzer für p wieder gegeben durch:
Maximum-Likelihood-Schätzer (stetiger Fall) Likelihood-Funktion M-L-Schätzer mit oder
ist die beste Erklärung Der Parameter ist die beste Erklärung für die Beobachtung x
Maximum-Likelihood-Schätzer (diskreter Fall) Likelihood-Funktion M-L-Schätzer mit oder
Beispiel Poisson-Verteilung Stichprobe vom Umfang n mit Poisson- verteilter Stichprobenvariablen (Intensität: ) M-L-Schätzer für oder
Beispiel Bernoulli-Verteilung Stichprobe vom Umfang n mit Bernoulli- verteilter Stichprobenvariablen (p: Wahrscheinlichkeit des Ereignisses) M-L-Schätzer für p wieder gegeben durch:
M-L-Schätzer Erwarungswert Normalverteilte Stichprobenvariable M-L-Schätzer Erwarungswert Hier spielt es keine Rolle, ob die Varianz bekannt ist oder nicht. In jedem Fall gilt:
Normalverteilte Stichprobenvariable M-L-Schätzer Varianz bekannt
Normalverteilte Stichprobenvariable M-L-Schätzer Varianz unbekannt
Übersicht
Beispiel Gewicht von Äpfeln Gewicht von Äpfeln der Sorte Cox-Orange aus einem bestimmten italienischen Anbaugebiet
Erwartungstreue Schätzer Wenn der Parameter selbst geschätzt werden soll: Wenn ein allgemeines statistisches Problem vorliegt: Dabei bedeutet der Index , dass der Erwartungswert bzgl. des W.maßes zum Parameter genommen wird.
Schätzung des Erwartungswertes der Stichprobenvariablen X Statistisches Problem gegeben durch: Erwartungstreuer Schätzer:
Schätzung der Varianz der Stichprobenvariablen X Erwartungswert bekannt Statistisches Problem gegeben durch: Erwartungstreuer Schätzer:
Schätzung der Varianz der Stichprobenvariablen X Erwartungswert unbekannt Statistisches Problem gegeben durch: Erwartungstreuer Schätzer:
Erwartungstreuer Schätzer für den Erwarungswert Normalverteilte Stichprobenvariable Erwartungstreuer Schätzer für den Erwarungswert Hier spielt es wieder keine Rolle, ob die Varianz bekannt ist oder nicht. In jedem Fall gilt: ist erwartungstreu
Erwartungstreuer Schätzer Normalverteilte Stichprobenvariable Erwartungstreuer Schätzer für die Varianz bekannt ist erwartungstreu
Erwartungstreuer Schätzer Normalverteilte Stichprobenvariable Erwartungstreuer Schätzer für die Varianz unbekannt ist erwartungstreu Kein M-L-Schätzer!!
Übersicht erwartungstreu erwartungstreu nicht erwartungstreu