Statistische Methoden I WS 2001/2002 Zur Geschichte der Statistik I. Beschreibende Statistik 1. Grundlegende Begriffe 2. Eindimensionales Datenmaterial 2.1. Der Häufigkeitsbegriff 2.2. Lage- und Streuungsparameter 2.3. Konzentrationsmaße (Lorenz-Kurve) 3. Mehrdimensionales Datenmaterial 3.1. Korrelations- und Regressionsrechnung 3.2. Indexzahlen 3.3. Saisonbereinigung
II. Wahrscheinlichkeitstheorie 1. Laplacesche Wahrscheinlicheitsräume 1.1. Kombinatorische Formeln 1.2. Berechnung von Laplace-Wahrschein- lichkeiten 2. Allgemeine Wahrscheinlichkeitsräume 2.1. Der diskrete Fall 2.2. Der stetige Fall 2.3. Unabhängigkeit und bedingte Wahrscheinlichkeit 3. Zufallsvariablen 3.1. Grundbegriffe 3.2. Erwartungswert und Varianz 3.3. Binomial- und Poisson-Verteilung 3.4. Die Normalverteilung und der Zentrale Grenzwertsatz
III. Induktive Statistik 1. Schätztheorie 1.1. Grundbegriffe, Stichproben 1.2. Maximum-Likelihood-Schätzer 1.3. Erwartungstreue Schätzer 1.4. Konfidenzintervalle 1.5. Spezialfall Binomial-Verteilung 2. Spezialfall Normalverteilung 2.1. Student- und Chi-Quadrat-Verteilung 2.2. Konfidenzintervalle 3. Tests 3.1. Grundbergriffe 3.2. Tests einfacher Hypothesen (Neyman-Pearson-Test) 3.3. Tests zusammengesetzter Hypothesen 3.4. Vergleich zweier unabhängiger Stichproben 3.5. Chi-Quadrat-Tests 3.6. Kolmogorov-Smirnov-Test 3.7. Einfache Varianzanalyse
Wahrscheinlich- keitstheorie Beschreibende Statistik (= Deskriptive Statistik) Beschreibung von Datenmaterial Teil I Wahrscheinlich- keitstheorie Teil II Schließenden Statistik (= Induktive Statistik) Analyse von Datenmaterial, Hypothesen, Prognosen Teil III
Statistische Struktur (diskreter Fall) Dabei sind:
Schätzproblem Schätzer
Stichprobe (diskreter Fall)
Mathematischer Rahmen
Stichprobenfunktionen Beispiele
Stichproben (stetiger Fall)
Mathematischer Rahmen
Statistische Struktur diskret stetig
Maximum-Likelihood-Schätzer (diskreter Fall) Likelihood-Funktion M-L-Schätzer mit oder
ist die beste Erklärung Der Parameter ist die beste Erklärung für die Beobachtung
M-L-Schätzer Erwarungswert Normalverteilte Stichprobenvariable M-L-Schätzer Erwarungswert Hier spielt es keine Rolle, ob die Varianz bekannt ist oder nicht. In jedem Fall gilt:
Normalverteilte Stichprobenvariable M-L-Schätzer Varianz bekannt
Normalverteilte Stichprobenvariable M-L-Schätzer Varianz unbekannt
Übersicht
Beispiel Gewicht von Äpfeln Gewicht von Äpfeln der Sorte Cox-Orange aus einem bestimmten italienischen Anbaugebiet
Erwartungstreue Schätzer Wenn der Parameter selbst geschätzt werden soll: Wenn ein allgemeines statistisches Problem vorliegt: Dabei bedeutet der Index , dass der Erwartungswert bzgl. des W.maßes zum Parameter genommen wird.
Schätzung des Erwartungswertes der Stichprobenvariablen X Statistisches Problem gegeben durch: Erwartungstreuer Schätzer:
Schätzung der Varianz der Stichprobenvariablen X Erwartungswert bekannt Statistisches Problem gegeben durch: Erwartungstreuer Schätzer:
Schätzung der Varianz der Stichprobenvariablen X Erwartungswert unbekannt Statistisches Problem gegeben durch: Erwartungstreuer Schätzer:
Erwartungstreuer Schätzer für den Erwarungswert Normalverteilte Stichprobenvariable Erwartungstreuer Schätzer für den Erwarungswert Hier spielt es wieder keine Rolle, ob die Varianz bekannt ist oder nicht. In jedem Fall gilt: ist erwartungstreu
Erwartungstreuer Schätzer Normalverteilte Stichprobenvariable Erwartungstreuer Schätzer für die Varianz bekannt ist erwartungstreu
Erwartungstreuer Schätzer Normalverteilte Stichprobenvariable Erwartungstreuer Schätzer für die Varianz unbekannt ist erwartungstreu Kein M-L-Schätzer!!
Übersicht erwartungstreu erwartungstreu erwartungstreu nicht
Achtung Aufgabe!
Konfidenzintervalle Intervallschätzung Jeder Beobachtung wird ein Intervall C() der reellen Zahlen zugeordnet Niveau Dabei ist die Wahrscheinlichkeit. eine Beobachtung zu machen, für die der wahre Parameter im zugehörigen Intervall liegt, größer oder gleich 1 -
Niveau Das Niveau wird „klein“ gewählt. (Wir nehmen in unseren Beispielen in den meisten Fällen = 0.05 oder = 0.1) Die Intervallbreite soll möglichst gering sein. Es gibt aber einen Zusammen- hang zwischen der Breite der Konfidenzintervalle und dem Niveau: Niveau kleiner Intervall breiter
Beispiel Kaufhaus-Konzern Kauf würde in Erwägung gezogen Kauf würde nicht in Erwägung gezogen 572 1428
Der Zentrale Grenzwertsatz
Approximative Konfidenzintervalle im Bernoulli-Fall I Konfidenzintervall zum Niveau
Approximative Konfidenzintervalle im Bernoulli-Fall II Vereinfachung für großes n (n 100)
Achtung Aufgabe!
für den Erwartungswert Fall Normalverteilung Konfidenzintervall für den Erwartungswert Varianz bekannt Annahme: Varianz ist bekannt Konfidenzintervalle: wobei
für den Erwartungswert Fall Normalverteilung Konfidenzintervall für den Erwartungswert Varianz unbekannt Student-Verteilung (oder t-Verteilung)
Konfidenzintervall für die Varianz Erwartungswert bekannt Einseitig Fall Normalverteilung Konfidenzintervall für die Varianz Erwartungswert bekannt Einseitig Chi-Quadrat- Verteilung
Konfidenzintervall für die Varianz Erwartungswert bekannt zweiseitig Fall Normalverteilung Konfidenzintervall für die Varianz Erwartungswert bekannt zweiseitig Chi-Quadrat- Verteilung
Konfidenzintervall für die Varianz Erwartungswert unbekannt Einseitig Fall Normalverteilung Konfidenzintervall für die Varianz Erwartungswert unbekannt Einseitig Chi-Quadrat- Verteilung
Konfidenzintervall für die Varianz Erwartungswert unbekannt Zweiseitig Fall Normalverteilung Konfidenzintervall für die Varianz Erwartungswert unbekannt Zweiseitig Chi-Quadrat- Verteilung
Achtung Aufgabe!
TESTS TESTS TESTS TESTS TESTS TESTS TESTS
Worum es geht Man möchte „testen“, ob eine bestimmte Annahme (Hypothese) über Parameter der Realität entspricht oder nicht. Formulierung einer Hypothese Da man sich in der Statistik nie ganz sicher sein kann: Die „Irrtumswahr- scheinlichkeit“ sollte klein sein. Beobachtung (Stichprobe) Vorgabe: „Irrtumswahr- scheinlichkeit“ Entscheidung
Mathematischer Rahmen I TESTS Mathematischer Rahmen I Gegeben sind: Statistische Struktur Stetiger Fall Diskreter Fall Testproblem (Hypothese) Niveau
Ablehnungsbereich Mathematischer Rahmen II Test gegeben durch: TESTS Mathematischer Rahmen II Test gegeben durch: Ablehnungsbereich Teilmenge der Grund- gesamtheit : Menge aller Beobachtungen , die zur Ablehnung der Hypothese führen
Mathematischer Rahmen III TESTS Mathematischer Rahmen III Beobachtung (Stichprobe) Entweder Oder Beobachtung liegt im Annahmebereich Beobachtung liegt im Ablehnungsbereich Hypothese annehmen! Hypothese ablehnen!
Fehler erster und zweiter Art Entschei- dung Hypothese akzeptiert Hypothese abgelehnt Realität Hypothese wahr Fehler 1. Art Hypothese falsch Fehler 2. Art
2 Würfel Fairer Würfel ? 1/6 Gezinkter Würfel ? 1/5
für den Erwartungswert Fall Normalverteilung Test für den Erwartungswert Varianz bekannt
für den Erwartungswert Fall Normalverteilung Test für den Erwartungswert Varianz unbekannt
Achtung Aufgabe!
Achtung noch eine Aufgabe!
Vergleich zweier unabhängiger Stichproben
Vergleich zweier unabhängiger Stichproben 1. Fall 2 unabhängige Stichproben mit Stichprobenvariablen X und Y Annahmen: X und Y normalverteilt Varianz von X = Varianz von Y Hypothese: Erwartungswert von X = Erwartungswert von Y
Vergleich zweier unabhängiger Stichproben 1. Fall Prüfgröße n: Umfang der Stichprobe 1 (Stichprobenvariable X) m: Umfang der Stichprobe 2 (Stichprobenvariable Y) Ablehnungsbereich bestimmt durch
Achtung Aufgabe!
Vergleich zweier unabhängiger Stichproben 2. Fall 2 unabhängige Stichproben mit Stichprobenvariablen X und Y Annahmen: X und Y normalverteilt n und m groß (> 30), damit Approximation der Varianzen sinnvoll Hypothese: Erwartungswert von X = Erwartungswert von Y
Vergleich zweier unabhängiger Stichproben 2. Fall Ausgangspunkt Approximation Prüfgröße Ablehnungsbereich bestimmt durch
Achtung Aufgabe!
Chi-Quadrat-Tests
Stichprobe vom Umfang n: Satz von Karl Pearson I X: Stichprobenvariable, die r > 2 verschieden Werte annehmen kann: Die Verteilung von X ist durch einen Wahrscheinlichkeitsvektor gegeben. Stichprobe vom Umfang n:
Satz von Karl Pearson II Dann hat man: Dabei ist:
Chi-Quadrat-Test auf Anpassung Hypothese Ablehnungsbereich
Fairer Würfel? Hypothese verwerfen!
Bakterielle Infektion durch Stämme I, II, III (siehe: Gelbrich) Vermutung Typ I II III Prozentsatz 30 50 20 Konkrete Stichprobe (80 Infektionen) Typ I II III Anzahl 30 32 18
Krankmeldungen Wochentag Mo Di Mi Do Fr n Anzahl Krankmeldungen 44 28 24 20 34 150
Achtung Aufgabe!
Chi-Quadrat-Test auf Unabhängigkeit I Hypothese Ablehnungsbereich
Chi-Quadrat-Test auf Unabhängigkeit II
auf Unabhängigkeit III Chi-Quadrat-Test auf Unabhängigkeit III
Berufsstatus Vater - Sohn 38
Achtung Aufgabe!
Chi-Quadrat-Test auf Homogenität Hypothese Ablehnungsbereich
Produktion zweier Betriebe
Zusammenhang zwischen Geschlecht und Schulbildung
Mathe-Test Klasse 9 1. Versuch
Mathe-Test Klasse 9 2. Versuch
Achtung Aufgabe!
Übersicht Chi-Quadrat-Tests
Test auf Unabhängigkeit Faustregeln Chi-Quadrat-Tests Test auf Anpassung Test auf Unabhängigkeit Test auf Homogenität
Kolmogorov-Smirnov-Test
Testen, ob die Stichproben- variable eine vorgegebene Problem: Testen, ob die Stichproben- variable eine vorgegebene stetige Verteilung besitzt
Kolmogorov-Smirnov-Test I Durchführung Kolmogorov-Smirnov-Test I Berechnung Hypothese Abstände berechnen und )
Kolmogorov-Smirnov-Test II Durchführung Kolmogorov-Smirnov-Test II Arbeitstabelle Maximum der Werte der letzten beiden Spalten
Kolmogorov-Smirnov-Test III Durchführung Kolmogorov-Smirnov-Test III Ablehnungsbereich Niveau 0.05
Einfache Varianzanalyse
Stichprobenvariablen Problem: Testen, ob unabhängige Stichprobenvariablen die selbe Normal- verteilung besitzen
Mittelwerte der Klassen und Gesamtmittelwert
Durchführung der einfachen Varianzanalyse I N: Gesamtumfang der Stichproben r: Zahl der Betriebe Benötigte Daten: Mittelwerte und Varianzen der einzelnen Betriebe Gesamtmittelwert Berechnung von Q : Maß für die Varianz innerhalb der einzelnen Betriebe 1 1 Q : Maß für die Varianz zwischen den Betrieben 2 2
Durchführung der einfachen Varianzanalyse II
Durchführung der einfachen Varianzanalyse III Berechnung von Bestimmung von Ablehnungsbereich
Viel Erfolg bei der Klausur!!!