Statistische Methoden I

Slides:



Advertisements
Ähnliche Präsentationen
Wahrscheinlichkeitstheorie
Advertisements

Induktive Statistik.
Statistische Methoden I
Nachholung der Vorlesung vom Freitag
Statistische Methoden II
Statistische Methoden II SS 2007 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.
Nachholung der Vorlesung vom Freitag
Die Vorlesung Statistische Methoden II findet am (nächste Woche) nicht nicht statt. Diese Vorlesung wird zu einem späteren Termin, der noch bekannt.
Statistische Methoden I WS 2006/2007 Zur Geschichte der Statistik I. Beschreibende Statistik 1. Grundlegende Begriffe 2. Eindimensionales Datenmaterial.
Statistische Methoden II SS 2008
Vorlesung Die Vorlesung Statistische Methoden II nächste Woche vom 6. Juni ( nächste Woche ) wird auf den 4. Juni (Mittwoch) vorverlegt ! 14 – 16 Zeit:
Achtung Terminänderung !!!
Nachholung der Vorlesung vom Freitag
Konfidenzintervalle Intervallschätzung
Gruppe 2: Henrike Berg Di SR 222 Gruppe 1: Hermann Haase Di SR 222 Gruppe 5: Svenja Schützhold Di SR 222 Gruppe.
Ab nächster Woche wird die Übungsgruppe Gruppe 2: Henrike Berg Di SR 222 wegen Personalmangel eingestellt.
Statistische Methoden II SS 2008 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Makarenkostraße (Kiste)
M-L-Schätzer Erwartungswert
Die Vorlesung Statistische Methoden II findet am (nächste Woche) wegen der Projektwoche nicht wegen der Projektwoche nicht statt.
Statistische Methoden II SS 2007 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.
SR 222 : Fleischmannstraße 6 SR : Loefflerstraße 70
Chi-Quadrat-Test auf Unabhängigkeit I
TESTS. Worum es geht Man möchte testen, ob eine bestimmte Annahme (Hypothese) über Parameter der Realität entspricht oder nicht. Beobachtung (Stichprobe)
Die Student- oder t-Verteilung
Statistische Methoden I WS 2007/2008 Donnerstag, 31. Januar 2008 und Freitag, 1. Februar 2008 Probeklausur - statt Vorlesungen -
Erwartungswert und Varianz I Der endliche Fall Erwartungswert Varianz.
Konfidenzintervalle Intervallschätzung Jeder Beobachtung wird ein Intervall C( ) der reellen Zahlen zugeordnet Niveau Dabei ist die Wahrscheinlichkeit,
Chi-Quadrat-Test auf Anpassung
Statistische Methoden I SS 2005 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.
Neu Übungsgruppentausch:
4. Markov-Ketten 4.1. Übergangsmatrizen
Statistische Methoden I SS 2005
Kolmogorov-Smirnov-Test. A. N. Kolmogorov Geboren in Tambov, Russland. Begründer der modernen Wahrscheinlichkeitstheorie.
Statistische Methoden I WS 2007/2008 Donnerstag, 31. Januar 2008 und Freitag, 1. Februar 2008 Probeklausur nächste Woche - statt Vorlesungen -
Statistische Methoden I WS 2007/2008 Probeklausur Donnerstag, 31. Januar 2008 und Freitag, 1. Februar statt Vorlesungen -
Maximum-Likelihood-Schätzer ( diskreter Fall) Likelihood-Funktion mit oder M-L-Schätzer.
FILTER Input: Empirische Zeitreihe Output: Geglättete Zeitreihe.
Statistische Methoden I SS 2005
TESTS TESTS TESTS TESTS TESTS TESTS TESTS.
Klausurtermin (laut Prüfungsamt) Probeklausur Freitag, 13. Juni 2003 statt Vorlesung.
Achtung Vorlesung am Montag, den 21. Juni Zeit: Uhr Ort: Kiste.
Achtung Vorlesung am nächsten Montag (21. Juni) Zeit: Uhr Ort: Kiste.
II. Wahrscheinlichkeitstheorie
Die Vorlesung am 14. Mai (Tag nach Himmelfahrt) wird auf Montag, den 17. Mai verlegt! Zeit: 16 Uhr Ort: Kiste Nächste Woche!!!!
Statistische Methoden II SS 2003 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.
Wahrscheinlichkeitstheorie. Statistische Methoden I WS 2009/2010 Einleitung: Wie schätzt man die Zahl der Fische in einem See? Zur Geschichte der Statistik.
III. Induktive Statistik
Erwartungswert und Varianz I Der endliche Fall Erwartungswert Varianz.
Induktive Statistik. Statistische Struktur (diskreter Fall) Dabei sind:
Die Vorlesung am 14. Mai (Tag nach Himmelfahrt) wird verlegt. Der Nachholtermin wird noch bekannt gegeben.
Statistische Methoden II SS 2003
Statistische Maßzahlen
Extra-SPSS-Kurse Durchführung: Birte Holtfreter Termine Di Mi Mi Ort PC-Pool Loefflerstarße.
Chi-Quadrat-Tests. Satz von Karl Pearson I X: Stichprobenvariable, die r > 2 verschieden Werte annehmen kann: Die Verteilung von X ist durch einen Wahrscheinlichkeitsvektor.
Wahrscheinlichkeitstheorie. Statistische Methoden I WS 2002/2003 Zur Geschichte der Statistik I. Beschreibende Statistik 1. Grundlegende Begriffe 2. Eindimensionales.
Probeklausur am 21. Januar 2005 statt Vorlesung. Wahrscheinlichkeitstheorie.
Grundbegriffe der (deskriptiven) Statistikder Wahrscheinlichkeitstheorie.
Statistische Methoden I WS 2004/2005 Probeklausur Freitag, 21. Januar statt Vorlesung - In 2 Wochen In 2 Wochen!
Probeklausur Die Probeklausur findet am anstelle der Vorlesung statt. 13. Juni 2003 Nächste Woche!!
Approximative Konfidenzintervalle im Bernoulli-Fall II
Test auf Normalverteilung
Chi-Quadrat-Tests. Satz von Karl Pearson I X: Stichprobenvariable, die r > 2 verschieden Werte annehmen kann: Die Verteilung von X ist durch einen Wahrscheinlichkeitsvektor.
Klausur am :00 bis 13:00 Hörsaal Loefflerstraße und Hörsaal Makarenkostraße.
Lehrstuhl für Algebra und funktionalanalytische Anwendungen
Maximum-Likelihood-Schätzer ( diskreter Fall) Likelihood-Funktion mit oder M-L-Schätzer.
Statistische Methoden II SS 2010 Vorlesung:Prof. Dr. Michael Schürmann Zeit: Freitag 13:15 -15:45 (Pause 14:45) Ort:HS Makarenkostraße (Kiste) Übungen.
Statistische Methoden II SS 2010 Vorlesung:Prof. Dr. Michael Schürmann Zeit: Freitag 13:15 -15:45 (Pause 14:45) Ort:HS Makarenkostraße (Kiste) Übungen.
Achtung Vorlesung am Montag, den 21. Juni Zeit: Uhr Ort: Kiste.
Achtung Vorlesung am Montag, den 21. Juni Zeit: Uhr Ort: Kiste.
Eigenschaften der OLS-Schätzer
 Präsentation transkript:

Statistische Methoden I WS 2001/2002 Zur Geschichte der Statistik I. Beschreibende Statistik 1. Grundlegende Begriffe 2. Eindimensionales Datenmaterial 2.1. Der Häufigkeitsbegriff 2.2. Lage- und Streuungsparameter 2.3. Konzentrationsmaße (Lorenz-Kurve) 3. Mehrdimensionales Datenmaterial 3.1. Korrelations- und Regressionsrechnung 3.2. Indexzahlen 3.3. Saisonbereinigung

II. Wahrscheinlichkeitstheorie 1. Laplacesche Wahrscheinlicheitsräume 1.1. Kombinatorische Formeln 1.2. Berechnung von Laplace-Wahrschein- lichkeiten 2. Allgemeine Wahrscheinlichkeitsräume 2.1. Der diskrete Fall 2.2. Der stetige Fall 2.3. Unabhängigkeit und bedingte Wahrscheinlichkeit 3. Zufallsvariablen 3.1. Grundbegriffe 3.2. Erwartungswert und Varianz 3.3. Binomial- und Poisson-Verteilung 3.4. Die Normalverteilung und der Zentrale Grenzwertsatz

III. Induktive Statistik 1. Schätztheorie 1.1. Grundbegriffe, Stichproben 1.2. Maximum-Likelihood-Schätzer 1.3. Erwartungstreue Schätzer 1.4. Konfidenzintervalle 1.5. Spezialfall Binomial-Verteilung 2. Spezialfall Normalverteilung 2.1. Student- und Chi-Quadrat-Verteilung 2.2. Konfidenzintervalle 3. Tests 3.1. Grundbergriffe 3.2. Tests einfacher Hypothesen (Neyman-Pearson-Test) 3.3. Tests zusammengesetzter Hypothesen 3.4. Vergleich zweier unabhängiger Stichproben 3.5. Chi-Quadrat-Tests 3.6. Kolmogorov-Smirnov-Test 3.7. Einfache Varianzanalyse

Wahrscheinlich- keitstheorie Beschreibende Statistik (= Deskriptive Statistik) Beschreibung von Datenmaterial Teil I Wahrscheinlich- keitstheorie Teil II Schließenden Statistik (= Induktive Statistik) Analyse von Datenmaterial, Hypothesen, Prognosen Teil III

Statistische Struktur (diskreter Fall) Dabei sind:

Schätzproblem Schätzer

Stichprobe (diskreter Fall)

Mathematischer Rahmen

Stichprobenfunktionen Beispiele

Stichproben (stetiger Fall)

Mathematischer Rahmen

Statistische Struktur diskret stetig

Maximum-Likelihood-Schätzer (diskreter Fall) Likelihood-Funktion M-L-Schätzer mit oder

ist die beste Erklärung Der Parameter ist die beste Erklärung für die Beobachtung 

M-L-Schätzer Erwarungswert Normalverteilte Stichprobenvariable M-L-Schätzer Erwarungswert Hier spielt es keine Rolle, ob die Varianz bekannt ist oder nicht. In jedem Fall gilt:

Normalverteilte Stichprobenvariable M-L-Schätzer Varianz  bekannt

Normalverteilte Stichprobenvariable M-L-Schätzer Varianz  unbekannt

Übersicht

Beispiel Gewicht von Äpfeln Gewicht von Äpfeln der Sorte Cox-Orange aus einem bestimmten italienischen Anbaugebiet

Erwartungstreue Schätzer Wenn der Parameter selbst geschätzt werden soll: Wenn ein allgemeines statistisches Problem vorliegt: Dabei bedeutet der Index  , dass der Erwartungswert bzgl. des W.maßes zum Parameter  genommen wird.

Schätzung des Erwartungswertes der Stichprobenvariablen X Statistisches Problem gegeben durch: Erwartungstreuer Schätzer:

Schätzung der Varianz der Stichprobenvariablen X Erwartungswert bekannt Statistisches Problem gegeben durch: Erwartungstreuer Schätzer:

Schätzung der Varianz der Stichprobenvariablen X Erwartungswert unbekannt Statistisches Problem gegeben durch: Erwartungstreuer Schätzer:

Erwartungstreuer Schätzer für den Erwarungswert Normalverteilte Stichprobenvariable Erwartungstreuer Schätzer für den Erwarungswert Hier spielt es wieder keine Rolle, ob die Varianz bekannt ist oder nicht. In jedem Fall gilt: ist erwartungstreu

Erwartungstreuer Schätzer Normalverteilte Stichprobenvariable Erwartungstreuer Schätzer für die Varianz  bekannt ist erwartungstreu

Erwartungstreuer Schätzer Normalverteilte Stichprobenvariable Erwartungstreuer Schätzer für die Varianz  unbekannt ist erwartungstreu Kein M-L-Schätzer!!

Übersicht erwartungstreu erwartungstreu erwartungstreu nicht

Achtung Aufgabe!

Konfidenzintervalle Intervallschätzung Jeder Beobachtung  wird ein Intervall C() der reellen Zahlen zugeordnet Niveau  Dabei ist die Wahrscheinlichkeit. eine Beobachtung zu machen, für die der wahre Parameter im zugehörigen Intervall liegt, größer oder gleich 1 - 

Niveau Das Niveau  wird „klein“ gewählt. (Wir nehmen in unseren Beispielen in den meisten Fällen  = 0.05 oder  = 0.1) Die Intervallbreite soll möglichst gering sein. Es gibt aber einen Zusammen- hang zwischen der Breite der Konfidenzintervalle und dem Niveau: Niveau kleiner Intervall breiter

Beispiel Kaufhaus-Konzern Kauf würde in Erwägung gezogen Kauf würde nicht in Erwägung gezogen 572 1428

Der Zentrale Grenzwertsatz

Approximative Konfidenzintervalle im Bernoulli-Fall I Konfidenzintervall zum Niveau 

Approximative Konfidenzintervalle im Bernoulli-Fall II Vereinfachung für großes n (n  100)

Achtung Aufgabe!

für den Erwartungswert Fall Normalverteilung Konfidenzintervall für den Erwartungswert Varianz bekannt Annahme: Varianz ist bekannt Konfidenzintervalle: wobei

für den Erwartungswert Fall Normalverteilung Konfidenzintervall für den Erwartungswert Varianz unbekannt Student-Verteilung (oder t-Verteilung)

Konfidenzintervall für die Varianz Erwartungswert bekannt Einseitig Fall Normalverteilung Konfidenzintervall für die Varianz Erwartungswert bekannt Einseitig Chi-Quadrat- Verteilung

Konfidenzintervall für die Varianz Erwartungswert bekannt zweiseitig Fall Normalverteilung Konfidenzintervall für die Varianz Erwartungswert bekannt zweiseitig Chi-Quadrat- Verteilung

Konfidenzintervall für die Varianz Erwartungswert unbekannt Einseitig Fall Normalverteilung Konfidenzintervall für die Varianz Erwartungswert unbekannt Einseitig Chi-Quadrat- Verteilung

Konfidenzintervall für die Varianz Erwartungswert unbekannt Zweiseitig Fall Normalverteilung Konfidenzintervall für die Varianz Erwartungswert unbekannt Zweiseitig Chi-Quadrat- Verteilung

Achtung Aufgabe!

TESTS TESTS TESTS TESTS TESTS TESTS TESTS

Worum es geht Man möchte „testen“, ob eine bestimmte Annahme (Hypothese) über Parameter der Realität entspricht oder nicht. Formulierung einer Hypothese Da man sich in der Statistik nie ganz sicher sein kann: Die „Irrtumswahr- scheinlichkeit“ sollte klein sein. Beobachtung (Stichprobe) Vorgabe: „Irrtumswahr- scheinlichkeit“ Entscheidung

Mathematischer Rahmen I TESTS Mathematischer Rahmen I Gegeben sind: Statistische Struktur Stetiger Fall Diskreter Fall Testproblem (Hypothese) Niveau 

Ablehnungsbereich Mathematischer Rahmen II Test gegeben durch: TESTS Mathematischer Rahmen II Test gegeben durch: Ablehnungsbereich Teilmenge der Grund- gesamtheit : Menge aller Beobachtungen , die zur Ablehnung der Hypothese führen

Mathematischer Rahmen III TESTS Mathematischer Rahmen III Beobachtung    (Stichprobe) Entweder Oder Beobachtung liegt im Annahmebereich Beobachtung liegt im Ablehnungsbereich Hypothese annehmen! Hypothese ablehnen!

Fehler erster und zweiter Art Entschei- dung Hypothese akzeptiert Hypothese abgelehnt Realität Hypothese wahr Fehler 1. Art Hypothese falsch Fehler 2. Art

2 Würfel Fairer Würfel ? 1/6 Gezinkter Würfel ? 1/5

für den Erwartungswert Fall Normalverteilung Test für den Erwartungswert Varianz bekannt

für den Erwartungswert Fall Normalverteilung Test für den Erwartungswert Varianz unbekannt

Achtung Aufgabe!

Achtung noch eine Aufgabe!

Vergleich zweier unabhängiger Stichproben

Vergleich zweier unabhängiger Stichproben 1. Fall 2 unabhängige Stichproben mit Stichprobenvariablen X und Y Annahmen: X und Y normalverteilt Varianz von X = Varianz von Y Hypothese: Erwartungswert von X = Erwartungswert von Y

Vergleich zweier unabhängiger Stichproben 1. Fall Prüfgröße n: Umfang der Stichprobe 1 (Stichprobenvariable X) m: Umfang der Stichprobe 2 (Stichprobenvariable Y) Ablehnungsbereich  bestimmt durch

Achtung Aufgabe!

Vergleich zweier unabhängiger Stichproben 2. Fall 2 unabhängige Stichproben mit Stichprobenvariablen X und Y Annahmen: X und Y normalverteilt n und m groß (> 30), damit Approximation der Varianzen sinnvoll Hypothese: Erwartungswert von X = Erwartungswert von Y

Vergleich zweier unabhängiger Stichproben 2. Fall Ausgangspunkt Approximation Prüfgröße Ablehnungsbereich  bestimmt durch

Achtung Aufgabe!

Chi-Quadrat-Tests

Stichprobe vom Umfang n: Satz von Karl Pearson I X: Stichprobenvariable, die r > 2 verschieden Werte annehmen kann: Die Verteilung von X ist durch einen Wahrscheinlichkeitsvektor gegeben. Stichprobe vom Umfang n:

Satz von Karl Pearson II Dann hat man: Dabei ist:

Chi-Quadrat-Test auf Anpassung Hypothese Ablehnungsbereich

Fairer Würfel? Hypothese verwerfen!

Bakterielle Infektion durch Stämme I, II, III (siehe: Gelbrich) Vermutung Typ I II III Prozentsatz 30 50 20 Konkrete Stichprobe (80 Infektionen) Typ I II III Anzahl 30 32 18

Krankmeldungen Wochentag Mo Di Mi Do Fr n Anzahl Krankmeldungen 44 28 24 20 34 150

Achtung Aufgabe!

Chi-Quadrat-Test auf Unabhängigkeit I Hypothese Ablehnungsbereich

Chi-Quadrat-Test auf Unabhängigkeit II

auf Unabhängigkeit III Chi-Quadrat-Test auf Unabhängigkeit III

Berufsstatus Vater - Sohn 38

Achtung Aufgabe!

Chi-Quadrat-Test auf Homogenität Hypothese Ablehnungsbereich

Produktion zweier Betriebe

Zusammenhang zwischen Geschlecht und Schulbildung

Mathe-Test Klasse 9 1. Versuch

Mathe-Test Klasse 9 2. Versuch

Achtung Aufgabe!

Übersicht Chi-Quadrat-Tests

Test auf Unabhängigkeit Faustregeln Chi-Quadrat-Tests Test auf Anpassung Test auf Unabhängigkeit Test auf Homogenität

Kolmogorov-Smirnov-Test

Testen, ob die Stichproben- variable eine vorgegebene Problem: Testen, ob die Stichproben- variable eine vorgegebene stetige Verteilung besitzt

Kolmogorov-Smirnov-Test I Durchführung Kolmogorov-Smirnov-Test I Berechnung Hypothese Abstände berechnen und )

Kolmogorov-Smirnov-Test II Durchführung Kolmogorov-Smirnov-Test II Arbeitstabelle Maximum der Werte der letzten beiden Spalten

Kolmogorov-Smirnov-Test III Durchführung Kolmogorov-Smirnov-Test III Ablehnungsbereich Niveau 0.05

Einfache Varianzanalyse

Stichprobenvariablen Problem: Testen, ob unabhängige Stichprobenvariablen die selbe Normal- verteilung besitzen

Mittelwerte der Klassen und Gesamtmittelwert

Durchführung der einfachen Varianzanalyse I N: Gesamtumfang der Stichproben r: Zahl der Betriebe Benötigte Daten: Mittelwerte und Varianzen der einzelnen Betriebe Gesamtmittelwert Berechnung von Q : Maß für die Varianz innerhalb der einzelnen Betriebe 1 1 Q : Maß für die Varianz zwischen den Betrieben 2 2

Durchführung der einfachen Varianzanalyse II

Durchführung der einfachen Varianzanalyse III Berechnung von Bestimmung von  Ablehnungsbereich

Viel Erfolg bei der Klausur!!!