Statistische Methoden I WS 2009/2010 Vorlesung:Prof. Dr. Michael Schürmann Zeit: Montag 13:15 -15:45 (Pause 14:45) Ort:HS Makarenkostraße (Kiste) Übungen Gruppe S1: Marcus Vollmer Di 8: :00 SR 105/106 Gruppe S2: Marcus Vollmer Di 10: :00 SR 105/106 Gruppe S3: Franz Huwald Di 12: :00 SR 105/106 Gruppe S4: Hermann Haase Di 12: :00 SR 4 Gruppe S5: Hermann Haase Mi 8:00 – 10:00 SR 5 Gruppe S6: Sebastian Grapenthin Mi 10:00 – 12:00 SR 105/106 Gruppe S7: Stefan Voß Mi 10: :00 SR 109 Gruppe S8: Sebastian Grapenthin Mi 12: :00 SR 105/106
SR 109 SR 105/106 Domstraße 20 Beginn der Übungen diese Woche SR 4 SR 5 Franz-Mehring-Straße
Institut für Mathematik und Informatik Lehrstuhl für Algebra und funktionalanalytische Anwendungen
Statistische Methoden I WS 2009/2010 Literatur 1) G. Bamberg, F. Baur: Statistik. Oldenbourg 2) G. Bamberg, F. Baur: Statistik-Arbeitsbuch. Oldenbourg 3) L. Fahrmeir, R. Künstler, I. Pigeot, G. Tutz: Statistik. Springer 4) J. Schira: Statistische Methoden der VWL und BWL. Pearson Education 5) H. Haase: Stochastik für Betriebswirte. Shaker 6) J. Hartung: Statistik. Oldenbourg 7) R. Schlittgen: Einführung in die Statistik. Oldenbourg 8) A. Quatember: Statistik ohne Angst vor Formeln. Pearson Studium 9) H.-D. Radke: Statistik mit Excel. Markt + Technik
Statistische Methoden I WS 2009/2010 Einleitung: Wie schätzt man die Zahl der Fische in einem See? Zur Geschichte der Statistik I. Beschreibende Statistik 1. Grundlegende Begriffe 2. Eindimensionales Datenmaterial 2.1. Der Häufigkeitsbegriff 2.2. Lage- und Streuungsparameter 2.3. Konzentrationsmaße (Lorenz-Kurve) 3. Mehrdimensionales Datenmaterial 3.1. Korrelations- und Regressionsrechnung 3.2. Indexzahlen 3.3. Saisonbereinigung
II. Wahrscheinlichkeitstheorie 1. Laplacesche Wahrscheinlicheitsräume 1.1. Kombinatorische Formeln 1.2. Berechnung von Laplace-Wahrschein- lichkeiten 2. Allgemeine Wahrscheinlichkeitsräume 2.1. Der diskrete Fall 2.2. Der stetige Fall 2.3. Unabhängigkeit und bedingte Wahrscheinlichkeit 3. Zufallsvariablen 3.1. Grundbegriffe 3.2. Erwartungswert und Varianz 3.3. Binomial- und Poisson-Verteilung 3.4. Die Normalverteilung und der Zentrale Grenzwertsatz
4. Markov-Ketten 4.1. Übergangsmatrizen 4.2. Grenzverhalten irreduzibler Markov-Ketten 4.3. Gewinnwahrscheinlichkeiten 4.4. Beispiel Ruin der Spieler 4.5. Anwendungen
III. Induktive Statistik 1. Schätztheorie 1.1. Grundbegriffe, Stichproben 1.2. Maximum-Likelihood-Schätzer 1.3. Erwartungstreue Schätzer 1.4. Konfidenzintervalle 1.5. Spezialfall Binomial-Verteilung 2. Spezialfall Normalverteilung 2.1. Student- und Chi-Quadrat-Verteilung 2.2. Konfidenzintervalle
3. Tests 3.1. Grundbegriffe 3.2. Tests einfacher Hypothesen (Neyman-Pearson-Test) 3.3. Tests zusammengesetzter Hypothesen 3.4. Vergleich zweier unabhängiger Stichproben 3.5. Chi-Quadrat-Tests 3.6. Kolmogorov-Smirnov-Test 3.7. Einfache Varianzanalyse
Beschreibende Statistik (= Deskriptive Statistik) Beschreibung von Datenmaterial Vorstufe zur Schließenden Statistik (= Induktive Statistik) Analyse von Datenmaterial, Hypothesen, Prognosen 1. Semester 2. Semester
Fisch-Statistik
Ein Mensch, der von Statistik hört, denkt dabei nur an Mittelwert. Er glaubt nicht dran und ist dagegen, ein Beispiel soll es gleich belegen: Doch wär er klug und nähme Schrot - dies sei gesagt, ihn zu bekehren - er würde seine Chancen mehren: Der Schuss geht ab, die Ente stürzt, weil Streuung ihr das Leben kürzt. (aus: J. Hartung, B. Elpert, K.-H. Klösener: Statistik) Ein Jäger auf der Entenjagd hat einen ersten Schuss gewagt. Der Schuss, zu hastig aus dem Rohr, lag eine gute Handbreit vor. Der zweite Schuss mit lautem Krach lag eine gute Handbreit nach. Der Jäger spricht ganz unbeschwert voll Glauben an den Mittelwert: Statistisch ist die Ente tot.
Zur Geschichte der Statistik Diese ist zunächst eine Geschichte der Wahrscheinlichkeitstheorie. Ursprung der Wahrscheinlichkeitstheorie: Glücksspiele Anfrage des Chevalier de Méré an den französischen Mathematiker Blaise Pascal ( )
aus dem Jahre Man betrachte die beiden folgenden Wetten: 1) 1 Würfel wird 4 mal geworfen. Gesetzt wird darauf, dass dabei mindenstens eine 6 auftritt. 2) 2 Würfel werden gleichzeitig 24 mal geworfen. Gesetzt wird darauf, dass dabei mindestens ein 6er-Pasch (d. h. beide Würfel zeigen die 6) auftritt. Daraufhin Korrespondenz zwischen Blaise Pascal und Pierre de Fermat ( ) über dieses Problem.
Der Chevalier hatte angefragt, ob es stimme, dass man bei der Wette 1) öfter gewinnt als bei Wette 2). Pascal und Fermat konnten diese Vermutung des Chevaliers mathematisch bestätigen. (Wir führen die Rechnung nachher noch hier durch.) Weitere Stationen der anfänglichen Entwicklung der Wahrscheinlich- keitstheorie: Abraham de Moivre ( ) Zentraler Grenzwertsatz in der elementaren Form: Approximation der Binomial-Verteilung durch die Normalverteilung. The Doctrine of Chances
Thomas Bayes ( ) Umgekehrte Vorgehensweise: Welche Rückschlüsse kann man bei Kenntnis der Ausgänge eines Spiels auf die Wahrscheinlichkeiten machen? (Bayessche Formel)
Pierre Simon Marquis de Laplace ( ) Théorie Analytique des Probabilités Erste Zusammenfassung des Wissensstandes auf dem Gebiet der Wahrscheinlichkeitstheorie Jacob Bernoulli ( ) Gesetz der großen Zahlen: Relative Häufigkeiten konvergieren gegen die Wahrscheinlichkeit des Ereignisses (Wiederholung voneinander unabhängiger Versuche) Ars Conjectandi
Adrien Marie Legendre ( ) Gauß (= Normal)-Verteilung Methode der kleinsten Quadrate Carl Friedrich Gauß ( )
Entwicklung der Statistik R. A. Fisher ( ) The Design of Experiments Varianzanalyse F-Verteilung (G. W. Snedecor) Karl Pearson ( ) Chi-Quadrat-Verteilung Chi-Quadrat-Test W. S. Gosset ( ) (Pseudonym Student) Student-Verteilung (= t-Verteilung) Ersetzt die Gauß-Verteilung, wenn Varianz nicht bekannt.
J. Neyman E. S. Pearson Entwicklung der Testtheorie seit Beginn des 2.Weltkrieges Neyman-Pearson-Test Abraham Wald ( ) Statistical Decision Functions Entscheidungstheorie
Eine Menge ist eine Zusammenfassung bestimmter wohl unterschiedener Objekte unserer Anschauung oder unseres Denkens - welche Elemente der Menge genannt werden - zu einem Ganzen. Georg Cantor ( )
Charakterisierung von Merkmalen Merkmalen quantitative: Merkmale unterscheiden sich nach der Größe qualitative: Merkmale unterscheiden sich nach der Art Unterscheidung nach der zugrundeliegenden Werteskala Nominal- Ordinal- metrische Skala Unterscheidung zwischen qualitativen quantitativen
Nominal: keine Rangordnung Ordinal: Rangordnung, aber Zwischenwerte nicht interpretierbar metrisch: Rangordnung (Reihenfolge), Werte zwischen 2 Werten erlauben eine Interpretation Unterscheidung nach Merkmalen diskret: Menge der Werte abzählbar (evtl. abzählbar unendlich) stetig: Menge der Werte kontinuierlich (z.B. reelle Zahlen oder ein Intervall reeller Zahlen) diskreten stetigen
Häufigkeiten Gegeben ist eine Datenliste (Urliste) (hier z. B. die Klausur-Noten von 50 Studenten) Geordnete Daten
Absolute Häufigkeiten H(1) = 5 H(2) = 6 H(3) = 18 H(4) = 15 H(5) = 6 h(1) = 0.1 h(2) = 0.12 h(3) = 0.36 h(4) = 0.3 h(5) = 0.12 Relative Häufigkeiten Kumulierte relative Häufigkeiten F(1) = 0.1 F(2) = 0.22 F(3) = 0.58 F(4) = 0.88 F(5) = 1
Fakultäten EMAU Berechnung der Winkel für ein Kreisdiagramm T: Theologische RSW: Rechts- und Staatswiss. Med: Medizinische Phil: Philosophische MathNat: Mathematisch-Naturwissenschaftliche K: Studienkolleg,... h(T) = h(RSW) = 0.22 h(Med) = h(Phil) = h(MathNat) = h(K) = Grad 79.2 Grad Grad Grad Grad 7.92 Grad WS 00/01 alte Zahlen
Kreisdiagramm Fakultäten EMAU
Fakultät WS00/0101/0202/0303/0404/0505/0606/0707/0808/09 Philosophische Fakultät Math.-nat. Fakultät Rechts- u. staatsw. Fak Medizinische Fakultät Theologische Fakultät Kolleg, DSH Kurs Gesamt
h(T) = h(RSW) = 0.22 h(Med) = h(Phil) = h(MathNat) = h(K) = Grad 79.2 Grad Grad Grad Grad 7.92 Grad WS 05/06
Stabdiagramm Zähne
Histogramm Zähne
Empirische Verteilungsfunktion Zähne