Wahrscheinlichkeitstheorie
Statistische Methoden I WS 2002/2003 Zur Geschichte der Statistik I. Beschreibende Statistik 1. Grundlegende Begriffe 2. Eindimensionales Datenmaterial 2.1. Der Häufigkeitsbegriff 2.2. Lage- und Streuungsparameter 2.3. Konzentrationsmaße (Lorenz-Kurve) 3. Mehrdimensionales Datenmaterial 3.1. Korrelations- und Regressionsrechnung 3.2. Indexzahlen 3.3. Saisonbereinigung
II. Wahrscheinlichkeitstheorie 1. Laplacesche Wahrscheinlicheitsräume 1.1. Kombinatorische Formeln 1.2. Berechnung von Laplace-Wahrschein- lichkeiten 2. Allgemeine Wahrscheinlichkeitsräume 2.1. Der diskrete Fall 2.2. Der stetige Fall 2.3. Unabhängigkeit und bedingte Wahrscheinlichkeit 3. Zufallsvariablen 3.1. Grundbegriffe 3.2. Erwartungswert und Varianz 3.3. Binomial- und Poisson-Verteilung 3.4. Die Normalverteilung und der Zentrale Grenzwertsatz
Wahrscheinlich- keitstheorie Beschreibende Statistik (= Deskriptive Statistik) Beschreibung von Datenmaterial 1. Semester Wahrscheinlich- keitstheorie Schließenden Statistik (= Induktive Statistik) Analyse von Datenmaterial, Hypothesen, Prognosen 2. Semester
Laplacescher Wahrscheinlicheitsraum
Wahrscheinlichkeitstheoretische Interpretation von Mengenoperationen Vereinigung Durchschnitt
Differenz Komplement
Wahrscheinlichkeitsräume
Eigenschaften eines Wahrscheinlichkeitsmaßes Daraus ergeben sich:
Urnenmodelle
Achtung Aufgabe!
Die Normalverteilung (Gauß-Verteilung) (Gaußsche Glockenkurve)
Die Poisson-Verteilung
Man erhält eine Wahrscheinlichkeitsverteilung, weil gilt: Notation
Die Binomialverteilung
Man erhält eine Wahrscheinlichkeitsverteilung, weil gilt: Notation
Die geometrische Verteilung Man erhält eine Wahrscheinlichkeitsverteilung, weil gilt:
Die hypergeometrische Verteilung Notation
Sie beträgt gerade H(n, N, m)(k)! Eine Urne enthält n Kugeln, davon N weiße und n - N schwarze. Aus der Urne werden nacheinander m Kugeln ohne Zurücklegen gezogen. Wie groß ist die Wahrscheinlichkeit, genau k weiße Kugeln zu ziehen? Sie beträgt gerade H(n, N, m)(k)!
Achtung Aufgabe!
Achtung noch eine Aufgabe!
Wahrscheinlichkeitsdichten
Die Exponential-Verteilung
Die Gauß- oder Normalverteilung
Gauß-Bildnis und –Kurve auf 100 DM-Schein
Die Cauchy-Verteilung
Die Student- oder t-Verteilung Hängt von Parameter n ab!
Die Chi-Quadrat-Verteilung Hängt ebenfalls von Parameter n ab!
Unabhängigkeit Vier Spielkarten zeigen auf der Vorderseite die folgenden Aufschriften: 1 1 1 1 Eine Karte wird zufällig gezogen. Ereignisse A, B und C A : „Oben steht eine 0“ B: „In der Mitte steht eine 0“ C: „Unten steht eine 0“
Man hat zwar: Trotzdem sind die Ereignisse A, B und C nicht unabhängig: d. h. C kann nicht eintreten, wenn A und B eintreten.
Allgemein definiert man:
Bedingte Wahrscheinlichkeiten Die Belegschaft eines Betriebes wird nach Rauchern und Nicht- rauchern eingeteilt. Dabei ergibt sich die folgende Tabelle:
Also haben wir: Allgemein definiert man:
Achtung Aufgabe!
Achtung Aufgabe!
Pfadregel
Dann hat man:
Baumdiagramm START 1 2 3 1.1 1.2 2.1 3.1 3.2 3.3 p(1) p(3) p(2) 1.1.1 1.1.2 1.2.1 1.2.2 1.2.3 2.1.1 2.1.2 2.1.3 3.1. 3.2.1 3.2.2 3.3.1 3.3.2 (Eigentlich z. B. b(1.2.1) statt 1.2.1)
Urne mit roten und grünen Kugeln Wir betrachten eine Urne mit einer roten und 3 grünen Kugeln. Stufe: Eine Kugel wird zufällig gezogen, ihre Farbe notiert. Anschließend werden diese und eine Kugel derselben Farbe in die Urne zurückgelegt. 2. Stufe: Nach dem guten Mischen wird erneut eine Kugel zufällig gezogen und deren Farbe notiert.
Baumdiagramm START 3/4 1/4 1 4/5 1/5 3/5 2/5 1 1
Achtung Aufgabe!
Formel von der totalen Wahrscheinlichkeit Einkommensverteilung der Haushalte in einer bestimmten Gegend Anteil der Haushalte, die ein Auto > DM 40 000,- anschaf- fen, in den verschiedenen Einkommensklassen
Also nach der Formel für die totale Wahrscheinlichkeit: Es ergibt sich: 5 Also nach der Formel für die totale Wahrscheinlichkeit:
Allgemein: Formel von der totalen Wahrscheinlichkeit
Satz von Bayes In einer Stadt vermutet man, dass für die Bevölkerung die folgende Aufteilung in Deutsche, Italiener und Ausländer, die keine Italiener sind, besteht: wobei die letzte Zeile den jeweiligen Anteil von Personen in der Bevölkerungsgruppe angibt, die gerne Spaghetti bestellen.
Jemand bestellt in einer Gaststätte Spaghetti. Wie groß ist die Wahrscheinlichkeit, dass dieser Gast ein Deutscher, ein Italiener oder ein nicht-italienischer Aus- länder ist? D: „Der Gast ist ein Deutscher“ I: „Der Gast ist ein Italiener“ A: „Der Gast ist ein Ausländer, aber kein Italiener“ S: „Der Gast bestellt Spaghetti“
Nach der Formel für die totale Wahrscheinlichkeit hat man: Daraus ergibt sich nach dem Satz von Bayes
Satz von Bayes
Lernen aus Erfahrung Beispiel Eine Urne enthält 4 Kugeln.Wir wissen, dass eine der folgen- den Situationen A1, A2 oder A3vorliegt: A1: eine Kugel ist rot, die drei anderen sind grün A2: zwei Kugeln sind rot, die beiden anderen grün A3: drei Kugeln sind rot, eine ist grün Die Wahrscheinlichkeiten für die drei Möglichkeiten sind un- bekannt. Wir setzen: P(A1) = p1 P(A2) = p2 P(A3) = p3
„Bei jedem Zug zeigt B sich eine rote Kugel“ Wir ziehen aus der Urne m Kugeln mit Zurücklegen. Nehmen wir nun an, dass das Ereignis B geschieht. „Bei jedem Zug zeigt sich eine rote Kugel“ B Dann hat man:
Nach dem Satz von Bayes erhalten wir: Ebenso:
Unabhängig von den Werten für p1, p2 und p3 hat man: Für große m nähert sich die bedingte Wahr- scheinlichkeit für „A3 gegeben B“ dem Wert 1, während sich die bedingten Wahrscheinlich- keiten für A1 und A2 dem Wert 0 annähern.
Grundbegriffe der (deskriptiven) Statistik der Wahrscheinlichkeitstheorie
Verteilungsfunktion Beispiel „Würfel“
Beispiel „n-facher Münzwurf“ Verteilungsfunktion Beispiel „n-facher Münzwurf“
Verteilungsfunktion der Normalverteilung I
Verteilungsfunktion der Normalverteilung II
Beispiel „Haushaltsgröße“ Verteilungsfunktion Beispiel „Haushaltsgröße“
Beispiel „Haushaltsgröße“
Häufigkeitstabelle für das Jahr 1980 (laut Schlittgen) Verteilungsfunktion
Zufallsvariablen Verteilung Verteilungsfunktion Wahrscheinlichkeitsfunktion Dichtefunktion Zufallsvariablen Verteilung Die Verteilung einer ZV ist ein Wahrscheinlichkeitsmaß auf den reellen Zahlen diskret stetig
Wahrscheinlichkeitsfunktion diskret f nennt man Wahrscheinlichkeitsfunktion von X
stetig f nennt man Dichtefunktion von X
Verteilungsfunktion diskret stetig
diskret stetig
Erwartungswert und Varianz I Der endliche Fall Erwartungswert Varianz
Die Binomialverteilung
Erwartungswert Varianz
Gegeben seien n Zufallsvariablen Dann gilt immer: Wenn gilt dann hat man auch Gleichheit von Bienaymé
Erwartungswert und Varianz II Der diskrete unendliche Fall Dabei nehmen wir an, dass Erwartungswert Varianz
Die Poisson-Verteilung
Erwartungswert Varianz
Erwartungswert und Varianz III Der stetige Fall f ist die Wahrscheinlichkeitsdichte. Dabei nehmen wir an, dass
Erwartungswert Varianz
Die Gauß- oder Normalverteilung
Achtung Aufgabe!
Achtung noch eine Aufgabe!
Dichte Verteilung Verteilungsfunktion
Erwartungswert Varianz
Die hypergeometrische Verteilung Notation
Erwartungswert Varianz
Die geometrische Verteilung Man erhält eine Wahrscheinlichkeitsverteilung, weil gilt:
Erwartungswert Varianz
Die Exponential-Verteilung
Dichte Verteilung Verteilungsfunktion
Erwartungswert Varianz
Beispiele Poisson-verteilter Zufallsvariablen Anzahl der pro Zeiteinheit abgestrahlten Teilchen eines radioaktiven Präparats Anzahl der pro Zeiteinheit an einer Tankstelle tankenden PKW Anzahl der Sechser pro Ausspielung im Lotto Anzahl der pro Jahr von einer Versicherung zu regulierenden Schadensfälle Anzahl der innerhalbeines Tages geborenen Kinder
Bäckerei Brösel Annahmen X : Anzahl der Kunden in der Bäckerei Brösel zwischen 7.00 Uhr und 7.15 Uhr n : Anzahl der betrachteten Haushalte Annahmen Die Wahrscheinlichkeit p, dass ein Haushalt zu der Zeit bei Brösel einkauft, ist bei allen Haushalten gleich Die Haushalte entscheiden unabhängig voneinander, ob sie bei Brösel einkaufen oder nicht
Dann gilt: d. h.
Nun wird die Anzahl n der betrachteten Haushalte vergrößert. Die „Einkaufswahrscheinlichkeit“ p hänge dabei so von n ab, dass gilt: Dann konvergiert die Verteilung von X gegen eine Poisson- Verteilung. Genauer: Man hat im Limes n gegen unendlich
Der Zentrale Grenzwertsatz
Achtung Aufgabe!
Tafel für die Verteilungsfunktion bei Normalverteilung
Achtung noch eine Aufgabe!
Beispiel Gewicht von Äpfeln Schätzer von Gewicht von Äpfeln der Sorte Cox-Orange aus einem bestimmten italienischen Anbaugebiet Schätzer von
Wichtige Eigenschaft der Normalverteilung Für unabhängige normalverteilte Zufallsvariablen X und Y hat man