Präsentation herunterladen
Veröffentlicht von:Karlene Laske Geändert vor über 10 Jahren
1
STATISIK LV Nr.: 0028 SS 2005 25. Mai 2005
2
Poissonverteilung Verteilung seltener Ereignisse
Große Zahl von Versuchen n, Wahrscheinlichkeit θ für Auftreten eines Ereignisses sehr klein Wahrscheinlichkeitsfunktion:
3
Poissonverteilung Erwartungswert: E(X) = μ Varianz: Var(X) = μ
Approximation der Binomialverteilung durch die Poissonverteilung: n groß und θ klein, Parameter μ = n·θ Faustregel: n > 10 und θ < 0,05. Approximation der Hypergeometrischen Vt. M/N = θ klein, N im Vergleich zu n groß, Parameter μ = n · M/N Faustregel: M/N < 0,05 und n/N < 0,05
4
Poissonverteilung Bsp. Wahrscheinlichkeit bei einer Prüfung von n=2000 Buchungen genau 3 (=x) Fehlbuchungen zu finden, Anteil der Fehlbuchungen: θ=0,001. Poissonverteilung: μ = n·θ = 2
5
Gleichverteilung Diskrete Zufallsvariable:
Jede der k möglichen Ausprägungen hat gleiche Wahrscheinlichkeit P(X=xi) = 1/k (i=1,…,k) Bsp. Wahrscheinlichkeitsverteilung der Augenzahl eines idealen Würfels: P(X=xi) = 1/6 (i=1,…,6)
6
Gleichverteilung Stetige Zufallsvariable:
Realisationen der stetigen Zufallsvariablen X liegen im Intervall [a;b] Dichtefunktion: P(x X x+Δx) = 1/(b-a) · Δx
7
Gleichverteilung
8
Gleichverteilung Verteilungsfunktion (Integration der Dichte)
9
Gleichverteilung
10
Gleichverteilung Erwartungswert: E(X) = (a+b)/2
Varianz: Var(X) = (b-a)² / 12 Bsp. Wegzeit ist gleichverteilt im Intervall [30;40]. Ges. Wahrscheinlichkeit zw. 32 und 35 Min. zu benötigen. P(32 X 35) = 1/(b-a) · Δx = 1/(40-30) · (35-32) = 0,3 Durchschnittlich benötigte Zeit: E(X) = 35
11
Normalverteilung Wichtigste theoretische Verteilung: Normalverteilung:
stetige Verteilung symmetrische Dichtefunktion S-förmige Verteilungsfunktion Erwartungswert: E(X) = µ Varianz: Var(X) = σ² Maximum der Dichte bei x=µ Wendepunkte bei x=µσ
12
Normalverteilungen Normalverteilung:
Dichtefunktion (für -∞<x<+∞ und σ>0) : Verteilungsfunktion:
13
Normalverteilung Normalverteilungen mit unterschiedlichen Parametern
14
Normalverteilung Verteilungsfunktion
15
Normalverteilung Standardnormalverteilung: Dichtefunktion:
Erwartungswert µ = 0 Varianz σ² = 1 Dichtefunktion:
16
Normalverteilung Standardnormalverteilung
17
Normalverteilung Approximation durch Normalverteilung: Mit wachsendem n nähern sich viele theoretische Vt. der Normalverteilung Empirische Verteilungen lassen sich ebenfalls oft durch die N-Vt. annähern.
18
Normalverteilung Reproduktionseigenschaft (od. Additivitäts- eigenschaft) der Normal-Vt. Additionstheorem der Normalverteilung: Die Summe (X) von n unabhängig normalverteilten Zufallvariablen X1,…,Xn ist ebenfalls normalverteilt. X = X1 + … + Xn Der Erwartungswert von X ist die Summe der einzelnen Erwartungswerte μ1,…,μn E(X) = μ = μ1 + … + μn Die Varianz von X ist die Summe der einzelnen Varianzen σ1²,…σn² Var(X) = σ² = σ1² + … + σn²
19
Stichproben Arithmetische Mittel der Stichprobe:
Varianz der Stichprobe: Anteilswert P einer Stichprobe:
20
Stichprobenverteilung
Verteilung des arithmetischen Mittels der Stichprobe (Zufallsstichprobe): Zufallsvariable X1,…,Xn Konkrete Realisation: x1,…,xn Arithmetische Mittel: Arithm. Mittel von ZV ist wieder eine ZV (Funktion von n ZV)
21
Stichprobenverteilung
Erwartungswert der Verteilung des arithmetischen Mittels: Varianz der Verteilung des arithm. Mittels Standardabweichung od. Standardfehler
22
Stichprobenverteilung
Erwartungswert u. Varianz bekannt Verteilung des arithm. Mittels? Annahme: Grundgesamtheit ist N(μ,σ²)-vt. Reproduktionseigenschaft der N-Vt: Summe von n unabhängig normal-vt. ZV ist wieder n-vt Daher ist auch das arithm. Mittel normalverteilt
23
Grenzwertsätze Verhalten des Mittelwert von n unabhängig identisch verteilten (i.i.d.) ZV X1,…,Xn, wenn n laufend erhöht wird (n→∞) Gesetz der Großen Zahlen Satz von Glivenko-Cantelli Zentraler Grenzwertsatz
24
Grenzwertsätze Gesetz der Großen Zahlen:
Beinhaltet die Aussage, dass sich der Mittelwert mit wachsendem n immer mehr um den gemeinsamen Erwartungswert µ der Xi konzentriert.
25
Grenzwertsätze Gesetz der Großen Zahlen:
Beinhaltet die Aussage, dass der Wert der empirischen Verteilungsfunktion an der Stelle t mit wachsendem n gegen den entsprechenden Wert der Verteilungsfunktion von X konvergiert.
26
Grenzwertsätze Satz von Glivenko-Cantelli:
Wert der empirischen Verteilungsfunktion konvergiert an der Stelle t mit wachsendem n gegen den entsprechenden Wert der Verteilungsfunktion von X.
27
Grenzwertsätze Zentraler Grenzwertsatz:
Aussage über die Form der Verteilung des Mittelwertes (standardisierte ZV Zn) Die Verteilungsfunktion von Zn konvergiert gegen die Standardnormalverteilung (Φ … Vt-Fkt. der N(0,1) Vt.)
28
Grenzwertsätze Aus dem Zentralen Grenzwertsatz folgt: Die Verteilung des arithm. Mittels von n unabhängig identisch verteilten Zufallsvariablen Xi (X1,…,Xn) strebt mit wachsendem Stichprobenumfang n gegen eine Normalverteilung mit dem Erwartungswert µ und Varianz σ²/n. Gleichbedeutend: Das arithmetische Mittel ist „asymptotisch normalverteilt“. Faustregel: n > 30, N-Vt. ist gute Näherung für die Vt. des arithmetischen Mittels der Stichprobe.
29
Stichprobenverteilung
Verteilung der Varianz S² der Stichprobe: Annahme: Grundgesamtheit ist N(µ,σ²)-vt. Xi sind n unabhängige normal-vt. ZV mit E(Xi)=µ und Var(Xi)= σ² (i=1,…,n) Stichprobenvarianz S² ist eine Funktion von n ZV Xi und somit wieder eine ZV.
30
Stichprobenverteilung
Verteilung der Varianz S² der Stichprobe: Chi-Quadrat Verteilung mit v=n-1 Freiheitsgraden, χ²n-1 Es gilt: Ist Z² = Xi² + … + Xn² (Summe von n quadrierten unabhängigen N(0,1)-verteilten ZV Xi), dann folgt Z² einer Chi-Quadrat Verteilung mit v Freiheitsgraden. Anzahl der unabhängigen ZV, die Z² bilden, nennt man Anzahl der Freiheitsgrade.
31
Stichprobenverteilung
χ²v Verteilung: Erwartungswert: E(Z²)=v Varianz: Var(Z²)=2v Mit wachsendem v nähert sich die χ²v Vt. einer N-Vt. mit Parametern µ=v und σ²=2v.
32
Stichprobenverteilung
Anteilswert P einer Stichprobe (P=X/n) 2 Modelle: Ziehen mit Zurücklegen Ziehen ohne Zurücklegen Bsp. Urne, N Kugeln, M schwarz, (N-M) weiße, ziehe n Kugeln (mit bzw. ohne Zurücklegen der gezogenen Kugeln), θ ist die Wahrscheinlichkeit für das Ziehen einer schwarzen Kugel.
33
Stichprobenverteilung
Ziehen mit Zurücklegen Exakte Verteilung: Binomialverteilung Wahrscheinlichkeitsfunktion der ZV X: Erwartungswert: E(X) = nθ Varianz: Var(X) = nθ(1- θ)
34
Stichprobenverteilung
Ziehen mit Zurücklegen Erwartungswert des Stichprobenanteilswertes P: E(P) = 1/n E(x) = θ Varianz des Stichprobenanteilswertes P: Var(P) = 1/n² Var(X) = θ(1- θ) / n Standardfehler des Anteilswertes:
35
Stichprobenverteilung
Approximation durch Normalverteilung (Faustregel: nθ(1- θ) ≥ 9) Erwartungswert: E(P) = µ = nθ Varianz: Var(P) = σP² = nθ(1- θ)
36
Stichprobenverteilung
Ziehen ohne Zurücklegen Exakte Verteilung: Hypergeometrische Vt. Wahrscheinlichkeitsfunktion der ZV X: Erwartungswert: E(X) = n M/N Varianz: Var(X) = nθ(1- θ) · (N-n)/(N-1)
37
Stichprobenverteilung
Ziehen ohne Zurücklegen: Erwartungswert des Stichprobenanteilswertes: E(P) = 1/n E(X) = θ Varianz des Stichprobenanteilswertes: Var(P) = 1/n² Var(X) = θ(1- θ)/n · (N-n)/(N-1) Standardfehler des Anteilswertes: Endlichkeitskorrektur = 1 setzen, wenn n bzgl. N sehr klein ist (Faustregel: n/N < 0,05)
38
Stichprobenverteilung
Approximation durch Normalverteilung µ = E(P) = θ σ² = Var(P) = θ(1- θ)/n · (N-n)/(N-1)
39
Stichprobenverteilung
Die Stichprobenverteilungen des arithmetischen Mittels, der Varianz und des Anteilswertes können also durch die Normalverteilung approximiert werden.
40
Stichprobenverteilung
Differenz zweier arithmetischer Mittel: Annahmen: 2 unabhängige Stichproben Beide Grundgesamtheiten sind annähernd N-vt Stichprobenverteilung der Differenz: N-Vt Erwartungswert: Varianz:
41
Stichprobenverteilung
Differenz zweier Anteilswerte: Annahmen: 2 unabhängige Stichproben P1, P2 annähernd n-vt. und N1, N2 so groß, dass Endlichkeitskorrektur vernachlässigbar ist. Stichprobenverteilung: N-Vt Erwartungswert: Varianz:
42
Stichprobenverteilung
Quotient zweier Varianzen: Annahmen: 2 unabhängige Stichproben (n1, n2) σ1² und σ2² aus n-vt Grundgesamtheiten Quotient:
43
Stichprobenverteilung
Stichprobenverteilung: F-Verteilung mit v1 und v2 Freiheitsgraden, Fv1,v2. Für v2 > 2 gilt: Erwartungswert: E(F) = v2 / (v2-2) Varianz:
44
Schätzverfahren Schluss von der Grundgesamtheit auf eine Stichprobe: Inklusionsschluss (direkter Schluss) Schluss von einer Stichprobe auf Parameter einer Grundgesamtheit: Repräsentationsschluss (indirekter Schluss) Unterscheidung: Punktschätzer (einziger Schätzwert) Intervallschätzer (Konfidenzintervall)
45
Schätzverfahren Punktschätzer: Für den zu schätzenden Parameter wird nur ein einziger Schätzwert angegeben. Bsp. Schätze das unbekannte arithm. Mittel einer Grundgesamtheit μ durch das arithm. Mittel der Stichprobe Vorsicht: Die in einer Stichprobe realisierten Merkmalsausprägungen sind zufallsabhängig, Punktschätzer stimmen daher nur in den seltensten Fällen mit dem wahren Parameter überein.
46
Schätzverfahren Intervallschätzer: Ausgehend von einer Stichprobe wird ein Intervall bestimmt, in dem der zu schätzende Parameter der Grundgesamtheit mit einer bestimmten vorgegebenen Wahrscheinlichkeit liegt (Konfidenzintervall). Irrtumswahrscheinlichkeit ≤ α Konfidenzintervall zum Niveau 1-α (Vertrauensbereich od. Vertrauensintervall)
47
Schätzverfahren Ges: Konfidenzintervall für das arithm. Mittel: ZV
Symmetrische Wahrscheinlichkeitsintervall Symmetrie: z(α /2) = –z(1-α/2) daher: z = –z(1-α/2) und –z = z(α /2) und
48
Schätzverfahren In diesem Wahrscheinlichkeitsintervall liegt das arithm. Mittel mit der Wahrscheinlichkeit 1- α. Gesucht ist ist aber nicht das Ws-Intervall der ZV, sondern das Konfidenzintervall für das unbekannte arithm. Mittel µ der Grundgesamtheit. Varianz σ² der Grundgesamtheit bekannt Varianz σ² der Grundgesamtheit unbekannt
49
Schätzverfahren Konfidenzintervall für µ bei bekannter Varianz σ² der Grundgesamtheit: Konkreter Stichprobenmittelwert
50
Schätzverfahren Konfidenzintervall für µ bei unbekannter Varianz σ² der Grundgesamtheit: Statt der unbekannte Varianz σ² wird die Stichprobenvarianz S² verwendet. Zufallsvariable: T ist t- verteilt mit v=n-1 Freiheitsgraden
51
Verteilungen Es gilt: Zufallsvariable:
Ist T der Quotient einer Standardnormalverteilung und der Quadratwurzel des Mittelwerts von n quadrierten unabhängigen N(0,1)-verteilten ZV Xi, dann folgt T einer t-Verteilung mit v=n Freiheitsgraden. Zufallsvariable: T ist t- verteilt mit v=n Freiheitsgraden T~tn t-Verteilung ist symmetrisch
52
Verteilungen t- Verteilung mit v Freiheitsgraden:
Erwartungswert (für n>1): E(T) = 0 Varianz (für n>2): Var(T) = n / (n-2) Für n→∞ geht die t-Verteilung in die N(0,1) über. Approximation durch N(0,1)-Vt für n ≥ 30
53
Schätzverfahren Wahrscheinlichkeitsintervall für das arithm. Mittel bei unbekannter Varianz: Wobei t = t(1-α/2);n-1 = – t(α/2);n-1 die Punkte sind, bei denen die Verteilungsfunktion der t- Verteilung mit n-1 Freiheitsgraden die Werte 1-α/2 bzw. α/2 besitzt.
54
Schätzverfahren Konfidenzintervall für das arithm. Mittel bei unbekannter Varianz: Konkreter Stichprobenmittelwert Konkrete Stichprobenvarianz
55
Schätzverfahren Konfidenzintervall für den Anteilswert:
Ann. genügend großer Stichprobenumfang, d.h. Approximation durch N-Vt möglich, E(P) = θ und Var(P) = σP² Standardisierte ZV:
56
Schätzverfahren Wahrscheinlichkeitsintervall: Konfidenzintervall:
Ist σP unbekannt, verwendet man stattdessen die Stichprobenvarianz des Anteilswertes als Schätzer.
57
Schätzverfahren Konfidenzintervall für die Varianz
ZV (n-1)S² / σ² ist χ² verteilt mit v=n-1 Freiheitsgraden Wahrscheinlichkeitsintervall: Konfidenzintervall:
58
Stichprobenumfang Bisher: Jetzt:
Geg: Stichprobenumfang n, Sicherheitsgrad 1-α Ges: Konfidenzintervall Jetzt: Geg: Konfidenzintervall, Sicherheitsgrad 1-α Ges: Stichprobenumfang Absoluter Fehler Δμ = zσX ist ein Maß für die Genauigkeit der Schätzung Breite des Konfidenzintervalls: 2Δμ
59
Stichprobenumfang Frage: Welchen Stichprobenumfang benötigt man, um einen Parameter (arithm. Mittel) bei vorgegebener Genauigkeit und vorgegebenem Sicherheitsgrad zu schätzen?
60
Eigenschaften von Schätzern
Eigenschaften von Schätzfunktionen: Erwartungstreue Effizienz Konsistenz Suffizienz
61
Eigenschaften von Schätzern
Erwartungstreue Eine Schätzfunktion heißt erwartungstreu (unverzerrt, unbiased), wenn ihr Erwartungswert mit dem wahren Parameter übereinstimmt. Bedingung: Es gilt:
62
Eigenschaften von Schätzern
Effizienz: Von 2 erwartungstreuen Schätzfunktionen gilt jene als effizienter (wirksamer), die die kleinere Varianz aufweist. Eine Schätzfunktion heißt effizient, wenn folgende Bedingungen erfüllt sind:
63
Eigenschaften von Schätzern
Konsistenz: Eine Schätzfunktion heißt konsistent, wenn der Schätzwert bei laufender Vergrößerung des Stichprobenumfangs (n→∞ oder n→N) mit dem zu schätzenden Parameter zusammenfällt.
64
Eigenschaften von Schätzern
Suffizienz: Eine Schätzfunktion heißt suffizient (erschöpfend), wenn sie sämtliche Informationen über den zu schätzenden Parameter, welche die Stichprobe enthält ausschöpft.
65
Schätzverfahren Methode der Kleinsten Quadrat Maximum Likelihood
Momentenmethode
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.