Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

Ähnliche Präsentationen


Präsentation zum Thema: "1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005."—  Präsentation transkript:

1 1 STATISIK LV Nr.: 1852 WS 2005/ Dezember 2005

2 2 Theorie Verteilungen –Diskrete Verteilungen –Stetige Verteilungen Stichproben –Verteilung –Grenzwertsätze Schätzen

3 3 Theoretische Verteilungen Diskrete Verteilungen –Binomialverteilung –Hypergeometrische Verteilung –Poissonverteilung –... Stetige Verteilungen –Gleichverteilung –Exponentialverteilung –Normalverteilung –Chi-Quadrat Verteilung –t-Verteilung (Studentverteilung) –F-Verteilung –...

4 4 Binomialverteilung Wahrscheinlichkeiten für die Häufigkeit des Eintreffens bestimmter Ereignisse bei Bernoulli-Experimenten berechnen. Bernoulli-Experiment: Folge von Bernoulli- Versuchen. Urnenmodell mit Zurücklegen –Es gibt nur 2 mögliche Ausgänge: A und Ā –Wahrscheinlichkeiten für Eintreten von A (θ) und Ā (1- θ) sind konstant –Versuche sind voneinander unabhängig.

5 5 Binomialverteilung Bsp. Bernoulli-Experiment: –fünfmaliges Werfen einer Münze, Zufallsvariable X Anzahl der Zahlen, Realisation x = 0, 1, 2, 3, 4, 5 –Wahrscheinlichkeiten für Eintreten von A: W(X=x) = f(x) = ?

6 6 Binomialverteilung Wahrscheinlichkeit des Auftretens einer bestimmten Realisation x: W(X=x) = f(x) Wahrscheinlichkeitsfunktion der Binomialverteilung:

7 7 Binomialverteilung Bsp. Münzwurf (n=5), Wahrscheinlichkeit dass genau 2-mal Zahl geworfen wird: W(X=2)

8 8 Binomialverteilung Wahrscheinlichkeit, dass die Zufallsvariable X höchstens den Wert x annimmt: Verteilungsfunktion F B (x;n,θ)

9 9 Binomialverteilung Bsp. Münzwurf (n=5), Wahrscheinlichkeit dass höchstens 2-mal Zahl geworfen wird: W(X 2)

10 10 Binomialverteilung Erwartungswert der Binomialverteilung: E(X) = n·θ Varianz der Binomialverteilung: Var(X) = n·θ·(1-θ) Bsp. Münzwurf: –E(X) = 5·0,5 = 2,5 –Var(X) = 5·0,5·(1-0,5) = 1,25

11 11 Hypergeometrische Verteilung Urnenmodell Ziehen ohne Zurücklegen: –Urne mit N Kugeln (M schwarze, N-M weiße) –Zufallsstichprobe: ziehe n Kugeln ohne Zurücklegen –Wahrscheinlichkeit, dass unter den n gezogenen Kugeln genau x schwarze zu finden sind? Ziehen ohne Zurücklegen, keine Berücksichtigung der Reihenfolge.

12 12 Hypergeometrische Verteilung Urnenmodell: –Aus M schwarzen Kugeln genau x auswählen: Anzahl der Kombinationen –Aus N-M weißen Kugeln genau n-x auswählen: Anzahl der Kombinationen –Jede mögl. Stpr. x schwarze aus M kann mit jeder mögl. Stpr. n-x weiße aus N-M kombiniert werden. –Daher: Gesamtzahl der Möglichkeiten genau x schwarze zu ziehen: –Gesamtzahl der Möglichkeiten aus N Kugeln n zu ziehen:

13 13 Hypergeometrische Verteilung Wahrscheinlichkeit genau x schwarz Kugeln zu ziehen: Wahrscheinlichkeitsfunktion der Hypergeometrischen Verteilung:

14 14 Hypergeometrische Verteilung Verteilungsfunktion: Summation der Einzelwahrscheinlichkeiten Liefert Wahrscheinlichkeit für höchstens x schwarze Kugeln

15 15 Hypergeometrische Verteilung Bsp. Sortiment von N=8 Dioden, es werden n=3 zufällig gezogen (ohne Zurücklegen), M=5 der Dioden sind defekt. Ges: Wahrscheinlichkeit, dass genau 2 (=x) der 3 gezogenen Dioden defekt sind.

16 16 Hypergeometrische Verteilung Erwartungswert: E(X) = n · M/N Varianz Var(X) = n · M/N · (N-M)/N · (N-n)/(n-1) Approximation durch Binomialverteilung: –Wenn N, M, N-M groß und n klein, Parameter der Binomialverteilung: θ = M/N –Faustregel: Approximation, wenn n/N < 0,05

17 17 Poissonverteilung Verteilung seltener Ereignisse Große Zahl von Versuchen n, Wahrscheinlichkeit θ für Auftreten eines Ereignisses sehr klein Wahrscheinlichkeitsfunktion:

18 18 Poissonverteilung Erwartungswert: E(X) = μ Varianz: Var(X) = μ Approximation der Binomialverteilung durch die Poissonverteilung: –n groß und θ klein, Parameter μ = n·θ –Faustregel: n > 10 und θ < 0,05. Approximation der Hypergeometrischen Vt. –M/N = θ klein, N im Vergleich zu n groß, Parameter μ = n · M/N –Faustregel: M/N < 0,05 und n/N < 0,05

19 19 Poissonverteilung Bsp. Wahrscheinlichkeit bei einer Prüfung von n=2000 Buchungen genau 3 (=x) Fehlbuchungen zu finden, Anteil der Fehlbuchungen: θ=0,001. Poissonverteilung: μ = n·θ = 2

20 20 Gleichverteilung Diskrete Zufallsvariable: Jede der k möglichen Ausprägungen hat gleiche Wahrscheinlichkeit P(X=x i ) = 1/k (i=1,…,k) Bsp. Wahrscheinlichkeitsverteilung der Augenzahl eines idealen Würfels: P(X=x i ) = 1/6(i=1,…,6)

21 21 Gleichverteilung Stetige Zufallsvariable: Realisationen der stetigen Zufallsvariablen X liegen im Intervall [a;b] Dichtefunktion: P(x X x+Δx) = 1/(b-a) · Δx

22 22 Gleichverteilung

23 23 Gleichverteilung Verteilungsfunktion (Integration der Dichte)

24 24 Gleichverteilung

25 25 Gleichverteilung Erwartungswert: E(X) = (a+b)/2 Varianz: Var(X) = (b-a)² / 12 Bsp. Wegzeit ist gleichverteilt im Intervall [30;40]. Ges. Wahrscheinlichkeit zw. 32 und 35 Min. zu benötigen. P(32 X 35) = 1/(b-a) · Δx = 1/(40-30) · (35-32) = 0,3 Durchschnittlich benötigte Zeit: E(X) = 35

26 26 Normalverteilung Wichtigste theoretische Verteilung: Normalverteilung: –stetige Verteilung –symmetrische Dichtefunktion –S-förmige Verteilungsfunktion –Erwartungswert: E(X) = µ –Varianz: Var(X) = σ² –Maximum der Dichte bei x=µ –Wendepunkte bei x=µ σ

27 27 Normalverteilungen Normalverteilung: Dichtefunktion (für - 0) : Verteilungsfunktion:

28 28 Normalverteilung Normalverteilungen mit unterschiedlichen Parametern

29 29 Normalverteilung Verteilungsfunktion

30 30 Normalverteilung Standardnormalverteilung: –Erwartungswert µ = 0 –Varianz σ² = 1 Dichtefunktion:

31 31 Normalverteilung Standardnormalverteilung

32 32 Normalverteilung Approximation durch Normalverteilung: Mit wachsendem n nähern sich viele theoretische Vt. der Normalverteilung Empirische Verteilungen lassen sich ebenfalls oft durch die N-Vt. annähern.

33 33 Normalverteilung Reproduktionseigenschaft (od. Additivitäts- eigenschaft) der Normal-Vt. Additionstheorem der Normalverteilung: –Die Summe (X) von n unabhängig normalverteilten Zufallvariablen X 1,…,X n ist ebenfalls normalverteilt. X = X 1 + … + X n –Der Erwartungswert von X ist die Summe der einzelnen Erwartungswerte μ 1,…,μ n E(X) = μ = μ 1 + … + μ n –Die Varianz von X ist die Summe der einzelnen Varianzen σ 1 ²,…σ n ² Var(X) = σ ² = σ 1 ² + … + σ n ²

34 34 Stichproben Arithmetische Mittel der Stichprobe: Varianz der Stichprobe: Anteilswert P einer Stichprobe:

35 35 Stichprobenverteilung Verteilung des arithmetischen Mittels der Stichprobe (Zufallsstichprobe): –Zufallsvariable X 1,…,X n –Konkrete Realisation: x 1,…,x n Arithmetische Mittel: –Arithm. Mittel von ZV ist wieder eine ZV (Funktion von n ZV)

36 36 Stichprobenverteilung Erwartungswert der Verteilung des arithmetischen Mittels: Varianz der Verteilung des arithm. Mittels Standardabweichung od. Standardfehler

37 37 Stichprobenverteilung Erwartungswert u. Varianz bekannt Verteilung des arithm. Mittels? Annahme: Grundgesamtheit ist N(μ,σ²)-vt. –Reproduktionseigenschaft der N-Vt: Summe von n unabhängig normal-vt. ZV ist wieder n-vt –Daher ist auch das arithm. Mittel normalverteilt

38 38 Grenzwertsätze Verhalten des Mittelwert von n unabhängig identisch verteilten (i.i.d.) ZV X 1,…,X n, wenn n laufend erhöht wird (n ) Gesetz der Großen Zahlen Satz von Glivenko-Cantelli Zentraler Grenzwertsatz

39 39 Grenzwertsätze Gesetz der Großen Zahlen: Beinhaltet die Aussage, dass sich der Mittelwert mit wachsendem n immer mehr um den gemeinsamen Erwartungswert µ der X i konzentriert.

40 40 Grenzwertsätze Gesetz der Großen Zahlen: Beinhaltet die Aussage, dass der Wert der empirischen Verteilungsfunktion an der Stelle t mit wachsendem n gegen den entsprechenden Wert der Verteilungsfunktion von X konvergiert.

41 41 Grenzwertsätze Satz von Glivenko-Cantelli: Wert der empirischen Verteilungsfunktion konvergiert an der Stelle t mit wachsendem n gegen den entsprechenden Wert der Verteilungsfunktion von X.

42 42 Grenzwertsätze Zentraler Grenzwertsatz: Aussage über die Form der Verteilung des Mittelwertes (standardisierte ZV Z n ). Die Verteilungsfunktion von Z n konvergiert gegen die Standardnormalverteilung (Φ … Vt-Fkt. der N(0,1) Vt.)

43 43 Grenzwertsätze Aus dem Zentralen Grenzwertsatz folgt: Die Verteilung des arithm. Mittels von n unabhängig identisch verteilten Zufallsvariablen X i (X 1,…,X n ) strebt mit wachsendem Stichprobenumfang n gegen eine Normalverteilung mit dem Erwartungswert µ und Varianz σ²/n. Gleichbedeutend: Das arithmetische Mittel ist asymptotisch normalverteilt. Faustregel: n > 30, N-Vt. ist gute Näherung für die Vt. des arithmetischen Mittels der Stichprobe.

44 44 Stichprobenverteilung Verteilung der Varianz S² der Stichprobe: Annahme: Grundgesamtheit ist N(µ,σ²)-vt. X i sind n unabhängige normal-vt. ZV mit E(X i )=µ und Var(X i )= σ² (i=1,…,n) Stichprobenvarianz S² ist eine Funktion von n ZV X i und somit wieder eine ZV.

45 45 Stichprobenverteilung Verteilung der Varianz S² der Stichprobe: Chi-Quadrat Verteilung mit v=n-1 Freiheitsgraden, χ² n-1 Es gilt: Ist Z² = X i ² + … + X n ² (Summe von n quadrierten unabhängigen N(0,1)-verteilten ZV X i ), dann folgt Z² einer Chi-Quadrat Verteilung mit v Freiheitsgraden.

46 46 Stichprobenverteilung χ² v Verteilung: –Erwartungswert: E(Z²)=v –Varianz: Var(Z²)=2v –Mit wachsendem v nähert sich die χ² v Vt. einer N-Vt. mit Parametern µ=v und σ²=2v.

47 47 Stichprobenverteilung Anteilswert P einer Stichprobe (P=X/n) 2 Modelle: –Ziehen mit Zurücklegen –Ziehen ohne Zurücklegen Bsp. Urne, N Kugeln, M schwarz, (N-M) weiße, ziehe n Kugeln (mit bzw. ohne Zurücklegen der gezogenen Kugeln), θ ist die Wahrscheinlichkeit für das Ziehen einer schwarzen Kugel.

48 48 Stichprobenverteilung Ziehen mit Zurücklegen –Exakte Verteilung: Binomialverteilung Wahrscheinlichkeitsfunktion der ZV X: –Erwartungswert: E(X) = nθ –Varianz: Var(X) = nθ(1- θ)

49 49 Stichprobenverteilung Ziehen mit Zurücklegen –Erwartungswert des Stichprobenanteilswertes P: E(P) = 1/n E(x) = θ –Varianz des Stichprobenanteilswertes P: Var(P) = 1/n² Var(X) = θ(1- θ) / n –Standardfehler des Anteilswertes:

50 50 Stichprobenverteilung Approximation durch Normalverteilung (Faustregel: nθ(1- θ) 9) Erwartungswert: E(P) = µ = nθ Varianz: Var(P) = σ P ² = nθ(1- θ)

51 51 Stichprobenverteilung Ziehen ohne Zurücklegen –Exakte Verteilung: Hypergeometrische Vt. –Wahrscheinlichkeitsfunktion der ZV X: –Erwartungswert: E(X) = n M/N –Varianz: Var(X) = nθ(1- θ) · (N-n)/(N-1)

52 52 Stichprobenverteilung Ziehen ohne Zurücklegen: –Erwartungswert des Stichprobenanteilswertes: E(P) = 1/n E(X) = θ –Varianz des Stichprobenanteilswertes: Var(P) = 1/n² Var(X) = θ(1- θ)/n · (N-n)/(N-1) –Standardfehler des Anteilswertes: –Endlichkeitskorrektur = 1 setzen, wenn n bzgl. N sehr klein ist (Faustregel: n/N < 0,05)

53 53 Stichprobenverteilung Approximation durch Normalverteilung µ = E(P) = θ σ² = Var(P) = θ(1- θ)/n · (N-n)/(N-1)

54 54 Stichprobenverteilung Die Stichprobenverteilungen des arithmetischen Mittels, der Varianz und des Anteilswertes können also durch die Normalverteilung approximiert werden.

55 55 Stichprobenverteilung Differenz zweier arithmetischer Mittel: Annahmen: –2 unabhängige Stichproben –Beide Grundgesamtheiten sind annähernd N-vt Stichprobenverteilung der Differenz: N-Vt –Erwartungswert: –Varianz:

56 56 Stichprobenverteilung Differenz zweier Anteilswerte: Annahmen: –2 unabhängige Stichproben –P 1, P 2 annähernd n-vt. und N 1, N 2 so groß, dass Endlichkeitskorrektur vernachlässigbar ist. Stichprobenverteilung: N-Vt –Erwartungswert: –Varianz:

57 57 Stichprobenverteilung Quotient zweier Varianzen: Annahmen: –2 unabhängige Stichproben (n 1, n 2 ) –σ 1 ² und σ 2 ² aus n-vt Grundgesamtheiten –Quotient:

58 58 Stichprobenverteilung Stichprobenverteilung: F-Verteilung mit v 1 und v 2 Freiheitsgraden, F v1,v2. Für v 2 > 2 gilt: –Erwartungswert: E(F) = v 2 / (v 2 -2) –Varianz:

59 59 Schätzverfahren Schluss von der Grundgesamtheit auf eine Stichprobe: Inklusionsschluss (direkter Schluss) Schluss von einer Stichprobe auf Parameter einer Grundgesamtheit: Repräsentationsschluss (indirekter Schluss) Unterscheidung: –Punktschätzer (einziger Schätzwert) –Intervallschätzer (Konfidenzintervall)

60 60 Schätzverfahren Punktschätzer: Für den zu schätzenden Parameter wird nur ein einziger Schätzwert angegeben. –Bsp. Schätze das unbekannte arithm. Mittel einer Grundgesamtheit μ durch das arithm. Mittel der Stichprobe Vorsicht: Die in einer Stichprobe realisierten Merkmalsausprägungen sind zufallsabhängig, Punktschätzer stimmen daher nur in den seltensten Fällen mit dem wahren Parameter überein.

61 61 Schätzverfahren Intervallschätzer: Ausgehend von einer Stichprobe wird ein Intervall bestimmt, in dem der zu schätzende Parameter der Grundgesamtheit mit einer bestimmten vorgegebenen Wahrscheinlichkeit liegt (Konfidenzintervall). Irrtumswahrscheinlichkeit α Konfidenzintervall zum Niveau 1-α (Vertrauensbereich od. Vertrauensintervall)

62 62 Schätzverfahren Ges: Konfidenzintervall für das arithm. Mittel: ZV Symmetrische Wahrscheinlichkeitsintervall Symmetrie: z (α /2) = –z (1-α/2) daher: z = –z (1-α/2) und –z = z (α /2) und

63 63 Schätzverfahren In diesem Wahrscheinlichkeitsintervall liegt das arithm. Mittel mit der Wahrscheinlichkeit 1- α. Gesucht ist ist aber nicht das Ws-Intervall der ZV, sondern das Konfidenzintervall für das unbekannte arithm. Mittel µ der Grundgesamtheit. –Varianz σ² der Grundgesamtheit bekannt –Varianz σ² der Grundgesamtheit unbekannt

64 64 Schätzverfahren Konfidenzintervall für µ bei bekannter Varianz σ² der Grundgesamtheit: Konkreter Stichprobenmittelwert

65 65 Schätzverfahren Konfidenzintervall für µ bei unbekannter Varianz σ² der Grundgesamtheit: Statt der unbekannte Varianz σ² wird die Stichprobenvarianz S² verwendet. Zufallsvariable: T ist t- verteilt mit v=n-1 Freiheitsgraden

66 66 Verteilungen Es gilt: –Ist T der Quotient einer Standardnormalverteilung und der Quadratwurzel des Mittelwerts von n quadrierten unabhängigen N(0,1)-verteilten ZV X i, dann folgt T einer t-Verteilung mit v=n Freiheitsgraden. Zufallsvariable: T ist t- verteilt mit v=n Freiheitsgraden T~t n t-Verteilung ist symmetrisch

67 67 Verteilungen t- Verteilung mit v Freiheitsgraden: –Erwartungswert (für n>1): E(T) = 0 –Varianz (für n>2): Var(T) = n / (n-2) Für n geht die t-Verteilung in die N(0,1) über. Approximation durch N(0,1)-Vt für n 30

68 68 Wahrscheinlichkeitsintervall für das arithm. Mittel bei unbekannter Varianz: Wobei t = t (1-α/2);n-1 = – t (α/2);n-1 die Punkte sind, bei denen die Verteilungsfunktion der t- Verteilung mit n-1 Freiheitsgraden die Werte 1-α/2 bzw. α/2 besitzt. Schätzverfahren

69 69 Konfidenzintervall für das arithm. Mittel bei unbekannter Varianz: Konkreter Stichprobenmittelwert Konkrete Stichprobenvarianz Schätzverfahren

70 70 Schätzverfahren Konfidenzintervall für den Anteilswert: Ann. genügend großer Stichprobenumfang, d.h. Approximation durch N-Vt möglich, E(P) = θ und Var(P) = σ P ² Standardisierte ZV:

71 71 Schätzverfahren Wahrscheinlichkeitsintervall: Konfidenzintervall: Ist σ P unbekannt, verwendet man stattdessen die Stichprobenvarianz des Anteilswertes als Schätzer.

72 72 Schätzverfahren Konfidenzintervall für die Varianz ZV (n-1)S² / σ² ist χ² verteilt mit v=n-1 Freiheitsgraden Wahrscheinlichkeitsintervall: Konfidenzintervall:

73 73 Stichprobenumfang Bisher: –Geg: Stichprobenumfang n, Sicherheitsgrad 1-α –Ges: Konfidenzintervall Jetzt: –Geg: Konfidenzintervall, Sicherheitsgrad 1-α –Ges: Stichprobenumfang Absoluter Fehler Δμ = zσ X ist ein Maß für die Genauigkeit der Schätzung Breite des Konfidenzintervalls: 2Δμ

74 74 Stichprobenumfang Frage: Welchen Stichprobenumfang benötigt man, um einen Parameter (arithm. Mittel) bei vorgegebener Genauigkeit und vorgegebenem Sicherheitsgrad zu schätzen?

75 75 Eigenschaften von Schätzern Eigenschaften von Schätzfunktionen: Erwartungstreue Effizienz Konsistenz Suffizienz

76 76 Eigenschaften von Schätzern Erwartungstreue Eine Schätzfunktion heißt erwartungstreu (unverzerrt, unbiased), wenn ihr Erwartungswert mit dem wahren Parameter übereinstimmt. Bedingung: Es gilt:

77 77 Eigenschaften von Schätzern Effizienz: Von 2 erwartungstreuen Schätzfunktionen gilt jene als effizienter (wirksamer), die die kleinere Varianz aufweist. Eine Schätzfunktion heißt effizient, wenn folgende Bedingungen erfüllt sind:

78 78 Eigenschaften von Schätzern Konsistenz: Eine Schätzfunktion heißt konsistent, wenn der Schätzwert bei laufender Vergrößerung des Stichprobenumfangs (n oder nN) mit dem zu schätzenden Parameter zusammenfällt.

79 79 Eigenschaften von Schätzern Suffizienz: Eine Schätzfunktion heißt suffizient (erschöpfend), wenn sie sämtliche Informationen über den zu schätzenden Parameter, welche die Stichprobe enthält ausschöpft.

80 80 Schätzverfahren Methode der Kleinsten Quadrat Maximum Likelihood Momentenmethode

81 81 Konfidenzintervall Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der zu schätzende Parameter der Grundgesamtheit mit einer bestimmten vorgegebenen Wahrscheinlichkeit (1-α) liegt.

82 82 Konfidenzintervall Bsp. Arithmetisches Mittel (ist bei N-Vt. Grundgesamtheit bzw. bei genügend großem Stichprobenumfang N-Vt.). Der wahre Parameter µ liegt mit der Wahrscheinlichkeit (1-α) im Intervall

83 83 Konfidenzintervall

84 84 Konfidenzintervall Bsp. Körpergröße: –Mittelwert =173,42 –Standardabweichung = 9,54 –N = 73 –2-seitiges KI zum Niveau α=0,05 Wahrscheinlichkeit, dass der wahre Parameter im KI liegt ist 0,95. Quantile der t-Vt: t=±1,99 Quantil der N(0,1)-Vt: z=±1,96 KI[171,19 µ 175,65]t-Vt KI [171,23 µ 175,61]N(0,1)-Vt


Herunterladen ppt "1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005."

Ähnliche Präsentationen


Google-Anzeigen