STATISIK LV Nr.: 0028 SS 2005 25. Mai 2005.

Slides:



Advertisements
Ähnliche Präsentationen
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil3.
Advertisements

Normalverteilte Zufallsvariablen
Masterstudiengang IE (Industrial Engineering)
1 JIM-Studie 2010 Jugend, Information, (Multi-)Media Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.
Stochastik in der Sek. II Sabrina Schultze.
Forschungsstrategien Johannes Gutenberg Universität Mainz
Gliederung Definition des Wahrscheinlichkeitsbegriffes
Gliederung Der Begriff der Stichprobe, Stichprobenfehler
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Der Binomialtest Man habe einen wahren Anteil P.
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil2.
Studienverlauf im Ausländerstudium
Statistische Methoden I
Statistische Methoden I
Statistische Methoden II SS 2007 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.
Konfidenzintervalle Intervallschätzung
Statistische Methoden II SS 2008 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Makarenkostraße (Kiste)
M-L-Schätzer Erwartungswert
TESTS. Worum es geht Man möchte testen, ob eine bestimmte Annahme (Hypothese) über Parameter der Realität entspricht oder nicht. Beobachtung (Stichprobe)
Die Student- oder t-Verteilung
Statistische Methoden I WS 2007/2008 Donnerstag, 31. Januar 2008 und Freitag, 1. Februar 2008 Probeklausur - statt Vorlesungen -
Konfidenzintervalle Intervallschätzung Jeder Beobachtung wird ein Intervall C( ) der reellen Zahlen zugeordnet Niveau Dabei ist die Wahrscheinlichkeit,
Statistische Methoden I SS 2005 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.
Statistische Methoden I SS 2005
Kolmogorov-Smirnov-Test. A. N. Kolmogorov Geboren in Tambov, Russland. Begründer der modernen Wahrscheinlichkeitstheorie.
Achtung Vorlesung am Montag, den 21. Juni Zeit: Uhr Ort: Kiste.
II. Wahrscheinlichkeitstheorie
Die Vorlesung am 14. Mai (Tag nach Himmelfahrt) wird auf Montag, den 17. Mai verlegt! Zeit: 16 Uhr Ort: Kiste Nächste Woche!!!!
Statistische Methoden II SS 2003 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.
III. Induktive Statistik
Die Vorlesung am 14. Mai (Tag nach Himmelfahrt) wird verlegt. Der Nachholtermin wird noch bekannt gegeben.
Statistische Methoden II SS 2003
Extra-SPSS-Kurse Durchführung: Birte Holtfreter Termine Di Mi Mi Ort PC-Pool Loefflerstarße.
Maximum-Likelihood-Schätzer ( diskreter Fall) Likelihood-Funktion mit oder M-L-Schätzer.
Rechneraufbau & Rechnerstrukturen, Folie 12.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 12.
Vorlesung Biometrie für Studierende der Veterinärmedizin Begriff der Zufallsgröße Ergebnisse von Zufallsexperimenten werden als Zahlen dargestellt:
Binomialverteilung: Beispiel
Eigenschaften der OLS-Schätzer
20:00.
Ausgleichungsrechnung I
für Weihnachten oder als Tischdekoration für das ganze Jahr
STATISIK LV Nr.: 1375 SS März 2005.
Wahrscheinlichkeit Zufallsexperiment:
STATISIK LV Nr.: 1375 SS März 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 1852 WS 2005/ Dezember 2005.
STATISIK LV Nr.: 0021 WS 2005/ Oktober 2005.
STATISIK LV Nr.: 1852 WS 2005/ Dezember 2005.
STATISIK LV Nr.: 0021 WS 2005/ Oktober 2005.
STATISIK LV Nr.: 1852 WS 2005/ Dezember 2005.
STATISIK LV Nr.: 1852 WS 2005/ Dezember 2005.
STATISIK LV Nr.: 1375 SS März 2005.
Konfidenzintervall und Testen für den Mittelwert und Anteile
PROCAM Score Alter (Jahre)
Geometrische Aufgaben
Symmetrische Blockchiffren DES – der Data Encryption Standard
Zahlentheorie und Zahlenspiele Hartmut Menzer, Ingo Althöfer ISBN: © 2014 Oldenbourg Wissenschaftsverlag GmbH Abbildungsübersicht / List.
MINDREADER Ein magisch - interaktives Erlebnis mit ENZO PAOLO
STATISIK LV Nr.: 0021 WS 2005/ Oktober 2005.
1 (C) 2002, Hermann Knoll, HTW Chur, Fachhochschule Ostschweiz Wahrscheinlichkeitsverteilung Lernziele: Wahrscheinlichkeitsverteilung und der Wahrscheinlichkeitsdichte.
1 (C)2006, Hermann Knoll, HTW Chur, FHO Quadratische Reste Definitionen: Quadratischer Rest Quadratwurzel Anwendungen.
Tutorium Statistik II Übung IV Philipp Schäpers Mi – 11.45
1 Medienpädagogischer Forschungsverbund Südwest KIM-Studie 2014 Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.
Stochastik ganz kurz Beispiel diskret Würfelwurf Beispiel stetig
Thema der Stunde I. Die Form der Stichprobenkennwerteverteilung
Die Binomialverteilung
STATISIK LV Nr.: 1375 SS März 2005.
Mittelwerte (ab Intervallskala)
 Präsentation transkript:

STATISIK LV Nr.: 0028 SS 2005 25. Mai 2005

Poissonverteilung Verteilung seltener Ereignisse Große Zahl von Versuchen n, Wahrscheinlichkeit θ für Auftreten eines Ereignisses sehr klein Wahrscheinlichkeitsfunktion:

Poissonverteilung Erwartungswert: E(X) = μ Varianz: Var(X) = μ Approximation der Binomialverteilung durch die Poissonverteilung: n groß und θ klein, Parameter μ = n·θ Faustregel: n > 10 und θ < 0,05. Approximation der Hypergeometrischen Vt. M/N = θ klein, N im Vergleich zu n groß, Parameter μ = n · M/N Faustregel: M/N < 0,05 und n/N < 0,05

Poissonverteilung Bsp. Wahrscheinlichkeit bei einer Prüfung von n=2000 Buchungen genau 3 (=x) Fehlbuchungen zu finden, Anteil der Fehlbuchungen: θ=0,001. Poissonverteilung: μ = n·θ = 2

Gleichverteilung Diskrete Zufallsvariable: Jede der k möglichen Ausprägungen hat gleiche Wahrscheinlichkeit P(X=xi) = 1/k (i=1,…,k) Bsp. Wahrscheinlichkeitsverteilung der Augenzahl eines idealen Würfels: P(X=xi) = 1/6 (i=1,…,6)

Gleichverteilung Stetige Zufallsvariable: Realisationen der stetigen Zufallsvariablen X liegen im Intervall [a;b] Dichtefunktion: P(x  X  x+Δx) = 1/(b-a) · Δx

Gleichverteilung

Gleichverteilung Verteilungsfunktion (Integration der Dichte)

Gleichverteilung

Gleichverteilung Erwartungswert: E(X) = (a+b)/2 Varianz: Var(X) = (b-a)² / 12 Bsp. Wegzeit ist gleichverteilt im Intervall [30;40]. Ges. Wahrscheinlichkeit zw. 32 und 35 Min. zu benötigen. P(32  X  35) = 1/(b-a) · Δx = 1/(40-30) · (35-32) = 0,3 Durchschnittlich benötigte Zeit: E(X) = 35

Normalverteilung Wichtigste theoretische Verteilung: Normalverteilung: stetige Verteilung symmetrische Dichtefunktion S-förmige Verteilungsfunktion Erwartungswert: E(X) = µ Varianz: Var(X) = σ² Maximum der Dichte bei x=µ Wendepunkte bei x=µσ

Normalverteilungen Normalverteilung: Dichtefunktion (für -∞<x<+∞ und σ>0) : Verteilungsfunktion:

Normalverteilung Normalverteilungen mit unterschiedlichen Parametern

Normalverteilung Verteilungsfunktion

Normalverteilung Standardnormalverteilung: Dichtefunktion: Erwartungswert µ = 0 Varianz σ² = 1 Dichtefunktion:

Normalverteilung Standardnormalverteilung

Normalverteilung Approximation durch Normalverteilung: Mit wachsendem n nähern sich viele theoretische Vt. der Normalverteilung Empirische Verteilungen lassen sich ebenfalls oft durch die N-Vt. annähern.

Normalverteilung Reproduktionseigenschaft (od. Additivitäts- eigenschaft) der Normal-Vt. Additionstheorem der Normalverteilung: Die Summe (X) von n unabhängig normalverteilten Zufallvariablen X1,…,Xn ist ebenfalls normalverteilt. X = X1 + … + Xn Der Erwartungswert von X ist die Summe der einzelnen Erwartungswerte μ1,…,μn E(X) = μ = μ1 + … + μn Die Varianz von X ist die Summe der einzelnen Varianzen σ1²,…σn² Var(X) = σ² = σ1² + … + σn²

Stichproben Arithmetische Mittel der Stichprobe: Varianz der Stichprobe: Anteilswert P einer Stichprobe:

Stichprobenverteilung Verteilung des arithmetischen Mittels der Stichprobe (Zufallsstichprobe): Zufallsvariable X1,…,Xn Konkrete Realisation: x1,…,xn Arithmetische Mittel: Arithm. Mittel von ZV ist wieder eine ZV (Funktion von n ZV)

Stichprobenverteilung Erwartungswert der Verteilung des arithmetischen Mittels: Varianz der Verteilung des arithm. Mittels Standardabweichung od. Standardfehler

Stichprobenverteilung Erwartungswert u. Varianz bekannt Verteilung des arithm. Mittels? Annahme: Grundgesamtheit ist N(μ,σ²)-vt. Reproduktionseigenschaft der N-Vt: Summe von n unabhängig normal-vt. ZV ist wieder n-vt Daher ist auch das arithm. Mittel normalverteilt

Grenzwertsätze Verhalten des Mittelwert von n unabhängig identisch verteilten (i.i.d.) ZV X1,…,Xn, wenn n laufend erhöht wird (n→∞) Gesetz der Großen Zahlen Satz von Glivenko-Cantelli Zentraler Grenzwertsatz

Grenzwertsätze Gesetz der Großen Zahlen: Beinhaltet die Aussage, dass sich der Mittelwert mit wachsendem n immer mehr um den gemeinsamen Erwartungswert µ der Xi konzentriert.

Grenzwertsätze Gesetz der Großen Zahlen: Beinhaltet die Aussage, dass der Wert der empirischen Verteilungsfunktion an der Stelle t mit wachsendem n gegen den entsprechenden Wert der Verteilungsfunktion von X konvergiert.

Grenzwertsätze Satz von Glivenko-Cantelli: Wert der empirischen Verteilungsfunktion konvergiert an der Stelle t mit wachsendem n gegen den entsprechenden Wert der Verteilungsfunktion von X.

Grenzwertsätze Zentraler Grenzwertsatz: Aussage über die Form der Verteilung des Mittelwertes (standardisierte ZV Zn). Die Verteilungsfunktion von Zn konvergiert gegen die Standardnormalverteilung (Φ … Vt-Fkt. der N(0,1) Vt.)

Grenzwertsätze Aus dem Zentralen Grenzwertsatz folgt: Die Verteilung des arithm. Mittels von n unabhängig identisch verteilten Zufallsvariablen Xi (X1,…,Xn) strebt mit wachsendem Stichprobenumfang n gegen eine Normalverteilung mit dem Erwartungswert µ und Varianz σ²/n. Gleichbedeutend: Das arithmetische Mittel ist „asymptotisch normalverteilt“. Faustregel: n > 30, N-Vt. ist gute Näherung für die Vt. des arithmetischen Mittels der Stichprobe.

Stichprobenverteilung Verteilung der Varianz S² der Stichprobe: Annahme: Grundgesamtheit ist N(µ,σ²)-vt. Xi sind n unabhängige normal-vt. ZV mit E(Xi)=µ und Var(Xi)= σ² (i=1,…,n) Stichprobenvarianz S² ist eine Funktion von n ZV Xi und somit wieder eine ZV.

Stichprobenverteilung Verteilung der Varianz S² der Stichprobe: Chi-Quadrat Verteilung mit v=n-1 Freiheitsgraden, χ²n-1 Es gilt: Ist Z² = Xi² + … + Xn² (Summe von n quadrierten unabhängigen N(0,1)-verteilten ZV Xi), dann folgt Z² einer Chi-Quadrat Verteilung mit v Freiheitsgraden. Anzahl der unabhängigen ZV, die Z² bilden, nennt man Anzahl der Freiheitsgrade.

Stichprobenverteilung χ²v Verteilung: Erwartungswert: E(Z²)=v Varianz: Var(Z²)=2v Mit wachsendem v nähert sich die χ²v Vt. einer N-Vt. mit Parametern µ=v und σ²=2v.

Stichprobenverteilung Anteilswert P einer Stichprobe (P=X/n) 2 Modelle: Ziehen mit Zurücklegen Ziehen ohne Zurücklegen Bsp. Urne, N Kugeln, M schwarz, (N-M) weiße, ziehe n Kugeln (mit bzw. ohne Zurücklegen der gezogenen Kugeln), θ ist die Wahrscheinlichkeit für das Ziehen einer schwarzen Kugel.

Stichprobenverteilung Ziehen mit Zurücklegen Exakte Verteilung: Binomialverteilung Wahrscheinlichkeitsfunktion der ZV X: Erwartungswert: E(X) = nθ Varianz: Var(X) = nθ(1- θ)

Stichprobenverteilung Ziehen mit Zurücklegen Erwartungswert des Stichprobenanteilswertes P: E(P) = 1/n E(x) = θ Varianz des Stichprobenanteilswertes P: Var(P) = 1/n² Var(X) = θ(1- θ) / n Standardfehler des Anteilswertes:

Stichprobenverteilung Approximation durch Normalverteilung (Faustregel: nθ(1- θ) ≥ 9) Erwartungswert: E(P) = µ = nθ Varianz: Var(P) = σP² = nθ(1- θ)

Stichprobenverteilung Ziehen ohne Zurücklegen Exakte Verteilung: Hypergeometrische Vt. Wahrscheinlichkeitsfunktion der ZV X: Erwartungswert: E(X) = n M/N Varianz: Var(X) = nθ(1- θ) · (N-n)/(N-1)

Stichprobenverteilung Ziehen ohne Zurücklegen: Erwartungswert des Stichprobenanteilswertes: E(P) = 1/n E(X) = θ Varianz des Stichprobenanteilswertes: Var(P) = 1/n² Var(X) = θ(1- θ)/n · (N-n)/(N-1) Standardfehler des Anteilswertes: Endlichkeitskorrektur = 1 setzen, wenn n bzgl. N sehr klein ist (Faustregel: n/N < 0,05)

Stichprobenverteilung Approximation durch Normalverteilung µ = E(P) = θ σ² = Var(P) = θ(1- θ)/n · (N-n)/(N-1)

Stichprobenverteilung Die Stichprobenverteilungen des arithmetischen Mittels, der Varianz und des Anteilswertes können also durch die Normalverteilung approximiert werden.

Stichprobenverteilung Differenz zweier arithmetischer Mittel: Annahmen: 2 unabhängige Stichproben Beide Grundgesamtheiten sind annähernd N-vt Stichprobenverteilung der Differenz: N-Vt Erwartungswert: Varianz:

Stichprobenverteilung Differenz zweier Anteilswerte: Annahmen: 2 unabhängige Stichproben P1, P2 annähernd n-vt. und N1, N2 so groß, dass Endlichkeitskorrektur vernachlässigbar ist. Stichprobenverteilung: N-Vt Erwartungswert: Varianz:

Stichprobenverteilung Quotient zweier Varianzen: Annahmen: 2 unabhängige Stichproben (n1, n2) σ1² und σ2² aus n-vt Grundgesamtheiten Quotient:

Stichprobenverteilung Stichprobenverteilung: F-Verteilung mit v1 und v2 Freiheitsgraden, Fv1,v2. Für v2 > 2 gilt: Erwartungswert: E(F) = v2 / (v2-2) Varianz:

Schätzverfahren Schluss von der Grundgesamtheit auf eine Stichprobe: Inklusionsschluss (direkter Schluss) Schluss von einer Stichprobe auf Parameter einer Grundgesamtheit: Repräsentationsschluss (indirekter Schluss) Unterscheidung: Punktschätzer (einziger Schätzwert) Intervallschätzer (Konfidenzintervall)

Schätzverfahren Punktschätzer: Für den zu schätzenden Parameter wird nur ein einziger Schätzwert angegeben. Bsp. Schätze das unbekannte arithm. Mittel einer Grundgesamtheit μ durch das arithm. Mittel der Stichprobe Vorsicht: Die in einer Stichprobe realisierten Merkmalsausprägungen sind zufallsabhängig, Punktschätzer stimmen daher nur in den seltensten Fällen mit dem wahren Parameter überein.

Schätzverfahren Intervallschätzer: Ausgehend von einer Stichprobe wird ein Intervall bestimmt, in dem der zu schätzende Parameter der Grundgesamtheit mit einer bestimmten vorgegebenen Wahrscheinlichkeit liegt (Konfidenzintervall). Irrtumswahrscheinlichkeit ≤ α Konfidenzintervall zum Niveau 1-α (Vertrauensbereich od. Vertrauensintervall)

Schätzverfahren Ges: Konfidenzintervall für das arithm. Mittel: ZV Symmetrische Wahrscheinlichkeitsintervall Symmetrie: z(α /2) = –z(1-α/2) daher: z = –z(1-α/2) und –z = z(α /2) und

Schätzverfahren In diesem Wahrscheinlichkeitsintervall liegt das arithm. Mittel mit der Wahrscheinlichkeit 1- α. Gesucht ist ist aber nicht das Ws-Intervall der ZV, sondern das Konfidenzintervall für das unbekannte arithm. Mittel µ der Grundgesamtheit. Varianz σ² der Grundgesamtheit bekannt Varianz σ² der Grundgesamtheit unbekannt

Schätzverfahren Konfidenzintervall für µ bei bekannter Varianz σ² der Grundgesamtheit: Konkreter Stichprobenmittelwert

Schätzverfahren Konfidenzintervall für µ bei unbekannter Varianz σ² der Grundgesamtheit: Statt der unbekannte Varianz σ² wird die Stichprobenvarianz S² verwendet. Zufallsvariable: T ist t- verteilt mit v=n-1 Freiheitsgraden

Verteilungen Es gilt: Zufallsvariable: Ist T der Quotient einer Standardnormalverteilung und der Quadratwurzel des Mittelwerts von n quadrierten unabhängigen N(0,1)-verteilten ZV Xi, dann folgt T einer t-Verteilung mit v=n Freiheitsgraden. Zufallsvariable: T ist t- verteilt mit v=n Freiheitsgraden T~tn t-Verteilung ist symmetrisch

Verteilungen t- Verteilung mit v Freiheitsgraden: Erwartungswert (für n>1): E(T) = 0 Varianz (für n>2): Var(T) = n / (n-2) Für n→∞ geht die t-Verteilung in die N(0,1) über. Approximation durch N(0,1)-Vt für n ≥ 30

Schätzverfahren Wahrscheinlichkeitsintervall für das arithm. Mittel bei unbekannter Varianz: Wobei t = t(1-α/2);n-1 = – t(α/2);n-1 die Punkte sind, bei denen die Verteilungsfunktion der t- Verteilung mit n-1 Freiheitsgraden die Werte 1-α/2 bzw. α/2 besitzt.

Schätzverfahren Konfidenzintervall für das arithm. Mittel bei unbekannter Varianz: Konkreter Stichprobenmittelwert Konkrete Stichprobenvarianz

Schätzverfahren Konfidenzintervall für den Anteilswert: Ann. genügend großer Stichprobenumfang, d.h. Approximation durch N-Vt möglich, E(P) = θ und Var(P) = σP² Standardisierte ZV:

Schätzverfahren Wahrscheinlichkeitsintervall: Konfidenzintervall: Ist σP unbekannt, verwendet man stattdessen die Stichprobenvarianz des Anteilswertes als Schätzer.

Schätzverfahren Konfidenzintervall für die Varianz ZV (n-1)S² / σ² ist χ² verteilt mit v=n-1 Freiheitsgraden Wahrscheinlichkeitsintervall: Konfidenzintervall:

Stichprobenumfang Bisher: Jetzt: Geg: Stichprobenumfang n, Sicherheitsgrad 1-α Ges: Konfidenzintervall Jetzt: Geg: Konfidenzintervall, Sicherheitsgrad 1-α Ges: Stichprobenumfang Absoluter Fehler Δμ = zσX ist ein Maß für die Genauigkeit der Schätzung Breite des Konfidenzintervalls: 2Δμ

Stichprobenumfang Frage: Welchen Stichprobenumfang benötigt man, um einen Parameter (arithm. Mittel) bei vorgegebener Genauigkeit und vorgegebenem Sicherheitsgrad zu schätzen?

Eigenschaften von Schätzern Eigenschaften von Schätzfunktionen: Erwartungstreue Effizienz Konsistenz Suffizienz

Eigenschaften von Schätzern Erwartungstreue Eine Schätzfunktion heißt erwartungstreu (unverzerrt, unbiased), wenn ihr Erwartungswert mit dem wahren Parameter übereinstimmt. Bedingung: Es gilt:

Eigenschaften von Schätzern Effizienz: Von 2 erwartungstreuen Schätzfunktionen gilt jene als effizienter (wirksamer), die die kleinere Varianz aufweist. Eine Schätzfunktion heißt effizient, wenn folgende Bedingungen erfüllt sind:

Eigenschaften von Schätzern Konsistenz: Eine Schätzfunktion heißt konsistent, wenn der Schätzwert bei laufender Vergrößerung des Stichprobenumfangs (n→∞ oder n→N) mit dem zu schätzenden Parameter zusammenfällt.

Eigenschaften von Schätzern Suffizienz: Eine Schätzfunktion heißt suffizient (erschöpfend), wenn sie sämtliche Informationen über den zu schätzenden Parameter, welche die Stichprobe enthält ausschöpft.

Schätzverfahren Methode der Kleinsten Quadrat Maximum Likelihood Momentenmethode