Wahrscheinlich-keitsrechnung

Slides:



Advertisements
Ähnliche Präsentationen
Definition [1]: Sei S eine endliche Menge und sei p eine Abbildung von S in die positiven reellen Zahlen Für einen Teilmenge ES von S sei p definiert.
Advertisements

Normalverteilte Zufallsvariablen
Grundlagen der Wahrscheinlichkeitsrechnung - Verteilungen -
Gliederung Definition des Wahrscheinlichkeitsbegriffes
Gliederung Tabellarische und grafische Darstellung von Rohwerten mittels Histogramme und Polygone Statistische Kennwertbeschreibung mittels Tendenz- und.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-23.
Heute Prüfung der Produkt-Moment Korrelation
Der Binomialtest Man habe einen wahren Anteil P.
Konfidenzintervalle Intervallschätzung
Ab nächster Woche wird die Übungsgruppe Gruppe 2: Henrike Berg Di SR 222 wegen Personalmangel eingestellt.
Statistische Methoden II SS 2008 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Makarenkostraße (Kiste)
M-L-Schätzer Erwartungswert
TESTS. Worum es geht Man möchte testen, ob eine bestimmte Annahme (Hypothese) über Parameter der Realität entspricht oder nicht. Beobachtung (Stichprobe)
Die Student- oder t-Verteilung
Konfidenzintervalle Intervallschätzung Jeder Beobachtung wird ein Intervall C( ) der reellen Zahlen zugeordnet Niveau Dabei ist die Wahrscheinlichkeit,
Statistische Methoden I SS 2005
Kolmogorov-Smirnov-Test. A. N. Kolmogorov Geboren in Tambov, Russland. Begründer der modernen Wahrscheinlichkeitstheorie.
Die Vorlesung am 14. Mai (Tag nach Himmelfahrt) wird auf Montag, den 17. Mai verlegt! Zeit: 16 Uhr Ort: Kiste Nächste Woche!!!!
Statistische Methoden II SS 2003 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.
Extra-SPSS-Kurse Durchführung: Birte Holtfreter Termine Di Mi Mi Ort PC-Pool Loefflerstarße.
Bedingte Wahrscheinlichkeiten Die Belegschaft eines Betriebes wird nach Rauchern und Nicht- rauchern eingeteilt. Dabei ergibt sich die folgende Tabelle:
Bedingte Wahrscheinlichkeiten
Verteilungsfunktion der Normalverteilung I. Verteilungsfunktion der Normalverteilung II.
Klausur am :00 bis 13:00 Hörsaal Loefflerstraße und Hörsaal Makarenkostraße.
Maximum-Likelihood-Schätzer ( diskreter Fall) Likelihood-Funktion mit oder M-L-Schätzer.
Univariate Statistik M. Kresken.
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Vorlesung Biometrie für Studierende der Veterinärmedizin Begriff der Zufallsgröße Ergebnisse von Zufallsexperimenten werden als Zahlen dargestellt:
Binomialverteilung: Beispiel
Vorlesung: ANOVA I
Eigenschaften der OLS-Schätzer
20:00.
Histogramm/empirische Verteilung Verteilungen
Ausgleichungsrechnung I
Ausgleichungsrechnung II
Wahrscheinlichkeitsverteilung
STATISIK LV Nr.: 1375 SS März 2005.
Messwerte, Verteilung, Histogramm, Mittelwert und Standardabweichung
Mittelwert und Standardabweichung
Die Gaußverteilung.
STATISIK LV Nr.: 1375 SS März 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 1852 WS 2005/ Dezember 2005.
STATISIK LV Nr.: 0021 WS 2005/ Oktober 2005.
STATISIK LV Nr.: 1852 WS 2005/ Dezember 2005.
STATISIK LV Nr.: 1375 SS März 2005.
Konfidenzintervall und Testen für den Mittelwert und Anteile
Arbeiten mit der Normalverteilung
Arbeiten mit der Normalverteilung
Grundlagen der Messtechnik
PROCAM Score Alter (Jahre)
1 Stichprobenverfahren zur Qualitätssicherung Hilfestellung der Statistik in der Wirtschaftsprüfung.
Stetige Verteilungen Das Uhrenbeispiel Dichtefunktion
Zusammengestellt von Mag. Raimund Hermann
1 (C) 2002, Hermann Knoll, HTW Chur, Fachhochschule Ostschweiz Wahrscheinlichkeitsverteilung Lernziele: Wahrscheinlichkeitsverteilung und der Wahrscheinlichkeitsdichte.
Schutzvermerk nach DIN 34 beachten 20/05/14 Seite 1 Grundlagen XSoft Lösung :Logische Grundschaltung IEC-Grundlagen und logische Verknüpfungen.
Begriff der Zufallsgröße
Tutorium Statistik II Übung IV Philipp Schäpers Mi – 11.45
6.6 Normalverteilung Die Normalverteilung kann als das wichtigste Verteilungsmodell der Statistik ange-sehen werden. Sie wird nach ihrem Entdecker auch.
Einführung zur Fehlerrechnung
1 Medienpädagogischer Forschungsverbund Südwest KIM-Studie 2014 Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.
Stochastik ganz kurz Beispiel diskret Würfelwurf Beispiel stetig
setzt Linearität des Zusammenhangs voraus
K. Desch - Statistik und Datenanalyse SS05
Die Binomialverteilung
Verteilungen, Varianz Tamara Katschnig.
Aufgabe 5 Gegeben sei folgende Graphik mit den zugehörigen Merkmalsdefinitionen. – Erstellen Sie die zugehörige Kontingenztabelle der absoluten Häufigkeiten.
Geoinformationssysteme
 Präsentation transkript:

Wahrscheinlich-keitsrechnung M. Kresken

Stetige Zufallsvariable und Dichtefunktion M. Kresken

Stetige Zufallsvariable und Dichtefunktion Im letzten Kapitel wurden die so genannten diskreten Zufallsvariablen vorgestellt. Für Merkmale mit kontinuierlichen Werten lässt sich die Argumentation wie folgt modifizieren: Beispiel: Körpergröße von Patienten in einer klinischen Prüfung Über die Körpergröße des nächsten, in eine Studie eingeschlossenen männlichen Patienten lässt sich zunächst keine exakte, sondern nur eine Wahrscheinlichkeitsaussage machen. M. Kresken

Stetige Zufallsvariable und Dichtefunktion Es ist zu erwarten, dass der Wert der Körpergröße eines erwachsenen Mannes eher einen Wert in der Nähe von 1,75 m als in der Nähe von 1,40 m oder 2,10 m liefert. Somit sind die Werte um 1,75 m „wahrscheinlicher“ als die um 1,40 m oder 2,10 m. Die beobachteten Messwerte liegen dichter um 1,75 m als um 1,40 m oder 2,10 m. Dabei wird angenommen, dass zumindest theoretisch innerhalb eines Messbereiches jeder beliebige Messwert möglich ist. Das betrachtete Merkmal (hier die Körpergröße) wird in diesem Sinne als stetige Zufallsgröße bezeichnet. M. Kresken

Stetige Zufallsvariable und Dichtefunktion Die Charakteristik stetiger Zufallsvariablen des unterschiedlich dichten Auftretens von Messwerten x kann als Wahrscheinlichkeitsbelegung der Messskala aufgefasst werden und wird formal durch einen funktionalen Zusammenhang ausgedrückt. Die sich ergebende Funktion nimmt nur nicht-negative Wert an und heißt Dichte bzw. Dichtefunktion f(x) der Zufallsvariablen X, wobei x den Messwert (die Realisation) der Zufallsvariablen X bezeichnet. Sie ist das theoretische Analagon zum Histogramm zur Darstellung der relativen Häufigkeiten von n Messwerten eines stetigen Merkmals. M. Kresken

Histogramm M. Kresken

Stetige Zufallsvariable und Dichtefunktion Flächenstücke unter der Dichtefunktion über einem Interval der x-Achse geben die Wahrscheinlichkeit an, mit der die Zufallsgröße Werte innerhalb dieses Intervalls annimmt. Folgerichtig entspricht der Flächeninhalt unter der Gesamtkurve der Wahrscheinlichkeit des sicheren Ergebnisses und hat daher den Wert 1. Da einem isolierten Punkt auf der x-Achse unter der Dichtefunktion der Wert 0 zukommt, ist die Wahrscheinlichkeit, dass die Zufallsgröße einen bestimmten Wert annimmt, gleich 0 (z. B. dass die Körpergröße eines erwachsenen Mannes exakt 1,7000... m beträgt; beliebige Messgenauigkeit vorausgesetzt). M. Kresken

Stetige Zufallsvariable und Dichtefunktion Ordnet man jedem Wert x auf der x-Achse die Wahrscheinlichkeit zu, mit der die Zufallsgröße X Werte bis zu der Zahl x annimmt, so heißt diese Zuordnung Verteilungsfunktion (F(x)). Für jedes x ist F(x) somit die Fläche unter der Dichte f von - bis zu der Stelle x, also als Integral darzustellen: F(x) =  f(u)du. x - M. Kresken

Stetige Zufallsvariable und Dichtefunktion Die Verteilungsfunktion ist das theoretische Analagon zur empirischen Verteilungsfunktion in einer Stichprobe (siehe Univariate Statistik). Die gedankliche Brücke für den Übergang von der empirischen zur theoretischen Verteilungsfunktion bildet die folgende vereinfacht formulierte Überlegung: Die empirische Verteilungsfunktion eines stetigen Merkmals - beobachtet in einer beliebig großen Stichprobe mit beliebig großer Messgenauigkeit - ist gleich der (theoretischen) Verteilungsfunktion. M. Kresken

Kenngrößen der Verteilung einer Zufallsvariablen M. Kresken

Kenngrößen der Verteilung einer Zufallsvariablen Zur Charakterisierung einer Zufallsgröße lassen sich, ähnlich wie im Rahmen der Beschreibung von Merkmalen, Kenngrößen angeben wie Erwartungswert E(X), Varianz Var (X) oder Verteilungsquantile. So ist beispielsweise das 0,95-Quantil jener Wert, unter dem im long run 95% der Beobachtungen liegen werden. Analog zur Beschreibung der Statistik ist zwischen diskreten und stetigen Zufallsgrößen zu unterscheiden. M. Kresken

Kenngrößen der Verteilung einer Zufallsvariablen Diskrete Zufallsvariable Für eine Zufallsvariable Y lässt sich der Erwartungswert E(Y) anhand der möglichen Beobachtungen yj und der Wahrscheinlichkeit pj ihres Auftretens berechnen: Der Erwartungswert ist ein gewichtetes Mittel. Im „physikalischen“ Sinn entspricht er dem Schwerpunkt mit den entsprechenden Wahrscheinlichkeiten.  j E(Y) = yj pj . M. Kresken

Kenngrößen der Verteilung einer Zufallsvariablen Diskrete Zufallsvariable Die Varianz einer diskreten Zufallsvariablen ist allgemein definiert durch: Sie ist ein Streuungsmaß für die Verteilung.  j Var(Y) = [yj – E(y)]2 pj . M. Kresken

Kenngrößen der Verteilung einer Zufallsvariablen Binominalverteilung Für eine nach B(n,p) binominalverteilte Zufallsvariable Y ergeben sich der Erwartungswert und die Varianz Beispiel E(Y) = n • p Var(Y) = n • p (1 – p) . M. Kresken

Kenngrößen der Verteilung einer Zufallsvariablen Binominalverteilung Für die Binominalverteilung bei n = 5 Spendern mit der Erfolgswahrscheinlichkeit 0,4 ergeben sich der Erwartungswert und die Varianz E(Y) = 5 • 0,4 = 2 Var(Y) = 5 • 0,4 (1 – 0,4) = 1,2. M. Kresken

Kenngrößen der Verteilung einer Zufallsvariablen Stetige Zufallsvariable Für stetige Zufallsvariablen X müssen bei der Berechnung der Parameter wie Erwartungswert und Varianz anstatt der Wahrscheinlichkeiten die Werte der Dichtefunktionen berücksichtigt werden. Darüber hinaus ist die Summation über die (möglichen) Werte der Zufallsgröße durch die Integration zu ersetzen Dann ergeben sich: E(X) =  x f(x) dx ,  - Var(X) =  (x – E(X))2 f(x) dx .  - M. Kresken

Standardisierung einer Zufallsvariablen M. Kresken

Standardisierung einer Zufallsvariablen Subtrahiert man von jedem Wert der Zufallsgröße X den Erwartungswert E(X) (was einer Verschiebung der Messskala entspricht) und teilt das Ergebnis durch die Wurzel aus der Varianz Var(X) (was einer Normierung der Messskala entspricht), so resultiert eine neue Zufallsgröße Z, die Standardisierung von X: Z = X – E(X) Var(X) M. Kresken

Standardisierung einer Zufallsvariablen Die standardisierte Zufallsgröße Z ist dadurch charakterisiert, dass sie den Erwartungswert E(Z) = 0 und die Varianz Var(Z) = 1 hat. Sie gibt an, um wie viele Standardabweichungen eine Beobachtung über bzw. unter dem Erwartungswert liegt. M. Kresken

Standardisierung einer Zufallsvariablen Beispiel: Nach der WHO spricht man von einer Risikogeburt, wenn das Geburtsgewicht unter 2.700 g liegt. Aus langjährigen Beobachtungen weiß man, dass die Geburtsgewichte in NRW bei Jungen im Mittel bei 3.400 g (SD 400 g) und bei Mädchen im Mittel bei 3.300 g (SD 350 g) liegen. Damit betragen die standardisierten Geburtsgewichte von Risikogeburten: Jungen = 2.700 – 3.400 400 = – 1,75 , Mädchen = 2.700 – 3.300 350 = – 1,71 . M. Kresken

Zentraler Grenzwertsatz und Normalverteilung M. Kresken

Zentraler Grenzwertsatz und Normalverteilung Wird eine Zufallsvariable durch viele unabhängige Einflüsse mit kleiner Wirkung bestimmt, beobachtet man, dass sowohl die Wahrscheinlichkeitsfunktion als auch die Wahrscheinlichkeitsdichte eine charakteristische Form annehmen – die der Gauss‘schen Fehler- oder Normalverteilung. Der Kurvenverlauf der Normalverteilung ist glockenförmig und die Kurve verläuft symmetrisch um den Erwartungswert. Die Normalverteilung besitzt im Abstand einer Standardabweichung vom Erwartungswert Wendepunkte und nähert sich asymptotisch der x-Achse. M. Kresken

Zentraler Grenzwertsatz und Normalverteilung M. Kresken

Zentraler Grenzwertsatz und Normalverteilung Die Beobachtung einer Normalverteilung beim unabhängigen Zusammenwirken vieler kleiner Einflussgrößen wird durch den zentralen Grenzwertsatz beschrieben. Bei Zufallsexperimenten, wo diese Annahmen als zutreffend angesehen werden können, wird die Normalverteilung als Modell zugrunde gelegt. Beispiel M. Kresken

Zentraler Grenzwertsatz und Normalverteilung Verteilung der mittleren Anzahl von Episoden von Otitis media in den ersten zwei Lebensjahren in einer Stichprobe n = 1

Zentraler Grenzwertsatz und Normalverteilung Verteilung der mittleren Anzahl von Episoden von Otitis media in den ersten zwei Lebensjahren in einer Stichprobe n = 2

Zentraler Grenzwertsatz und Normalverteilung Verteilung der mittleren Anzahl von Episoden von Otitis media in den ersten zwei Lebensjahren in einer Stichprobe n = 5

Zentraler Grenzwertsatz und Normalverteilung Verteilung der mittleren Anzahl von Episoden von Otitis media in den ersten zwei Lebensjahren in einer Stichprobe n = 10

Zentraler Grenzwertsatz und Normalverteilung Die Dichte einer normalverteilten Zufallsvariablen wird eindeutig durch den Erwartungswert  sowie die Varianz 2 festgelegt und durch die folgende Funktion beschrieben: Die Zufallsvariable heißt dann (,2)-normalverteilt oder N (,2). f(x) = 1 2  e  2 x –  ( ) – M. Kresken

Zentraler Grenzwertsatz der Normalverteilung Dichte der Normalverteilung N (,2): Beachte: f() = 1 2  

Zentraler Grenzwertsatz der Normalverteilung Die zur Präzisierung der Dichte benötigten Parameter werden in praxi durch Stichprobenkenngrößen geschätzt, z. B. der Erwartungswert E(X) durch den „Stichproben“-Mittelwert und die Varianz Var(X) durch die „Stichproben“-Varianz. Dies gilt in analoger Weise für die Erfolgsrate p der Binominalverteilung. M. Kresken

Zentraler Grenzwertsatz der Normalverteilung Bei praktischen Auswertungen erweist sich die Möglichkeit der Standardisierung einer normalverteilten Zufallsvariablen als sehr hilfreich. Durch die Ausnutzung dieser Eigenschaft lassen sich die Quantile einer beliebigen Normalverteilung auf diejenigen der Standardnormalverteilung zurückführen, so dass nur die Verteilung der letzteren tabelliert zu werden braucht. M. Kresken

Tabelle der Normalverteilung Wichtige Werte der Verteilungsfunktion F(z) der Standardnormalverteilung F(z): Fläche unter der N (0,1)-Dichte von - bis z M. Kresken

Häufig verwendete Wahrscheinlichkeiten der Standardnormalverteilung für symmetrische Intervalle [-z, +z] -z +z P(-z  Z  +z) -1,00 1,00 0,683 -2,00 2,00 0,954 -3,00 3,00 0,997 M. Kresken

Symmetrische Intervalle [-z, +z] für ausgewählte Wahrscheinlichkeiten der Standardnormalverteilung P(-z  Z  +z) -z +z 0,900 -1,64 +1,64 0,950 -1,96 +1,96 0,990 -2,58 +2,58 0,999 -3,29 +3,29 M. Kresken

Zentraler Grenzwertsatz der Normalverteilung Man beachte, dass sich die Standardnormalverteilung gemäß der Rücktransformation in die nicht standardisierte Form überführen lässt. x =  z +  M. Kresken

Zentraler Grenzwertsatz der Normalverteilung Beispiel: Erwartete Anteile der Risikogeburten unter den Knaben und Madchengeburten in NRW Geburtsgewichte < 2.700 g Standardisiertes Geburtsgewicht von Jungen: – 1,75 Erwarteter Anteil: M. Kresken

Tabelle der Normalverteilung Wichtige Werte der Verteilungsfunktion F(z) der Standardnormalverteilung F(z): Fläche unter der N (0,1)-Dichte von - bis z M. Kresken

Zentraler Grenzwertsatz der Normalverteilung Beispiel: Erwartete Anteile der Risikogeburten unter den Knaben und Madchengeburten in NRW Geburtsgewichte < 2.700 g Standardisiertes Geburtsgewicht von Jungen: – 1,75 Erwarteter Anteil: 0,0401; 4,0% Standardisiertes Geburtsgewicht von Mädchen: – 1,71 Erwarteter Anteil: M. Kresken

Tabelle der Normalverteilung Wichtige Werte der Verteilungsfunktion F(z) der Standardnormalverteilung F(z): Fläche unter der N (0,1)-Dichte von - bis z M. Kresken

Zentraler Grenzwertsatz der Normalverteilung Beispiel: Erwartete Anteile der Risikogeburten unter den Knaben und Madchengeburten in NRW Geburtsgewichte < 2.700 g Standardisiertes Geburtsgewicht von Jungen: – 1,75 Erwarteter Anteil: 0,0401; 4,0% Standardisiertes Geburtsgewicht von Mädchen: – 1,71 Erwarteter Anteil: 0,0436; 4,4% Die Wahrscheinlichkeitsangaben treffen jedoch nur zu, wenn die Geburtsgewichte tatsächlich normalverteilt sind. Dies kann z. B. mit Hilfe eines Normal-Probability-Plots überprüft werden. M. Kresken

Tabelle der Normalverteilung F(z): Fläche unter der N (0,1)-Dichte von - bis –1,53 M. Kresken

Tabelle der Normalverteilung Aufgrund der Symmetrie der Dichte der Standardnormalverteilung um den Wert ‚0‘ folgt für die zugehörige Dichtefunktion F(z): F(-z) = 1 - F(+z) Damit ergibt sich, dass die Wahrscheinlichkeit 0,9370 beträgt und bei der N(0,1)-Verteilung ein Wert vorkommt, der kleiner oder gleich +1,53 ist. M. Kresken

Zentraler Grenzwertsatz der Normalverteilung Umgekehrt lässt sich das -Quantil z() der Standardnormalverteilung aus der Tabelle ermitteln M. Kresken

Tabelle der Normalverteilung Für das 0,05-Quantil ( = 0,05) ergibt sich: der z-Wert von 0,0505 ist –1,64 der z-Wert von 0,0495 ist –1,65 durch lineare Interpolation ergibt sich –1,645. M. Kresken

Tabelle der Normalverteilung Entsprechend ergibt sich für das 0,975-Quantil ( = 0,975): Verwenden der Symmetrie z(0,975) = -z(1 – 0,975) = -z(0,025) = -(-1,96) = 1,96 M. Kresken