Definitionen für Wahrscheinlichkeiten

Slides:



Advertisements
Ähnliche Präsentationen
T - Test Prüfung des Mittelwerteunterschieds bei abhängigen und unabhängigen Stichproben.
Advertisements

Definition [1]: Sei S eine endliche Menge und sei p eine Abbildung von S in die positiven reellen Zahlen Für einen Teilmenge ES von S sei p definiert.
Stochastik und Markovketten
Die Laufzeit von randomisierten (zufallsgesteuerten) Algorithmen hängt von gewissen zufälligen Ereignissen ab (Beispiel Quicksort). Um die Laufzeiten dieser.
Alternativ: Direkte schrittweise Berechnung dieser sogenannten gemeinsamen Wahrscheinlichkeiten auf Grund der Einzelwahrscheinlichkeiten Wahrscheinlichkeit.
Heute 1.F – Test zur Varianzhomogenität 2.Bartlett-Test zur Varianzhomogenität 3.Chi – Quadrat Tests für Häufigkeiten 4.Chi – Quadrat Tests zur Verteilungsanpassung.
1 Wiederholungsstunde Tests, Testauswahl. 2 Im folgenden finden Sie Fragestellungen aus der biometrischen Praxis. Geben Sie eine sachgerechte graphische.
Zufallsgrößen und Beschreibung – Wiederholung Sek. I
Gliederung Definition des Wahrscheinlichkeitsbegriffes
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-17.
Forschungsstatistik II
Heute Prüfung der Produkt-Moment Korrelation
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Der Binomialtest Man habe einen wahren Anteil P.
Kapitel 5 Stetigkeit.
Kapitel 6 Mehrstufige Zufallsexperimente
Ein frohes und erfolgreiches Jahr
Hypothesen testen: Grundidee
Statistiktutorat Sitzung 3: Grafische Darstellungen und Wahrscheinlichkeitsrechnung
Tutorat IV: Diagramme, Datenkontrolle, Wahrscheinlichkeitsrechnung
Forschungsmethoden der Psychologie 2
Statistische Methoden I WS 2002/2003 Probeklausur Freitag, 13. Dezember statt Vorlesung - Nächsten Freitag!!!
Tutorium
Tutorium Willkommen zurück, in der wunderbaren Welt der Statistik Teil II.
Tutorium
Tutorium Aufgabe 1 Informationen in Designmatrix in: - Darin sind die Prädiktoren enthalten - Aber sagt uns noch mehr! Untersuchungsdesign darin.
Das wars!.
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Vorlesung Biometrie für Studierende der Veterinärmedizin
Vorlesung Biometrie für Studierende der Veterinärmedizin Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich.
Zur Kommunikation von Wahrscheinlichkeiten
Wiederholung und Beispiele
Vorlesung Biometrie für Studierende der Veterinärmedizin Begriff der Zufallsgröße Ergebnisse von Zufallsexperimenten werden als Zahlen dargestellt:
Wahrscheinlichkeitsrechnung
20:00.
Wahrscheinlichkeits-rechnung
Wahrscheinlichkeitsrechnung Grundbegriffe
Ausgleichungsrechnung I
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Chi Quadrat Test Tamara Katschnig.
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Statistik I WS 08/09 Dr. Andreas Voß Raum: 4010
Aufgabenzettel VIII Statistik I © by Ewald Krawitz & Oliver Schattmann.
Korpuslinguistik für und mit Computerlinguistik
Wahrscheinlichkeit Zufallsexperiment:
STATISIK LV Nr.: 0028 SS Mai 2005.
Mehr zum Testen von Hypothesen
Wahrscheinlichkeitsrechnung
Würden Sie darauf wetten,
Wahrscheinlichkeitsrechnung
Referat über das Thema STOCHASTIK.
Die Wahrscheinlichkeit
Zufallsgröße und Erwartungswert
Relationen zwischen qualitativen Merkmalen
1. 2. Berechnen von Wahrscheinlichkeiten
Der Zentralwert.
Hauptschule - Realschule - Gymnasium ?
Lineare Gleichungen mit 2 Variablen
Bioinformatik Vorlesung
Stochastik Grundlagen
Spiel und Spaß mit Zahlen
K. Desch - Statistik und Datenanalyse SS05
K. Desch - Statistik und Datenanalyse SS05 Statistik und Datenanalyse 1.Wahrscheinlichkeit 2.Wahrscheinlichkeitsverteilungen 3.Monte-Carlo-Methoden 4.Statistische.
Die Binomialverteilung
Statistiken je nach Messniveau
Welche möglichen Ergebnisse gibt es beim Würfeln mit einem Würfel?
 Präsentation transkript:

Definitionen für Wahrscheinlichkeiten Gliederung Inferenzstatistik Definitionen für Wahrscheinlichkeiten Relative Häufigkeit Grenzwerte („Gesetz der großen Zahl“) Bedingte Wahrscheinlichkeit Stochastische Unabhängigkeit Wahrscheinlichkeitsrechnung Additionstheorem Multiplikationstheorem Theorem von Bayes Wahrscheinlichkeitsverteilungen 04_wahrscheinlichkeit 1

Inferenzstatistik beruht auf Wahrscheinlichkeitsaussagen Beispiel: Die Inferenzstatistik („schlussfolgernde Statistik“) zieht aus den Daten einer Stichprobe Rückschlüsse auf die zugrundeliegende Population. Inferenzstatistik beruht auf Wahrscheinlichkeitsaussagen Beispiel: Bei den Psychologie Erstsemester 2008 in Freiburg schätzen die Männer (31) ihre Statistikvorkenntnisse höher ein als die Frauen (24). „Ist das gleiche Muster auch für andere Semester (oder andere Universitäten) zu erwarten?“ „Wie wahrscheinlich ist es, dass in der Gesamt-Population aller Psychologie-Studienanfänger Männer ihre Statistikkenntnisse höher einschätzen als Frauen?“ „Wie wahrscheinlich wäre das gefundene Ergebnis (Männer = 31; Frauen = 24), wenn es in der Population keinen Unterschied gäbe?“ 04_wahrscheinlichkeit 2

Definitionen für Wahrscheinlichkeiten Was bedeutet Wahrscheinlichkeit? „a priori“ Wahrscheinlichkeit (Laplace) Wahrscheinlichkeit ist der relativer Anteil der „günstigen Fälle“ an allen möglichen Ereignissen: „a posteriori“ Wahrscheinlichkeit (Bernoulli) Wahrscheinlichkeit ist der Grenzwert der relativen Häufigkeit des Eintretens der „günstigen Fälle“ bei sehr häufigem Durchführen eines Zufallsexperimentes: 04_wahrscheinlichkeit 3

Relative Häufigkeit Die relative Häufigkeit ist ein Schätzer für die „a posteriori“ Wahrscheinlichkeit. Die relative Häufigkeit wird berechnet als die Anzahl der Probanden mit einer bestimmten Ausprägung auf einer Variable geteilt durch die Stichprobengröße. Herkunft Häufigkeit p Baden-Württemberg 53 0.54 Hessen 8 0.08 Bayern 7 0.07 Berlin 2 0.02 Rest 28 0.29 Gesamt 98 1.00 04_wahrscheinlichkeit 4

„Gesetz der großen Zahl“ Für große Zahlen ist die relative Häufigkeit ein immer besserer Schätzer für die (a posteriori) Wahrscheinlichkeit. Der Grenzwert der relativen Häufigkeit für „N gegen Unendlich“ entspricht der Wahrscheinlichkeit. Beispiel: Relative Häufigkeit des Ereignisses „Baden-Württemberg“ in Abhängigkeit von N: p(98) =.54 04_wahrscheinlichkeit 5

Bedingte Wahrscheinlichkeit Die bedingte Wahrscheinlichkeit gibt an, wie wahrscheinlich ein Ereignis (A) ist, wenn gleichzeitig ein anderes Ereignis (B) gegeben ist. Beispiele Wie wahrscheinlich ist es, dass eine Person depressiv ist (Ereignis A), wenn sie an chronischen Schmerzen leidet (Ereignis B)? Wie wahrscheinlich ist es, dass eine Schüler durch eine Prüfung fällt (Ereignis A), wenn es sich um einen Jungen handelt (Ereignis B)? Formale Schreibweise: „Die Wahrscheinlichkeit von A unter der Bedingung B“ 04_wahrscheinlichkeit 6

Bedingte Wahrscheinlichkeit Die bedingte Wahrscheinlichkeit kann folgendermaßen berechnet werden: p(A|B): Wahrscheinlichkeit von A gegeben B. p(AB): Wahrscheinlichkeit, dass A und B gleichzeitig zutreffen p(B): Wahrscheinlichkeit von B. 04_wahrscheinlichkeit 7

Bedingte Wahrscheinlichkeit Beispiel: Chronische Schmerzen (S) und Depression (D) 5% der Bevölkerung leiden an chronischen Schmerzen. 2% der Bevölkerung leiden an chronischen Schmerzen und Depressionen. Beispiel: Misserfolg in der Prüfung (P-) und Geschlecht (m) Erfolg Misserfolg Männlich 12 3 Weiblich 14 1 04_wahrscheinlichkeit 8

Stochastische Unabhängigkeit Zwei Ereignisse sind stochastisch unabhängig, wenn die Wahrscheinlichkeit für Ereignis A nicht vom Eintreten von Ereignis B beeinflusst wird. Beispiel: 2 Würfelwürfe sind stochastisch unabhängig: Die Wahrscheinlichkeit, eine 6 zu würfeln (p(6) = 1/6), ist unabhängig vom Ergebnis des zweiten Würfels. Formal: Die bedingte Wahrscheinlichkeit von A gegeben B entspricht der bedingten Wahrscheinlichkeit von A gegeben „nicht-B“ 04_wahrscheinlichkeit 9

Stochastische Unabhängigkeit Beispiel 1: Zwei Würfelwürfe W2 1 2 3 4 5 6 W1 04_wahrscheinlichkeit 10

Stochastische Unabhängigkeit Beispiel 2: Herkunft BW und Geschlecht Formal: Keine Stochastische Unabhängigkeit von Herkunft und Geschlecht Aber: Exakt identische Werte sind in empirischen Erhebungen nie zu erwarten Den statistischen Test für diese Fragestellung (Chi²-Test) lernen wir am Ende des Wintersemesters kennen Herkunft Männer Frauen Baden-Württemberg 14 38 sonstiges 7 37 04_wahrscheinlichkeit 11

Das Additionstheorem Mit dem Additionstheorem wird die Wahrscheinlichkeit berechnet, dass entweder Ereignis A oder Ereignis B eintritt. Beispiel: Wie wahrscheinlich ist es, eine 5 oder eine 6 zu würfeln? Wie wahrscheinlich ist es, dass eine Person im Laufe Ihres Lebens an einer Angststörung und an einer depressiven Störung erkranken wird (Lebenszeitprävalenz: Angststörungen: 15%, Depressivität: 10%)? Formale Schreibweise p(AB) „Wahrscheinlichkeit von A oder B“ 04_wahrscheinlichkeit 12

Das Additionstheorem Bei „disjunkten“ Ereignissen, die niemals gleichzeitig auftreten, werden die Einzelwahrscheinlichkeiten einfach addiert: Wenn Ereignisse auch gemeinsam auftreten können, dann muss die Formel ergänzt werden: Depression Angststörung nein ja .78 .07 .12 .03 04_wahrscheinlichkeit 13

Das Multiplikationstheorem Mit dem Multiplikationstheorem wird die Wahrscheinlichkeit berechnet, dass die Ereignisse A und B gleichzeitig eintreten. Beispiel: Wie wahrscheinlich ist es, mit 2 Würfelwürfen jeweils eine 6 zu würfeln? Wie wahrscheinlich ist es, dass eine Person im Laufe Ihres Lebens an einer Angststörung und an einer depressiven Störung erkranken wird (Lebenszeitprävalenz: Angststörungen: 10%, Depressivität: 8%)? Formale Schreibweise p(AB) „Wahrscheinlichkeit von A und B“ 04_wahrscheinlichkeit 14

Das Multiplikationstheorem Bei stochastisch unabhängigen Ereignissen werden die Einzelwahrscheinlichkeiten einfach multipliziert: Wenn Ereignisse abhängig sind, dann muss folgende Formel verwendet werden: bzw. Depression Angststörung nein ja .78 .07 .12 .03 04_wahrscheinlichkeit 15

Das Multiplikationstheorem Beispiel Bei einer Untersuchungen von Schmerzpatienten stellen Sie fest, das 30% der Schmerzpatienten gleichzeitig Medikamenten-abhängig sind. 0.2 % der Bevölkerung leiden an einer chronischen Schmerzerkrankung. Wie viel Prozent der Bevölkerung weisen sowohl eine Schmerzerkrankung als auch eine Medikamentenabhängigkeit auf? 04_wahrscheinlichkeit 16

Das Theorem von Bayes Das Theorem von Bayes erlaubt es, die bedingten Wahrscheinlichkeiten p(A|B) und p(B|A) in Beziehung zu setzen. Beispiel: 75% der Alkoholabhängigen sind Männer Lebenszeitprävalenz (insgesamt): 10% Wie hoch ist das Risiko für einen Mann eine Alkoholabhängigkeit zu entwickeln? 04_wahrscheinlichkeit 17

Wahrscheinlichkeitsverteilungen Bisher haben wir die Wahrscheinlichkeit von Einzelereignissen betrachtet. Wahrscheinlichkeitsverteilungen geben die Auftretens-wahrscheinlichkeiten für einzelne Werte einer Variable an. Beispiel Geschlecht: p(sex=„m“) = .22 p(sex=„w“) = .78 Beispiel Alter p(age=18) = .03 p(age=19) = .19 p(age=20) = .21 p(age=21) = .10 … 04_wahrscheinlichkeit 18

Wahrscheinlichkeitsverteilungen Da jede Person genau einen Wert für die Variable hat, sind die Ereignisse disjunkt. Daher können Bereiche durch Addition zusammengefasst werden: p(17<age<21) = p(age=18)+p(age=19)+p(age=20) = .43 Insgesamt addieren sich alle Einzelwahrscheinlichkeiten immer zu 1 04_wahrscheinlichkeit 19

Wahrscheinlichkeitsverteilungen Graphische Darstellung 50% geben einen Wert von 1 oder 2 an Die gemeinsame Fläche der Balken entspricht der gemeinsamen Wahrscheinlichkeit 04_wahrscheinlichkeit 20

Wahrscheinlichkeitsverteilungen Wahrscheinlichkeitsverteilungen für kontinuierliche Variablen Eine diskrete Wahrscheinlichkeitsverteilung gibt für jeden Wert einer diskreten Variable die Auftretenswahrscheinlichkeit an. Eine diskrete Wahrscheinlichkeitsverteilung ergibt sich ebenfalls, wenn für die Auftretenswahrscheinlichkeit für alle Kategorien einer Diskreten Variable angegeben wird (Histogramm). Eine stetige Wahrscheinlichkeitsverteilung ergibt sich, wenn für eine kontinuierliche Variable unendlich kleine Kategoriebreiten verwendet werden. Stetige Wahrscheinlichkeitsverteilungen heißen auch „Dichtefunktion“ 04_wahrscheinlichkeit 21

Wahrscheinlichkeitsverteilungen Beispiel: Diskrete und Kontinuierliche Verteilung des Optimismusfragebogens. Hinweise: Die kontinuierliche Verteilung ergibt sich nicht direkt aus den Daten Im Beispiel wurde eine Normal-verteilung angenommen. 04_wahrscheinlichkeit 22

Wahrscheinlichkeitsverteilungen Interpretation kontinuierlicher Wahrscheinlichkeitsverteilungen Bei kontinuierlichen Wahrscheinlichkeitsvertelungen kann man nicht mehr direkt eine Wahrscheinlichkeit für eine Ausprägung der Variablen ablesen. Die Wahrscheinlichkeit, dass bei einer kontinuierlichen Variable exakt einen bestimmter Wert auftritt ist (theoretisch) unendlich klein. Man kann aber Wahrscheinlichkeiten für bestimmte Bereiche einer Verteilung sehen. Dazu wird die Fläche der Verteilung herangezogen 04_wahrscheinlichkeit 23

Wahrscheinlichkeitsverteilungen Interpretation kontinuierlicher Wahrscheinlichkeitsverteilungen Die Wahrscheinlichkeit, zufällig einen Wert zwischen xmin und xmax zu erhalten entspricht der Fläche unter der Verteilung zwischen diesen Werten. xmin xmax 04_wahrscheinlichkeit 24

Dort stand auch die Formel der Dichtefunktion der Normal-verteilung: Die Normalverteilung Die wichtigste stetige Wahrscheinlichkeitsverteilung in der Psychologie ist die Normalverteilung. Sie wurde von C.F. Gauss „entdeckt“ und war auf den alten 10 DM Scheinen abgebildet. Dort stand auch die Formel der Dichtefunktion der Normal-verteilung: Die Normalverteilung ist deshalb so wichtig, weil in der Natur sehr viele Merkmale (annähernd) normalverteilt sind. 04_wahrscheinlichkeit 25

Jede Normalverteilung … Die Normalverteilung Jede Normalverteilung … hat einen „glockenförmigen“ Verlauf und ist symmetrisch (a3=0) und hat einen „normalen“ Exzess (a4 = 0) Es gibt unendlich viele Normalverteilungen Diese unterscheiden sich in Ihrem Mittelwert und in der Standardabweichung (bzw. Varianz) Der Mittelwert (μ) gibt die Position des „Gipfels“ an. Die Standardabweichung (σ) gibt die Breite der Verteilung an. 04_wahrscheinlichkeit 26

Die Standardnormalverteilung Ein Normalverteilung mit einem Mittelwert μ=0 und einer Streuung von σ=1 heißt Standardnormalverteilung. Werte einer Standardnormalverteilungen können besonders einfach interpretiert werden, da die zugehörigen Wahrscheinlichkeiten aus einer Tabelle im Statistikbuch nachgeschlagen werden können. Jede normalverteilte Variable kann einfach in eine Standard-normalverteilung transformiert werden (z-Transformation) 04_wahrscheinlichkeit 27

Die Standardnormalverteilung Beispiel z-Transformation der Optimismuswerte Deskriptive Statistik N Mittelwert Standardabweichung lot 98 23,1020 3,60266 Gültige Werte (Listenweise) LOT zLOT 27 1.08 23 -0.03 16 -1.97 19 -1.14 25 0.53 04_wahrscheinlichkeit 28

Die Standardnormalverteilung Interpretation von z-Werten (ungefähre Werte) Im Statistiklehrbuch findet man in der Tabelle zur Standard-normalverteilung für jeden z-Wert den Anteil der Fläche, die links dieses Wertes liegt. 04_wahrscheinlichkeit 29

Die Inferenzstatistik verallgemeinert die Befunde einer Stichprobe. Zusammenfassung Die Inferenzstatistik verallgemeinert die Befunde einer Stichprobe. Wahrscheinlichkeit ist der relativer Anteil „günstiger“ Ereignisse an allen möglichen Ereignissen. Im Nachhinein kann die Wahrscheinlichkeit über relative Häufigkeiten geschätzt werden. Das Gesetz der großen Zahl besagt, dass eine Abschätzung der Wahrscheinlichkeit als relative Häufigkeit immer genauer wird, je größer die Stichprobe ist. Eine bedingte Wahrscheinlichkeit gibt an, wie wahrscheinlich Ereignis A ist, wenn man schon weiß, dass ein anderes Ereignis B eingetreten ist. 04_wahrscheinlichkeit 30

Viele Psychologische Merkmale sind normalverteilt. Zusammenfassung Mit dem Additionstheorem kann berechnet werden, wie groß die Wahrscheinlichkeit ist, dass entweder Ereignis A oder Ereignis B eintritt. Mit dem Multiplikationstheorem kann berechnet werden, wie groß die Wahrscheinlichkeit ist, dass Ereignis A und Ereignis B eintreten. Das Theorem von Bayes erlaubt es, die bedingten Wahrscheinlichkeiten p(A|B) und p(B|A) in Beziehung zu setzen. Wahrscheinlichkeitsverteilungen erlauben Aussagen über die Wahrscheinlichkeiten von bestimmten Merkmalsausprägungen. Viele Psychologische Merkmale sind normalverteilt. Eine Normalverteilung mit Mittelwert 0 und Standard- abweichung 1 heißt Standardnormalverteilung. 04_wahrscheinlichkeit 31