Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

1 STATISIK LV Nr.: 1375 SS 2005 8. März 2005. 2 Zweidimensionale Merkmale Frage: Wie lässt sich der Zusammenhang bzw. die Abhängigkeit zw. zwei Merkmalen.

Ähnliche Präsentationen


Präsentation zum Thema: "1 STATISIK LV Nr.: 1375 SS 2005 8. März 2005. 2 Zweidimensionale Merkmale Frage: Wie lässt sich der Zusammenhang bzw. die Abhängigkeit zw. zwei Merkmalen."—  Präsentation transkript:

1 1 STATISIK LV Nr.: 1375 SS März 2005

2 2 Zweidimensionale Merkmale Frage: Wie lässt sich der Zusammenhang bzw. die Abhängigkeit zw. zwei Merkmalen messen? –Wie stark ist der Zusammenhang bzw. die Abhängigkeit? Antwort durch Korrelationsrechnung. –Lässt sich der Zusammenhang in einer bestimmten Form darstellen? Antwort durch Regressionsrechnung.

3 3 Zweidimensionale Merkmale n Untersuchungseinheiten, 2 Merkmale X und Y, Ausprägungen des Merkmals X a 1,…,a l und Ausprägungen des Merkmals Y b 1,…,b m. 2-dimensionales Merkmal (X,Y) mit Ausprägungen (a j,b k ), mit absoluten Häufigkeiten h jk und relativen Häufigkeiten f jk =1/h jk

4 4 Kontingenztafel Häufigkeitsverteilung von (X,Y) wird durch Kontingenztafel dargestellt. Absolute Randhäufigkeiten (von a j für j=1,…,l und b k für k=1,...,m): Relative Randhäufigkeiten (von a j für j=1,…,l und b k für k=1,…,m): Randhäufigkeiten ergeben die Häufigkeits- verteilung des Merkmals X bzw.Y (Randverteilung).

5 5 Kontingenztafel Absolute Häufigkeiten X Yb1b1 …bmbm Σ a1a1 h 11 …h 1m h 1. :::: alal h l1 …h lm h l. Σh.1 …h.m h.. =n

6 6 Kontingenztafel Relative Häufigkeiten X Yb1b1 …bmbm Σ a1a1 f 11 …f 1m f 1. :::: alal f l1 …f lm f l. Σf.1 …f.m f.. =1

7 7 Kontingenztafel Es gilt: Relative Randhäufigkeit = 1 / n · absolute Randhäufigkeit Summe der absoluten Randhäufigkeiten = n Summe der relativen Randhäufigkeiten = 1

8 8 Korrelationskoeffizient Bravais-Pearson Korrelationskoeffizient r XY 2-dimensionales metrisch skaliertes Merkmal (X,Y) mit Ausprägungen (a j,b k ) und Häufigkeiten h jk für j=1,…,l und k=1,…,m. Maß für den Zusammenhang zw. X und Y:

9 9 Korrelationskoeffizient r XY liegt immer im Intervall [-1,1] Extremfälle: -1 negativer linearer Zusammenhang r XY = 0 kein linearer Zusammenhang 1 positiver linearer Zusammenhang Interpretation: –r XY < 0 d.h. große Werte von X treten mit kleinen Werten von Y auf –r XY > 0 d.h. große Werte von X treten mit großen Werten von Y auf

10 10 Korrelationskoeffizient Probleme: Scheinkorrelation: X und Y hängen von einem dritten Merkmal Z ab –Bsp. Gefahr eines Waldbrandes (X) und schlechter Kornertrag (Y) hängen von der Stärke der Sonneneinstrahlung (Z) ab. Nonsenskorrelation: sachlogischer Zusammenhang zw. X und Y –Bsp. Korrelation zw. Anzahl der Störche und der Anzahl der Geburten in einem Land Nichtlinearer Zusammenhang: r XY misst nur einen linearer Zusammenhang

11 11 Korrelation

12 12 Korrelation

13 13 Korrelation Fechnersche Korrelationskoeffizient (2 metrisch skalierte Merkmale X und Y): r F Basiert auf Vorzeichen der transformierten Paare 1 x* und y* gleiches Vorzeichen od. beide 0 v i = ½ genau einer der Werte x* bzw. y* = 0 0 sonst

14 14 Korrelation Fechnersche Korrelationskoeffizient: Werte im Intervalle [-1,1] +1 nicht nur bei positivem linearen Zusammenhang, sonder auch wenn gilt: oder

15 15 Korrelation Rangkorrelationen für ordinal skalierte Merkmale: Verwendung von Rangzahlen: Merkmal Z, Ausprägungen z 1,…,z n, der Größe nach ordnen (von der größten zur kleinsten) z (1),…,z (n) und nummerieren. Rangzahl: R(z (i) ) = i für i=1,…,n Tritt ein Ausprägung mehrmals auf, dann Rang = arithm. Mittel der Ränge, die sie einnehmen. –Bsp: z (1) =8, z (2) =5, z (3) =5, z (4) =2, Ränge: R(z (1) )=1, R(z (2) )=2,5, R(z (3) )=2,5, R(z (4) )=4

16 16 Korrelation Spearmansche Rangkorrelationskoeffizient r S Entspricht dem Bravais-Pearson Koeffizienten der Rangzahlen Wert +1 schon bei monoton wachsenden Beobachtungen, d.h. es gilt für alle (x i,y i ), (x j,y j ): mit x i < x j ist auch y i < y j

17 17 Korrelation Yulesche Assoziationskoeffizient für eine Vierfeldertafel (X,Y) nominal skaliert Häufigkeitsverteilung von (X,Y) Es gilt: -1 A XY +1; falls ein h ij =0, so gilt: |A XY |=1; Vorzeichen nur in Verbindung Vierfeldertafel interpretierbar

18 18 Wahrscheinlichkeitsrechung Betrachte Ereignisse die nicht deterministisch (vorherbestimmbar) sind, Ereignisse mit Zufallscharakter.

19 19 Wahrscheinlichkeitsrechung Grundbegriffe: Zufallsexperiment: –Vorgang nach einer bestimmten Vorschrift ausgeführt, beliebig oft wiederholbar, Ergebnis hängt vom Zufall ab, bei mehrmaligen Durchführung des Experiments beeinflussen die Ergebnisse einander nicht – unabhängig voneinander. (z.B. Münzwurf, Werfen eines Würfels, …)

20 20 Wahrscheinlichkeitsrechung Elementarereignisse (Realisationen) –Zufallsexperiment: Reihe aller möglichen elementarer Ereignisse {e 1 },…,{e n } Ereignisraum S: –Menge der Elementarereignisse S={e 1,…,e n } Ereignis: –Jede beliebige Teilmenge des Ereignisraumes (setzt sich aus einem od. mehreren Elementarereignissen zusammen)

21 21 Wahrscheinlichkeitsrechung Vereinigung –Vereinigung von 2 Ereignissen A und B: A U B Menge aller Elementarereignisse, die zu A oder B gehören Durchschnitt –Durchschnitt von 2 Ereignissen A und B: AB Menge aller Elementarereignisse, die zu A und B gehören Disjunkte Ereignisse –2 Ereignisse A und B schließen einander aus, AB=Ø (Ø unmögliches Ereignis) Komplementärereignis –Menge aller Elementarereignisse des Ereignisraumes S, die nicht in Ereignis A enthalten sind

22 22 Wahrscheinlichkeitsrechung Wahrscheinlichkeit ist ein Maß zur Quantifizierung der Sicherheit bzw. Unsicherheit des Eintretens eines bestimmten Ereignisses im Rahmen eines Zufallsexperiments.

23 23 Wahrscheinlichkeitsrechung Klassischer Wahrscheinlichkeitsbegriff: Bsp. Urne mit 10 Kugeln (8 rot, 2 schwarz) –Gesucht: Wahrscheinlichkeit, dass eine zufällig gezogene Kugel rot ist (Ereignis A) –Ereignisraum 10 mögl. Elementarereignisse, 8 günstige Fälle –W(A) = 8 / 10 = 0,8

24 24 Wahrscheinlichkeitsrechung Statistischer Wahrscheinlichkeitsbegriff: Grenzwert der relativen Häufigkeiten des Auftretens von A

25 25 Wahrscheinlichkeitsrechung Subjektiver Wahrscheinlichkeitsbegriff: Ereignissen werden Wettchancen zugeordnet. Quote für A ist a:b, dann ergibt sich die Wahrscheinlichkeiten

26 26 Wahrscheinlichkeitsrechung Axiomatischer Wahrscheinlichkeitsbegriff: Definition von mathematischen Eigenschaften 1. 0 W(A) 1 2. W(S) = 1 3. A und B disjunkt: W(A U B) = W(A) + A(B)

27 27 Zufallsvariable Zufallsvariable: Variable deren Wert vom Zufall abhängt (z.B. X, Y, Z) –Bsp. Zufallsexperiment: 2-maliges Werfen einer Münze. Frage: Wie oft erscheint Zahl? Mögliche Werte: 0, 1, 2. Variable Anzahl Zahl hängt vom Zufall ab – Zufallsvariable. Realisation (Ausprägung): Wert, den eine Zufallsvariable X annimmt (z.B. x, y, z). –Bsp. 2-maliges Werfen einer Münze, ZV X Anzahl Zahl, Ausprägungen: x 1 =0, x 2 =1, x 3 =2.

28 28 Zufallsvariable Zufallsvariable: Funktion, die jedem Elementarereignis eine bestimmt reelle Zahl zuordnet, z.B. X(e j )=x i Definitionsbereich einer ZV: Ereignisraum S des zugrundeliegenden Zufallsexperiments. Wertebereich einer ZV: Menge der reellen Zahlen.

29 29 Zufallsvariable Diskrete Zufallsvariable: ZV mit endlich vielen oder abzählbar unendlich vielen Ausprägungen Stetige Zufallsvariable: können (zumindest in einem bestimmten Bereich der reellen Zahlen) jeden beliebigen Zahlenwert annehmen.

30 30 Wahrscheinlichkeit Diskrete Zufallsvariable: Wahrscheinlichkeit, mit der eine diskrete ZV X eine spezielle Ausprägung x i annimmt, W(X=x i ): Summe der Wahrscheinlichkeiten derjenigen Elementarereignisse e j, denen Ausprägung x i zugeordnet ist:

31 31 Wahrscheinlichkeitsfunktion Wahrscheinlichkeitsfunktion einer diskreten ZV: Funktion f(x i ), die für jede Ausprägung der ZV (unterschiedliche Ausprägungen x i einer ZV X) die Wahrscheinlichkeit ihres Auftretens angibt: f(x i ) = W(X=x i ) Eigenschaften: –f(x i ) 0 i=1,2,… –Σ i f(x i ) = 1

32 32 Verteilungsfunktion Verteilungsfunktion einer diskreten ZV: Funktion F(x), die die Wahrscheinlichkeit dafür angibt, dass die ZV X höchstens den Wert x annimmt. F(x) = W(X x) Es gilt: Treppenfunktion

33 33 Verteilungsfunktion Verteilungsfunktion einer stetigen ZV (kann in einem bestimmten Intervall jeden beliebigen Wert annehmen): Funktion F(x), die die Wahrscheinlichkeit dafür angibt, dass die ZV X höchstens den Wert x annimmt. F(x) = W(X x) Stetige Funktion

34 34 Verteilungsfunktion Eigenschaften einer stetigen Vt-Funktion: 1. 0 F(x) 1 2. F(x) ist monoton wachsend (d.h. für x 1 < x 2 gilt F(x 1 ) F(x 2 ) 3. lim x- F(x) = 0 4. lim x F(x) = 1 5. F(x) ist überall stetig

35 35 Wahrscheinlichkeitsdichte Wahrscheinlichkeitsdichte (Dichtefunktion) f(x) einer stetigen ZV: Ableitung der Verteilungsfunktion. Es gilt:

36 36 Wahrscheinlichkeitsdichte Eigenschaften: 1. f(x) W(X=x) = 0 5. W(a X b) = W(a < X < b) 6. W(X a) = F(a) W(X b) = F(b) W(a X b) = F(b) – F(a)

37 37 Parameter Charakterisierung der Wahrscheinlichkeits- verteilung von Zufallsvariablen durch Parameter (Maßzahlen) Erwartungswert E(X) = Lageparameter (Entspricht dem arithm. Mittel) Varianz Var(X) = Streuungsparameter

38 38 Erwartungswert Diskrete ZV: Stetige ZV:

39 39 Varianz Diskrete ZV: Stetige ZV: Standardabweichung:

40 40 Standardisierung Lineare Transformation: Y = a + bX Spezialfall Standardisierung: a = – E(X) / σ X b = 1 / σ X Standardisierte Variable Z: Es gilt: E(Z) = 0 und Var(Z) = 1

41 41 Theoretische Verteilungen Diskrete Verteilungen –Binomialverteilung –Hypergeometrische Verteilung –Poissonverteilung –... Stetige Verteilungen –Gleichverteilung –Exponentialverteilung –Normalverteilung –Chi-Quadrat Verteilung –t-Verteilung (Studentverteilung) –F-Verteilung –...

42 42 Theoretische Verteilungen Wichtigste theoretische Verteilung: Normalverteilung: –stetige Verteilung –symmetrische Dichtefunktion –S-förmige Verteilungsfunktion –Erwartungswert: E(X) = µ –Varianz: Var(X) = σ² –Maximum der Dichte bei x=µ –Wendepunkte bei x=µ σ

43 43 Normalverteilungen Normalverteilung: Dichtefunktion (für - 0) : Verteilungsfunktion:

44 44 Normalverteilung Normalverteilungen mit unterschiedlichen Parametern

45 45 Normalverteilung Verteilungsfunktion

46 46 Normalverteilung Standardnormalverteilung: –Erwartungswert µ = 0 –Varianz σ² = 1 Dichtefunktion:

47 47 Normalverteilung Standardnormalverteilung


Herunterladen ppt "1 STATISIK LV Nr.: 1375 SS 2005 8. März 2005. 2 Zweidimensionale Merkmale Frage: Wie lässt sich der Zusammenhang bzw. die Abhängigkeit zw. zwei Merkmalen."

Ähnliche Präsentationen


Google-Anzeigen