Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Statistik: 3.3.04 Relationen zwischen qualitativen Merkmalen.

Ähnliche Präsentationen


Präsentation zum Thema: "Statistik: 3.3.04 Relationen zwischen qualitativen Merkmalen."—  Präsentation transkript:

1 Statistik: Relationen zwischen qualitativen Merkmalen

2 3.3.04PI Statistik, SS 2004 (4)2 Beispiel: Unfälle Für 165 Unfälle wurden registriert: Ort des Unfalls: (innner-/außerhalb) Stadtgebiet Personenschaden: ja/nein P-SchadenStadtLandSumme ja nein Summe

3 3.3.04PI Statistik, SS 2004 (4)3 Unfälle: Häufigkeitsverteilung Gruppiertes Säulendiagramm 3D-Säulen

4 3.3.04PI Statistik, SS 2004 (4)4 Kontingenztafel Tabellierung von gemeinsamen Häufigkeiten zweier (oder mehrerer) qualitativer Merkmale, Häufigkeitsverteilung Auch Kreuztabellen oder Kreuzklassifikation genannt XYy1y1 …ysys Summe x1x1 n 11 …n 1s n 1. …………… xrxr n r1 …n rs n r. Summen.1 …n.r n ZelleRandverteilungen

5 3.3.04PI Statistik, SS 2004 (4)5 Unfälle: Häufigkeitsverteilungen Randverteilung nach Personenschaden Stadt/Land (bedingte) Verteilung nach Personen- schäden von Unfällen in der Stadt

6 3.3.04PI Statistik, SS 2004 (4)6 Rand- und bedingte Verteilungen n i., i =1,…,r: (Rand)Verteilung des (Zeilen-) Merkmals X n.j, j =1,…,s: (Rand)Verteilung des (Spalten-) Merkmals Y. gibt an, dass über alle möglichen Werte des Index summiert wurde n i. = j n ij n i|j, i =1,…,r : bedingte Verteilung des (Zeilen-) Merkmals X für Y =y j n j|i, j =1,…,s : bedingte Verteilung des (Spalten-) MerkmalsY für X =x i

7 3.3.04PI Statistik, SS 2004 (4)7 Unfälle: Häufigkeitsverteilungen P-SchadenStadtLandSumme ja nein Summe Randverteilung nach Personenschaden Stadt/Land (bedingte) Verteilung nach Personen- schäden von (82!) Unfällen in der Stadt Gemeinsame Verteilung

8 3.3.04PI Statistik, SS 2004 (4)8 Relative Häufigkeiten Gemeinsame relative Häufigkeiten z.B.: Anteil der (65) Unfälle ohne Personenschaden in der Stadt an allen (165) Unfällen Bedingte relative Häufigkeiten z.B.: Anteil der (65) Unfälle ohne Personenschaden (in der Stadt) an den (82) Unfällen in der Stadt

9 3.3.04PI Statistik, SS 2004 (4)9 Unfälle: Relative Häufigkeiten P-SchadenStadtLandSumme ja nein Summe Randverteilung nach Stadt/Land Personenschaden Gemeinsame Verteilung

10 3.3.04PI Statistik, SS 2004 (4)10 Unfälle: Bedingte relative Häufigkeiten P-SchadenStadtLandSumme ja nein Summe Bedingte Verteilungen für Unfälle mit ohne Personenschaden Analog bedingte Verteilungen für Unfälle in Stadt und Land nach Personenschaden

11 3.3.04PI Statistik, SS 2004 (4)11 Bedingte Verteilungen Bedingte Verteilung für Unfälle in Stadt und Land nach Personenschaden Gestapeltes Säulendiagramm

12 3.3.04PI Statistik, SS 2004 (4)12 Beziehung zwischen Merkmalen Das Wissen über die Ausprägung eines Merkmals hilft, die Ausprägung des anderen Merkmals vorherzusagen Beispiel: Unfall passierte auf Autobahn; Personenschäden sind wahrscheinlicher als wenn der Unfall im Stadtgebiet stattgefunden hätte

13 3.3.04PI Statistik, SS 2004 (4)13 Merkmale: Unabhängigkeit Zwei Merkmale X und Y werden als unabhängig bezeichnet, wenn die bedingten Verteilungen p i|j, i =1, …, r, für alle (j =1,…,s) Merkmalsausprägungen von Y übereinstimmen

14 3.3.04PI Statistik, SS 2004 (4)14 Sind Ort und Personenschäden bei Unfällen unabhängig? Was sagen uns: bedingte Verteilungen für Unfälle mit und ohne Personenschäden bedingte Verteilungen für Unfälle in Stadt und Land nach Personenschaden P-SchadenStadtLandSumme ja nein Summe

15 3.3.04PI Statistik, SS 2004 (4)15 Erwartete Häufigkeiten Sind X und Y unabhängige Merkmale, so erwarten wir die Häufigkeiten Die erwarteten Häufigkeiten sind durch die Randverteilungen bestimmt

16 3.3.04PI Statistik, SS 2004 (4)16 Unfälle: Erwartete Häufigkeiten P-Schaden StadtLandSumme ja 25,826,2 52 nein 56,256,8 113 Summe P-SchadenStadtLandSumme ja nein Summe Beobachtet: Bei Unabhängig- keit erwartet:

17 3.3.04PI Statistik, SS 2004 (4)17 Chiquadrat-Statistik Assoziationsmaß, d.h. Maß für Abhängigkeit zwischen Merkmalen Bei Unabhängigkeit der Merkmale: T = 0 Bei Abhängigkeit: T ist wesentlich größer als 0 Bei Unabhängigkeit folgt die Chiquadrat-Statistik der Chiquadrat-Verteilung

18 3.3.04PI Statistik, SS 2004 (4)18 Unfälle Chiquadrat-Statistik: T = 8.78 p-Wert (Wahrscheinlichkeit, dass T 8.78, wenn Unabhängigkeit der Merkmale zutrifft): Unabhängigkeit der Merkmale ist unplausibel

19 3.3.04PI Statistik, SS 2004 (4)19 (r x s) - Kontingenztafel Verallgemeinerung der 2x2-Tafel Chiquadrat-Statistik: Bei Unabhängigkeit folgt die Chiquadrat-Statistik der Chiquadrat-Verteilung mit (r-1)(s-1) Freiheitsgraden

20 3.3.04PI Statistik, SS 2004 (4)20 Homogenität Das Merkmal Y charakterisiert die Population Homogenität: die bedingten Verteilungen p i|j, i =1, …, r sind für alle j Populationen gleich Zum Überprüfen der Homogenität: Chiquadrat- Statistik

21 3.3.04PI Statistik, SS 2004 (4)21 Kontingentzkoeffizienten Von der Chiquadrat -Statistik abgeleitete Assoziationsmaße: Pearson´scher Kontingenzkoeffizient Cramér´scher Kontingenzkoeffizient bei Unabhängigkeit: P = 0, C = 0 Maximalwert: P < 1, C 0

22 3.3.04PI Statistik, SS 2004 (4)22 Unfälle Für die Kontingenzkoeffizienten erhalten wir

23 3.3.04PI Statistik, SS 2004 (4)23 Beispiel: Nochmals Unfälle Für 165 Unfälle wurden registriert: Ort des Unfalls: Ortsgebiet, Landstraße, Autobahn Personenschaden: ja/nein P-SchadenOrts- Geb. Land- Staße A-BahnSumme ja nein Summe x 3 Kontingenztafel

24 3.3.04PI Statistik, SS 2004 (4)24 Beispiel, Forts. Chiquadrat-Statistik: T = Bei Unabhängigkeit folgt T der Chiquadrat-Verteilung mit (r-1)(s-1) = 2 Freiheitsgraden Der p-Wert beträgt ! Pearson´scher Kontingenzkoeffizient: P = Cramér'scher Kontingenzkoeffizient: C = 0.336


Herunterladen ppt "Statistik: 3.3.04 Relationen zwischen qualitativen Merkmalen."

Ähnliche Präsentationen


Google-Anzeigen