Präsentation Seminararbeit - Tobias Byland Mosaikplots Einführung Kategoriale Daten Schrittweiser Aufbau eines Mosaikplotes Erweiterte Mosaikplots Probleme bei Mosaikplots Begrüssung 19.05.2009 Präsentation Seminararbeit - Tobias Byland 1
Präsentation Seminararbeit - Tobias Byland 1. Einführung Anwendungsbereich von Mosaikplots: Analyse von kategorialen Daten Grafische Darstellung von (komplexen) Kontingenztafeln Qualitative Zusammenhänge zwischen mehreren Variablen aufzeigen 19.05.2009 Präsentation Seminararbeit - Tobias Byland 2
Präsentation Seminararbeit - Tobias Byland 2. Kategoriale Daten Unterscheide Daten nach Informationsgehalt: Nominal Unterscheidung (Geschlecht, Farben) Ordinal Unterscheidung und Ordnung (Schulnoten, Präferenzen) Metrisch Unterscheidung, Ordnung und Abstand (Temperatur, BIP) Informationsgehalt bestimmt mögliche Rechenoperationen. Kategoriale Daten Hierarchisch. Wieso können bei ord / nom keine arithm. Mittel gebildet werden? 19.05.2009 Präsentation Seminararbeit - Tobias Byland 3
Präsentation Seminararbeit - Tobias Byland 3. Schrittweiser Aufbau eines Mosaikplotes Datensatz Suicide method2 poison gas hang drown gun knife jump other sex age.group male 10-20 1160 335 1524 67 512 47 189 464 25-35 2823 883 2751 213 852 139 366 775 40-50 2465 625 3936 247 875 183 244 534 55-65 1531 201 3581 207 477 154 273 294 70-90 938 45 2948 212 229 105 268 147 female 10-20 921 40 212 30 25 11 131 100 25-35 1672 113 575 139 64 41 276 263 40-50 2224 91 1481 354 52 80 327 305 55-65 2283 45 2014 679 29 103 388 296 70-90 1548 29 1355 501 3 74 383 106 Datensazu vorstellen Zur Demonstration dass KT unübersichtlich sind Zusammenhänge visualisieren => MP 53‘182 Beobachtungen 19.05.2009 Präsentation Seminararbeit - Tobias Byland 4
Präsentation Seminararbeit - Tobias Byland 3. Schrittweiser Aufbau eines Mosaikplotes 1 19.05.2009 Präsentation Seminararbeit - Tobias Byland 5
Präsentation Seminararbeit - Tobias Byland 3. Schrittweiser Aufbau eines Mosaikplotes method2 poison gas hang drown gun knife jump other sex male 8917 2089 14740 946 2945 628 1340 2214 female 8648 318 5637 1703 173 309 1505 1070 19.05.2009 Präsentation Seminararbeit - Tobias Byland 6
Präsentation Seminararbeit - Tobias Byland 3. Schrittweiser Aufbau eines Mosaikplotes sd Todo from here on: unabhängigkeit / andere anodnung / 19.05.2009 Präsentation Seminararbeit - Tobias Byland 7
Präsentation Seminararbeit - Tobias Byland 4. Erweiterte Mosaikplots Mosaikplots zeigen also Zusammenhänge auf, aber sind diese auch statistisch relevant? Mass für Abhängigkeit zwischen kategorialen Daten: Chi-Quadrat-Statistik Unter Unabhängigkeit würde man erwarten Daraus folgt Teststatistik Idee: Mosaikplot unter Unabhängigkeit als Benchmark oder die Pearson-Residuen direkt im Mosaikplot zeigen 19.05.2009 Präsentation Seminararbeit - Tobias Byland 8
Präsentation Seminararbeit - Tobias Byland 4. Erweiterte Mosaikplots Vorhandene Daten Daten unter Unabhängigkeit sd Todo from here on: unabhängigkeit / andere anodnung / 19.05.2009 Präsentation Seminararbeit - Tobias Byland 9
Präsentation Seminararbeit - Tobias Byland 4. Erweiterte Mosaikplots Nur einzelne Residuen sichtbar => kein Test auf Unabhängigkeit! sd Todo from here on: unabhängigkeit / andere anodnung / 19.05.2009 Präsentation Seminararbeit - Tobias Byland 10
Präsentation Seminararbeit - Tobias Byland 5. Probleme eines Mosaikplots Mehrere Mosaikplots für den selben Datensatz Viele Variablen / Ausprägungen Kleine oder fehlende Werte 19.05.2009 Präsentation Seminararbeit - Tobias Byland 11
Präsentation Seminararbeit - Tobias Byland 5. Probleme eines Mosaikplots Mehrere Mosaikplots für den selben Datensatz Kein festes vorgehen bei erstellung Kann erst nach erstellung aller MPs sicher sein, dass auch alle aussagen sichtbar gemacht wurden Kein eindeutiges Verfahren zur Erstellung von Mosaikplots ! 19.05.2009 Präsentation Seminararbeit - Tobias Byland 12
Präsentation Seminararbeit - Tobias Byland 5. Probleme eines Mosaikplots Ziel: Erkläre die Art der Selbstmorde (method2) Vorgehen: Mit einer Variablen mit möglichst wenig Ausprägungen beginnen, im Idealfall dichotom. Den Mosaikplot für neue Variablen immer abwechslungsweise splitten. Die zu erklärende Variable als Letztes einfügen, und durch Einfärben hervorheben. Sinnvolles schema fuer bestehende hypothese Splitting, bisher implizit, aber egentlich nicht nötig. 19.05.2009 Präsentation Seminararbeit - Tobias Byland 13
Präsentation Seminararbeit - Tobias Byland 5. Probleme eines Mosaikplots 19.05.2009 Präsentation Seminararbeit - Tobias Byland 14
Präsentation Seminararbeit - Tobias Byland 5. Probleme eines Mosaikplots Viele Variablen / Ausprägungen Zu viele ausprägungen sind problem, auflösung wird schlecht Technisch aber kein problem (A Mosaic of Television Ratings, J. A. Hartigan and Beat Kleiner, 1984) 19.05.2009 Präsentation Seminararbeit - Tobias Byland 15
Präsentation Seminararbeit - Tobias Byland 5. Probleme eines Mosaikplots Lösung: Subplots 19.05.2009 Präsentation Seminararbeit - Tobias Byland 16
Präsentation Seminararbeit - Tobias Byland 5. Probleme eines Mosaikplots Kleine oder fehlende Werte 0er sind problem, da können optisch leicht verlorene gehen. UND unklar wie sie im verhältnis zu anderen feldern stehe, (1:1:0 vs 1000:1000:0) 19.05.2009 Präsentation Seminararbeit - Tobias Byland 17
Präsentation Seminararbeit - Tobias Byland 5. Probleme eines Mosaikplots Kleine oder fehlende Werte Mosaikplots eignen sich weniger für Kontingenztabellen mit kleinen Zelleinträgen Beliebig grosse Zelleinträge sind hingegen kein Problem. 19.05.2009 Präsentation Seminararbeit - Tobias Byland 18
Präsentation Seminararbeit - Tobias Byland 6. Fairs Affairs > summary(Affairs_mp) affairs gender age age2 yearsmarried 0: 451 female: 315 1: 6 1: 276 1: 52 1: 150 male : 286 2: 270 2: 259 2: 193 3: 203 3: 66 3: 356 4: 79 5: 43 children religion education rating no : 171 1: 212 1: 205 1: 82 yes: 430 2: 319 2: 316 2: 93 3: 70 3: 80 3: 426 0er sind problem, da können optisch leicht verlorene gehen. UND unklar wie sie im verhältnis zu anderen feldern stehe, (1:1:0 vs 1000:1000:0) 19.05.2009 Präsentation Seminararbeit - Tobias Byland 19
Präsentation Seminararbeit - Tobias Byland 6. Anwendungsbeispiel: Fairs Affairs 0er sind problem, da können optisch leicht verlorene gehen. UND unklar wie sie im verhältnis zu anderen feldern stehe, (1:1:0 vs 1000:1000:0) 19.05.2009 Präsentation Seminararbeit - Tobias Byland
Präsentation Seminararbeit - Tobias Byland 6. Anwendungsbeispiel: Fairs Affairs 0er sind problem, da können optisch leicht verlorene gehen. UND unklar wie sie im verhältnis zu anderen feldern stehe, (1:1:0 vs 1000:1000:0) 19.05.2009 Präsentation Seminararbeit - Tobias Byland