Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005 Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Korrelation zweier stetiger Merkmale X und Y Grafische Darstellung zweier Merkmale als Punktewolke / Scatterplot / Streudiagramm / X-Y-Diagramm Geht man davon aus, dass X auf Y wirkt im Sinne einer Ursache-Wirkungs-Beziehung, so ist es sinnvoll, X auf der x-Achse und Y auf der y-Achse der Grafik abzutragen (wie bei einer mathematischen Funktion) Beispiel: siehe Vorlesung vom 20.10.2005, EKG bei Leguanen X: Temperatur, Y: Elek. Herzachse Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Scatterplot / Streudiagramm Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Korrelation nach Bravais-Pearson Die Korrelation nach Bravais-Pearson ist ein Maß für den linearen Zusammenhang von X und Y Exakter linearer Zusammenhang: y = a + bx (Gerade) Exakte lineare Zusammenhänge sind bei empirischen Daten nicht zu erwarten. Bestenfalls erhält man eine Punktewolke, die einen approximativen linearen Zusammenhang nahe legt Beispiel (nächste Folie): Linearer Zusammenhang in rechter Grafik „stärker“ als in linker Grafik Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Korrelation nach Bravais-Pearson II Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Korrelation nach Bravais-Pearson III Visuelle Beurteilung genügt nicht. Wir brauchen eine Maßzahl Der Korrelationskoeffizient nach Bravais-Pearson ist eine solche normierte Maßzahl Definition: Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Korrelation nach Bravais-Pearson IV Der Korrelationskoeffizient nimmt Werte im Bereich -1 ≤ rXY ≤ +1 an. rXY = +1 : Perfekter positiver linearer Zusammenhang, d.h. alle Punkte liegen exakt auf einer Geraden y = a+bx mit b>0 rXY = -1 : Perfekter negativer linearer Zusammenhang, d.h. alle Punkte liegen exakt auf einer Geraden y = a+bx mit b<0 Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Korrelation nach Bravais-Pearson V rXY=0: Die Merkmale sind linear unabhängig Hypothetische Datenbeispiele zur Veranschaulichung Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Beispiel 1: rXY=+1, exakter positiver linearer Zusammenhang Daten: x y 12 14 16 18 20 22 y=10+2 x Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Beispiel 2: rXY=-1, exakter negativer linearer Zusammenhang Daten: x y 8 6 4 2 -2 y=10-2 x Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Beispiel 3: rXY=0.72, starker positiver linearer Zusammenhang Daten: x y 12 15 13 18 17 16 Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Beispiel 4: rXY≈ 0, kein linearer Zusammenhang Daten: x y 10 12 9 8.33 Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Beispiel 5: rXY= 0, kein linearer Zusammenhang Daten: x y 3.125 1.125 0.125 Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Alternative: Rangkorrelationskoeffizient nach Spearman rSp Alternative zum Korrelationskoeffizienten nach Bravais-Pearson, wenn X metrisch, Y ordinal Y metrisch, X ordinal X ordinal, Y ordinal der Fokus nicht auf der Linearität des Zusammenhangs liegt, sondern nur interessiert, ob der Zusammenhang monoton ist Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005 Definition von rSp Vorarbeit: Die Originaldaten werden durch Rangzahlen ersetzt Die Berechnung erfolgt wie beim Korrelationskoeffizienten nach Bravais-Pearson, indem statt den Originaldaten ihre Ränge verwendet werden: Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Fortsetzung Beispiel 3 (Seite 11) Originaldaten Rangdaten x y Rang(x) Rang(y) 1 12 2 15 3 13 4 18 6 5 17 16 Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Fortsetzung Beispiel 3 (II) Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005 Hinweise -1 ≤ rSp ≤ +1 Sind alle (Original-)Werte von X und Y verschieden, so sind die Rangzahlen eindeutig zu vergeben. Man sagt: es treten keine Bindungen (no ties) auf Kommen (Original-)Werte von X und/oder Y doppelt oder mehrmals vor, so wird folgender „Trick“ angewendet (Verwendung von Durchschnittsrängen): Datenreihe y: 12 13 13 14 15 15 15 16 Rangzahlen : 1 2.5 2.5 4 6 6 6 8 Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005 Hinweise (II) Kommen keine Bindungen vor, so kann rSp einfacher berechnet werden: Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Fortsetzung (II) Beispiel 3 (Seite 11) Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005 Noch ein Beispiel Datenreihe x: 1 2 3 4 5 6 Datenreihe y: 1 4 9 16 25 36 y=x2 Zusammenhang ist monoton (quadratisch), aber nicht linear Rang(xi)=Rang(yi) rSp=1 (da di=0 für alle Paare i) r nach Bravais-Pearson ist 0.98 Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Scheinkorrelationen (Nonsens-Korr.) Klassiker: Positive Korrelation zwischen der Anzahl beobachteter Störche und der Anzahl der Geburten in Regionen in Deutschland (Korrelation ≠ Kausalität) Confounder-Problematik (u.a.) Im Storchenbeispiel: es gibt andere Variablen (Urbanität, Sozialverhalten), die ihrerseits assoziert sein können und mit den untersuchten Variablen (Anzahl Störche, Anzahl Geburten) in Verbindung stehen Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005 Weitere Anmerkungen Auch das Gegenteil von Scheinkorrelation kann auftreten: Tatschlich vorhandene Korrelationen werden nicht erkannt Vorzeichenumkehr: in der Gesamtpopulation wird eine (z.B.) positive Korrelation beobachtet. Zerlegt man die Gesamtpopulationen in Teilpopulationen, so kann der Fall eintreten, dass in jeder Teilpopulation eine negative Korrelation beobachtet wird Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Zusammenfassung I (was Sie wissen sollten) Der Korrelationskoeffizient nach Bravais-Pearson ist ein Maß für den linearen Zusammenhang von zwei stetigen Merkmalen (grafisch: Streudiagramm). Wert in [-1;1] Der Rangkorrelationskoeffizient nach Spearman ist ein Maß für den monotonen Zusammenhang. Die beiden Merkmale können stetig und ordinal sein (alle Kombinationen erlaubt: stetig/stetig, stetig/ordinal, ordinal/ordinal). Er verwendet Ränge statt Originalwerte (Berechnungsformel wie bei Bravais-Pearson bzw. vereinfachte Formel, wenn keine Bindungen vorkommen) Problematik: Schein-/verdeckte Korr., Vorzeichen Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Zusammenfassung II (was Sie können sollten) Streudiagramm zeichnen Korrelationskoeffizient nach Bravais-Pearson berechnen Ränge bilden (auch: bei Bindungen) Korrelationskoeffizient nach Spearman berechnen Interpretation: linearer Zusammenhang, monotoner Zusammenhang, positiver/negativer Zusammenhang Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005