Statistiken je nach Messniveau beide nominal: Prozentrangdifferenz, Odds Ratio (wenn es um Chancen oder Risiken geht), Chi²-basierte Maße, Lambda (asymmetrisch) beide intervall: Korrelation (symmetrisch), Regression mit R² (asymmetrisch) UV nominal, AV intervall: Varianzanalyse mit Eta²
Prozentrangdifferenz gibt an, um wie viel Prozentpunkte eine bestimmte Ausprägung von y bei x1 höher ist als bei x2 z.B. um wie viele Prozentpunkte der Anteil der Personen, die keiner Religionsgemeinschaft angehören, bei Männern größer ist als bei Frauen.
Einfluss von Drittvariablen, Benninghaus S. 274-297, 368-381 Wenn die UV (x) und die AV (y) statistisch zusammenhängen, kann dies unterschiedliche Ursachen haben: Kausalbeziehung Scheinbeziehung / Erklärung Mediatorbeziehung / Interpretation Interaktion /Spezifikation Interaktion / Vorhersage Suppressionseffekt
Einfluss von Drittvariablen Kausalbeziehung x beeinflusst y x y
Einfluss von Drittvariablen Scheinbeziehung z z beeinflusst x und y x y x, y haben nichts miteinander zu tun, korrelieren nur deshalb, weil beide von einer dritten Variablen z beeinflusst werden. z geht x und y zeitlich/logisch voraus und erklärt den Zusammenhang von x und y. Zusammenhang verschwindet, wenn man die Drittvariable statistisch kontrolliert. Beispiel: Schwere der Krankheit (z) beeinflusst Häufigkeit des Arztbesuchs (x) und Wahrscheinlichkeit eines Todesfalls (y). Größe eines Orts (z) beeinflusst Zahl der Störche (x) und Geburtenanzahl (y)
Einfluss von Drittvariablen Mediatorbeziehung x beeinflusst z, z beeinflusst y x z y x ist nicht die Ursache von y. z tritt zeitlich/logisch zwischen x und y und interpretiert den Zusammenhang von x und y. Zusammenhang verschwindet, wenn man die Drittvariable statistisch kontrolliert. z.B. Alter -> Beziehungsdauer -> romantische Gefühle
Einfluss von Drittvariablen Interaktion / Wechselwirkung der Einfluss von x auf y besteht nur bei einer bestimmten Ausprägung von z z1: x y z2: x y Je nachdem, ob z zeitlich/logisch vorangeht (antezedierende Variable) oder zwischen x und y tritt (intervenierende Variable), spricht man von Spezifikation oder Vorhersage. Beispiel: Ein Medikament (x) wirkt auf den Gesundheitszustand (y) nur bei Frauen (z). Ein Medikament (x) wirkt auf den Gesundheitszustand (y) nur bei regelmäßiger Einnahme (z).
Einfluss von Drittvariablen Suppression der Zusammenhang von x und y wird sogar größer, wenn z kontrolliert wird. Der Anteil Lediger (vs. Verheirateter) (y) unterscheidet sich bei Männern und Frauen (x) kaum. Kontrolliert man den Bildungsstand (z), zeigt sich bei gering qualifizierten Personen ein hoher Anteil lediger Männer und ein niedriger Anteil lediger Frauen. Bei den hoch qualifizierten gibt es viele ledige Frauen und wenige ledige Männer. Geschlecht und Familienstand hängen also doch zusammen, wenn man die Personen getrennt nach Qualifikation betrachtet.
Statistische Kontrolle von Drittvariablen bei Nominalskalenniveau Multivariate Tabellenanalyse nach Lazarsfeld am Beispiel: Häufiger Arztbesuch (x) hängt zusammen mit Patiententod (y) Tabelle mit allen Untersuchungseinheiten (Marginaltabelle) Arzt selten oft Tod nein 30 25 ja 20
Tabellen getrennt nach Schwere der Krankheit (Konditionaltabellen) leichte Erkrankung schwere Erkrankung Arzt selten oft Tod nein 18 9 ja 2 1 Arzt selten oft Tod nein 12 16 ja 18 24
Die Schwere der Krankheit z beeinflusst die beiden anderen Variablen. Ergebnis In den Konditionaltabellen verschwindet der Zusammenhang zwischen Arztbesuch und Todesfällen. Die Schwere der Krankheit z beeinflusst die beiden anderen Variablen. Wird die Drittvariable konstant gehalten, stellt man fest, dass x und y doch voneinander unabhängig sind. Da z zeitlich vorangeht, spricht man hier von einer Scheinbeziehung.
Drittvariablenkontrolle bei Intervallskalenniveau: Partialkorrelation Der Einfluss von z auf die Korrelation von x und y wird wie folgt rechnerisch eliminiert: Berechnung einer Regression von x auf z (das ist der Einfluss von z auf x!!!!!) Speicherung der Residuen xi – x´i Regression von y auf z, Residuen yi – y´i Korrelation beider Residuen
Formel für Partialkorrelation dabei ist:
Rechenformel für Partialkorrelation