Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller
Gliederung 1. Einführung 2. Das lineare Logit-Modell 3. Anwendungsbeispiel 4. Zum loglinearen Modell
Einführung
Skalenniveaus
Skalenniveaus
Skalenniveaus
Skalenniveaus
Skalenniveaus
Skalenniveaus
Skalenniveaus
Skalenniveaus
Skalenniveaus
Skalenniveaus
Merkmale kategorialer Variablen: • dichotome Variablen • polytome Variablen Zwei Ausprägungen z.B. Variable „Geschlecht“ = männlich/weiblich Mehrere Ausprägungen z.B. Variable „Verkehrsmittel“ = Bus/Bahn/Auto/Fahrrad/Fußgänger • können nur endlich viele Werte annehmen
Typen statistischer Zusammenhänge:
Typen statistischer Zusammenhänge:
Typen statistischer Zusammenhänge:
Typen statistischer Zusammenhänge:
Typen statistischer Zusammenhänge:
Typen statistischer Zusammenhänge:
Typen statistischer Zusammenhänge:
Typen statistischer Zusammenhänge:
Typen statistischer Zusammenhänge:
Typen statistischer Zusammenhänge:
2. Das lineare Logit-Modell (A als Ausprägungen der unabhängigen Variable Y)
2.1 Lineare Regressionsgleichung
Lineare Regressionsgerade (nach Rosner 2001: S. 59)
Lineare Regressionsgerade (nach Rosner 2001: S. 59)
Lineare Regressionsgerade (nach Rosner 2001: S. 59)
Lineare Regression Die Regressionsgerade ist nur in einem beschränkten Bereich sinnvoll interpretierbar.
Wahrscheinlichkeitsmodell 2.2 Lineares Wahrscheinlichkeitsmodell p1j = Wahrscheinlichkeit mit der Y für X = xj den Wert 1 annimmt. p0j = 1 - p1j = Wahrscheinlichkeit mit der Y für X = xj den Wert 0 annimmt.
Lineares Wahrscheinlichkeitsmodell (nach Rosner 2001: S. 59)
Lineares Wahrscheinlichkeitsmodell (nach Rosner 2001: S. 59)
Nachteile: Schätzung in der Nähe der Extremwerte ungenau Nicht erweiterbar auf den Fall, dass Y eine polytome Variable ist Erfahrungsgemäß eher s-förmiger Kurvenverlauf
2.3 Logistisches Modell
2.3 Logistisches Modell
p1j kann nur noch Werte zwischen 1 und 0 annehmen! 2.3 Logistisches Modell • Geht xj gegen oo, geht p1j gegen 1 • Geht xj gegen –oo, geht p1j gegen 0 p1j kann nur noch Werte zwischen 1 und 0 annehmen!
Logistisches Modell (nach Rosner 2001: S. 60)
Umformung:
Umformung:
Umformung:
Umformung:
Umformung:
Logit
„Gelangen Sie motorisiert oder zu Fuß an Ihren Arbeitsplatz?“ 3. Anwendungsbeispiel: Pendlerverhalten von Angestellten STP: 12 Angestellte „Gelangen Sie motorisiert oder zu Fuß an Ihren Arbeitsplatz?“
Fragestellung: Welchen Einfluss übt die Entfernung zum Arbeitsplatz auf die Wahl des Verkehrsmittels aus? Unabhängige Variable (X): Entfernung zum Arbeitsplatz • in km Abhängige Variable (Y): Wahl des Verkehrsmittels „zu Fuß“: 0 „motorisiert“: 1
Ergebnistabelle:
(nach Hartung 1995)
Lineare Regression: (nach Hartung 1995)
Logit-Modell: Für die Ausprägungen p=0 und p=1 gibt es keine Lösung. Deshalb Berechnung der Logits!
Berechnung der Logits:
Berechnung der Logits:
Berechnung der Logits:
Berechnung der Logits:
Regressionsgerade der Logits (1/-1,0986) (3/1,0986) (2/0) (nach Hartung 1995)
Berechnung der Regressionsgerade der Logits
Berechnung der Regressionsgerade der Logits
Berechnung der Regressionsgerade der Logits
Berechnung der Regressionsgerade der Logits
Ergebnisse einsetzen in Formel des Logit-Modells Lösung: Ergebnisse einsetzen in Formel des Logit-Modells
Fragestellung: 90% benutzen ein Auto! Wieviele Pendler benutzen bei einer Distanz von 4km zum Arbeitsplatz ein motorisiertes Verkehrsmittel? 90% benutzen ein Auto!
4. Das Loglineare Modell
Stichworte zum loglinearen Modell • bei mehr als zwei kategorialen Variablen • Lösung mehrdimensionale Kontingenztabellen • Fragestellung: Besteht überhaupt ein Zusammenhang zwischen Variablen? Wie stark ist dieser?
• Binnenwanderungssaldo Beispiel: Zusammenhang von • Binnenwanderungssaldo • Verstädterungsgrad • Arbeitsplatzentwicklung negativ / schwach positiv / stark niedrig / hoch negativ / positiv
Logit-Modell und Loglineares Modell Logit-Modell etwa vergleichbar mit Regressionsanalyse Loglineares Modell etwa vergleichbar mit Korrelationsanalyse
Ende.