Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Logistische Regression

Ähnliche Präsentationen


Präsentation zum Thema: "Logistische Regression"—  Präsentation transkript:

1 Logistische Regression
Datenauswertung Logistische Regression

2 Jochen Mayerl und Dieter Urban, 2010. Binär-logistische Regression
Jochen Mayerl und Dieter Urban, Binär-logistische Regression. Grundlagen und Anwendung für Sozialwissenschaftler. SISS No. 3/2010. Stuttgart (http://elib.uni-stuttgart.de/opus/volltexte/2011/6018/)

3 Wahrscheinlichkeiten
Pi 0,01 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 0,99 Wahrscheinlichkeiten 𝑃 𝑌 𝑖

4 Wahrscheinlichkeiten und Gegenwahrscheinlichkeiten
Pi 1-Pi 0,01 0,99 0,1 0,9 0,2 0,8 0,3 0,7 0,4 0,6 0,5 Wahrscheinlichkeiten und Gegenwahrscheinlichkeiten

5 Wahrscheinlichkeit P → Odds (Chancen)
𝑂𝑑𝑑𝑠 𝑌 = 𝑃 (1−𝑃)

6 Wahrscheinlichkeiten, Gegenwahrscheinlichkeiten und Odds
Pi 1-Pi Odds 0,01 0,99 0,010 0,1 0,9 0,111 0,2 0,8 0,250 0,3 0,7 0,429 0,4 0,6 0,667 0,5 1,000 1,500 2,333 4,000 9,000 99,000 Wahrscheinlichkeiten, Gegenwahrscheinlichkeiten und Odds Odds 𝑌 𝑖 = 𝑃 𝑖 1− 𝑃 𝑖

7 Wahrscheinlichkeit P → Odds (Chancen) Odds → Logits (logged odds)
𝑂𝑑𝑑𝑠 𝑌 = 𝑃 (1−𝑃) 𝑙𝑜𝑔𝑖𝑡(𝑌)= ln 𝑂𝑑𝑑𝑠(𝑌) 𝑙𝑜𝑔𝑖𝑡 𝑌 = ln 𝑃 (1−𝑃)

8 Pi 1-Pi Odds Logit 0,01 0,99 0,010 -4,595 0,1 0,9 0,111 -2,197 0,2 0,8 0,250 -1,386 0,3 0,7 0,429 -0,847 0,4 0,6 0,667 -0,405 0,5 1,000 0,000 1,500 0,405 2,333 0,847 4,000 1,386 9,000 2,197 99,000 4,595 Wahrscheinlichkeiten, Gegenwahrscheinlich-keiten, Odds und logged Odds (logits) 𝐿𝑜𝑔𝑖𝑡 𝑌 𝑖 = ln (𝑂𝑑𝑑𝑠 𝑌 𝑖 ) 𝑂𝑑𝑑𝑠 𝑌 𝑖 = 𝑃 𝑖 1− 𝑃 𝑖 𝐿𝑜𝑔𝑖𝑡 𝑌 𝑖 =ln 𝑃 𝑖 1− 𝑃 𝑖

9 Wahrscheinlichkeit p 0 ≤ p ≤ 1

10 Odds p/(1-p) 0 ≤ p/(1-p) ≤ + ∞

11 Logit ln(odds) = ln(p/(1-p)) − ∞ ≤ ln(p/(1-p)) ≤ + ∞

12 Wahrscheinlichkeit p 0 ≤ p ≤ 1 Odds p/(1-p) 0 ≤ p/(1-p) ≤ + ∞ Logit ln(odds) = ln(p/(1-p)) − ∞ ≤ ln(p/(1-p)) ≤ + ∞

13 Eigenschaften von Logarithmen (logged odds = logits)
Wahrschein- Lichkeit p Odds p(1-p) Logits ln(p/(1-p)) Ereignis P ist unwahr-scheinlicher als das Gegenereignis ¬P 0 < p < 0.5 0 < odds < 1 - ∞ < logit < 0 Gleichwahrschein-lichkeit von P und ¬P p = 0.5 odds = 1 logit = 0 Ereignis P ist wahr-scheinlicher als das Gegenereignis ¬P 0.5 < p < 1 1 < odds < + ∞ 0 < logit < + ∞

14 Pi Δ(Pi+0.1) Logit Δ(logit) 0,1 -2,197 0,2 -1,386 -0,811 0,3 -0,847 -0,539 0,4 -0,405 -0,442 0,5 0,000 0,6 0,405 0,7 0,847 0,8 1,386 0,9 2,197 Wahrscheinlichkeiten, Gegenwahrscheinlich-keiten, Odds und logged Odds (logits)

15 Die logits sind eine lineare Funktion der Prädiktoren (unabhängigen Variablen).
Veränderung von X um eine Einheit  der logit(Y) verändert sich um b

16 Pointe: Logistische Regressionsmodelle schätzen die lineare Wirkung der Prädiktoren auf logits (logarithmierten Odds) an Stelle der nichtlinearen Wirkung der Prädiktoren auf die Wahrscheinlichkeit eines Ereignisses.

17 Aus den logits können wieder (vorhergesagte) Odds berechnet werden

18 Interpretation der Regressionskoeffizienten in der logistischen Regression: Wenn die unabhängige Variablen x um eine Einheit steigt, verändert sich der Logit-Wert der abhängigen Variable y um b.  Die Chance für (Y=1) verändert sich um den Faktor eb Eb wird auch Effektkoeffizient genannt und ist eine odds ratio (Verhältnis der odds für x und x+1)

19 Aus den logits können auch wieder (vorhergesagte) Wahrscheinlichkeiten berechnet werden 𝑃 𝑖 = 𝑂𝑑𝑑𝑠 𝑖 (1+ 𝑂𝑑𝑑𝑠 𝑖 )

20 Logits, Odds und Wahrscheinlichkeiten

21 „It is important to understand that the probability, the odds, and the logit are three different ways of expressing exactly the same thing. … Of the three measures, the probability or the odds is probably the most easily understood. Mathematically, however, the logit form of the probability is the one that best helps us to analyze dichotomous dependent variables. (Menard 2010, p. 15) Menard, Scott (2010). Logistic Regression. From Introductory to Advanced Concepts and Applications. Los Angeles, CA: Sage.

22 Logits und Wahrscheinlichkeiten
eLogit 1+eLogit Pi -4,595 0,010 1,010 -2,197 0,111 1,111 0,100 -1,386 0,250 1,250 0,200 -0,847 0,429 1,429 0,300 -0,405 0,667 1,667 0,400 0,000 1,000 2,000 0,500 0,405 1,500 2,500 0,600 0,847 2,333 3,333 0,700 1,386 4,000 5,000 0,800 2,197 9,000 10,000 0,900 4,595 99,000 100,000 0,990 Logits und Wahrscheinlichkeiten

23 Pointe: Logistische Regressionsmodelle schätzen die lineare Wirkung der Prädiktoren auf logits (logarithmierten Odds) an Stelle der nichtlinearen Wirkung der Prädiktoren auf die Wahrscheinlichkeit eines Ereignisses.

24 Die Beziehungen zwischen Prädiktoren und Logits, Odds und Wahrscheinlichkeiten
linear additiv nicht intuitiv interpretierbar Odds multiplikativ intuitiv interpretierbar Wahrscheinlichkeiten nicht linear

25 Von logits zu Odds im multivariaten Modell

26 negative Konstante: weniger als 50% wenn Xi = 0
Positive Konstante: mehr als 50%nwenn Xi = 0

27

28

29 Der exponenzierte Koeffizient minus 1 und mit 100 multipliziert gibt an, um wie viel Prozent sich die Chancen (odds) verändern, wenn sich die unabhängige Variable um eine Einheit ändert.


Herunterladen ppt "Logistische Regression"

Ähnliche Präsentationen


Google-Anzeigen