Logistische Regression

Slides:



Advertisements
Ähnliche Präsentationen
Steffen Maretzke October 2010 pers com
Advertisements

1990 bis 2007 Die Entwicklung einer Gemeinde
Software Assurance Erweiterte Software Assurance Services
Normalverteilte Zufallsvariablen
Kumulierte Häufigkeit
Modelle und Methoden der Linearen und Nichtlinearen Optimierung (Ausgewählte Methoden und Fallstudien) U N I V E R S I T Ä T H A M B U R G November 2011.
Übungsblatt 05 Lehrstuhl für Kommunal- und Umweltökonomie
Zahlen
Forschungsstatistik I
Forschungsstatistik I
Der Produkt-Moment- Korrelationskoeffizient Der Produkt-Moment Korrelationskoeffizient gibt Stärke und Richtung des linearen Zusammenhanges zweier Variablen.
Das Allgemeine lineare Modell (ALM) - Varianz als Schlüsselkonzept
We have a magnetic field that it is very similar to the one of a dipole. Well in reality this is true close to the surface if we go far away enough it.
Aufgabe Der Zusammenhang zwischen einem traumatischen Erlebnis und der Entstehung einer PTBS wird von mehreren Variablen …………….: Copingstrategien, Kontrollüberzeigung,
3.3 Folgebewertung HGB/IFRS
Das ist die Fritz – Walter - Schule
3 % von % von 700 9% von % von 2000.
Tutorium
Lippe, Mundhöhle, Rachen (C00-C14)
Analyse kategorialer Variablen
Vorlesung Biometrie für Studierende der Veterinärmedizin
Zur Kommunikation von Wahrscheinlichkeiten
Quantitative Methoden in der klinischen Epidemiologie
Einheiten der Parameter
Preisbildung Sascha Brunner & René Fischer. Allgemeine Annahmen Einstandspreis: 21,50 Geplanter Absatz: –550 Stück/Monat –6.600 Stück/Jahr.
Einfache Regressionsgleichung
Wiederholung: Einfache Regressionsgleichung
Rechnen mit Prozenten Klasse 7c – Schuljahr 2013/2014.
Datum:Seite: Nationale Medienkonferenz 1 Kosten der Krankenversicherung Über die Funktion von Reserven und Rückstellungen rechtlich - rechnungsmässig.
Manfred Wahl Gewinnen mit Risiko Mgmt Heidelberger Investoren Runde 11. April 2007 Idee: van Tharp Institute, Technischer Analyse Kongress 2006, Frankfurt.
Logistische Regression
Alle Maße in mm.
You need to use your mouse to see this presentation
1 Ein kurzer Sprung in die tiefe Vergangenheit der Erde.
ei No. 11~12. Ei Zeit bleiben Schwein klein Bein beide Stein.
Logistische Regression
Das Allgemeine Lineare Modell (ALM)
Ü bersetzen VokabelnFragenKulturBilder
Exponentialfunktionen zu unterschiedlichen Basen
Neuerungen im Gesellschaftsrecht
Statistik: Mehr zur Regression.
Willkommen zum “Wer will Millionär?” 50:50 15 $1 Million 14 $500,000
Kapitel 2 Das klassische Regressionsmodell
Ökonometrie I Variablenauswahl.
Einfache und multiple Regression
Mehrbelastung durch Maut, Möst und Fahrerlohnkosten Erhöhung
Numbers.
Bitte F5 drücken.
Doppik al dente Gewinnentstehung und Gewinnverwendung Köln,
Von der Wertetabelle zur Funktion
Hier die Frage formulieren ...
Bivariate Statistik M. Kresken.
Data Mining Georg Pölzlbauer.
In- und Ausländer.
Mehrstufige Deckungsbeitragsrechnung
Praxismodul 7 Agenda für heute, 15. Juni, 2006 Dateiformate
Plötzlicher Herztod – Definition (I)
Mathe-Quiz Themen der 1. Klasse.
Multivariate Statistische Verfahren
Beispiel 1.4 Ein Kreditinstitut bietet folgende Varianten für die vertragliche Gestaltung eines Kontokorrentkredits an: Nettozinssatz 10 % p.a Zinssatz.
Sachbezugswerte 2007 (SV-Entgeltverordnung) Sachbezugswerte für freie Verpflegung FrühstückMittagessenAbendessen 1,50 2,67 Monatlicher Wert Verpflegung.
Herzlich willkommen. In jeder Beziehung zählen die Menschen. Flexible Lösungen für veränderte Märkte. Individuelle Leistungen am Puls der Zeit.
Umsatz55,353,63,1 Betriebsgewinn5,04,219,2 Prozent vom Umsatz9,17,9 Gewinn vor außerordentlichen Posten 4,94,314,4 Prozent vom Umsatz8,87,9 Gewinn des.
LR Akademie Der Differenzbonus.
Rebecca Schwerdtfeger, Julia Kiel, Gesa Schwichtenberg
Foto-Tipp 7 Fotografieren durch Gitter
Die einfache/multiple lineare Regression
Seite 1 Altersstruktur der OberösterreicherInnen 2005, 2020 und 2040 Quelle: Statistik Land OÖ; MV/MF; – 01/07.
Wenn sich eine Türe schließt,
 Präsentation transkript:

Logistische Regression Datenauswertung Logistische Regression

Jochen Mayerl und Dieter Urban, 2010. Binär-logistische Regression Jochen Mayerl und Dieter Urban, 2010. Binär-logistische Regression. Grundlagen und Anwendung für Sozialwissenschaftler. SISS No. 3/2010. Stuttgart (http://elib.uni-stuttgart.de/opus/volltexte/2011/6018/)

Wahrscheinlichkeiten Pi 0,01 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 0,99 Wahrscheinlichkeiten 𝑃 𝑌 𝑖

Wahrscheinlichkeiten und Gegenwahrscheinlichkeiten Pi 1-Pi 0,01 0,99 0,1 0,9 0,2 0,8 0,3 0,7 0,4 0,6 0,5 Wahrscheinlichkeiten und Gegenwahrscheinlichkeiten

Wahrscheinlichkeit P → Odds (Chancen) 𝑂𝑑𝑑𝑠 𝑌 = 𝑃 (1−𝑃)

Wahrscheinlichkeiten, Gegenwahrscheinlichkeiten und Odds Pi 1-Pi Odds 0,01 0,99 0,010 0,1 0,9 0,111 0,2 0,8 0,250 0,3 0,7 0,429 0,4 0,6 0,667 0,5 1,000 1,500 2,333 4,000 9,000 99,000 Wahrscheinlichkeiten, Gegenwahrscheinlichkeiten und Odds Odds 𝑌 𝑖 = 𝑃 𝑖 1− 𝑃 𝑖

Wahrscheinlichkeit P → Odds (Chancen) Odds → Logits (logged odds) 𝑂𝑑𝑑𝑠 𝑌 = 𝑃 (1−𝑃) 𝑙𝑜𝑔𝑖𝑡(𝑌)= ln 𝑂𝑑𝑑𝑠(𝑌) 𝑙𝑜𝑔𝑖𝑡 𝑌 = ln 𝑃 (1−𝑃)

Pi 1-Pi Odds Logit 0,01 0,99 0,010 -4,595 0,1 0,9 0,111 -2,197 0,2 0,8 0,250 -1,386 0,3 0,7 0,429 -0,847 0,4 0,6 0,667 -0,405 0,5 1,000 0,000 1,500 0,405 2,333 0,847 4,000 1,386 9,000 2,197 99,000 4,595 Wahrscheinlichkeiten, Gegenwahrscheinlich-keiten, Odds und logged Odds (logits) 𝐿𝑜𝑔𝑖𝑡 𝑌 𝑖 = ln (𝑂𝑑𝑑𝑠 𝑌 𝑖 ) 𝑂𝑑𝑑𝑠 𝑌 𝑖 = 𝑃 𝑖 1− 𝑃 𝑖 𝐿𝑜𝑔𝑖𝑡 𝑌 𝑖 =ln 𝑃 𝑖 1− 𝑃 𝑖

Wahrscheinlichkeit p 0 ≤ p ≤ 1

Odds p/(1-p) 0 ≤ p/(1-p) ≤ + ∞

Logit ln(odds) = ln(p/(1-p)) − ∞ ≤ ln(p/(1-p)) ≤ + ∞

Wahrscheinlichkeit p 0 ≤ p ≤ 1 Odds p/(1-p) 0 ≤ p/(1-p) ≤ + ∞ Logit ln(odds) = ln(p/(1-p)) − ∞ ≤ ln(p/(1-p)) ≤ + ∞

Eigenschaften von Logarithmen (logged odds = logits) Wahrschein- Lichkeit p Odds p(1-p) Logits ln(p/(1-p)) Ereignis P ist unwahr-scheinlicher als das Gegenereignis ¬P 0 < p < 0.5 0 < odds < 1 - ∞ < logit < 0 Gleichwahrschein-lichkeit von P und ¬P p = 0.5 odds = 1 logit = 0 Ereignis P ist wahr-scheinlicher als das Gegenereignis ¬P 0.5 < p < 1 1 < odds < + ∞ 0 < logit < + ∞

Pi Δ(Pi+0.1) Logit Δ(logit) 0,1 -2,197 0,2 -1,386 -0,811 0,3 -0,847 -0,539 0,4 -0,405 -0,442 0,5 0,000 0,6 0,405 0,7 0,847 0,8 1,386 0,9 2,197 Wahrscheinlichkeiten, Gegenwahrscheinlich-keiten, Odds und logged Odds (logits)

Die logits sind eine lineare Funktion der Prädiktoren (unabhängigen Variablen). Veränderung von X um eine Einheit  der logit(Y) verändert sich um b

Pointe: Logistische Regressionsmodelle schätzen die lineare Wirkung der Prädiktoren auf logits (logarithmierten Odds) an Stelle der nichtlinearen Wirkung der Prädiktoren auf die Wahrscheinlichkeit eines Ereignisses.

Aus den logits können wieder (vorhergesagte) Odds berechnet werden

Interpretation der Regressionskoeffizienten in der logistischen Regression: Wenn die unabhängige Variablen x um eine Einheit steigt, verändert sich der Logit-Wert der abhängigen Variable y um b.  Die Chance für (Y=1) verändert sich um den Faktor eb Eb wird auch Effektkoeffizient genannt und ist eine odds ratio (Verhältnis der odds für x und x+1)

Aus den logits können auch wieder (vorhergesagte) Wahrscheinlichkeiten berechnet werden 𝑃 𝑖 = 𝑂𝑑𝑑𝑠 𝑖 (1+ 𝑂𝑑𝑑𝑠 𝑖 )

Logits, Odds und Wahrscheinlichkeiten

„It is important to understand that the probability, the odds, and the logit are three different ways of expressing exactly the same thing. … Of the three measures, the probability or the odds is probably the most easily understood. Mathematically, however, the logit form of the probability is the one that best helps us to analyze dichotomous dependent variables. (Menard 2010, p. 15) Menard, Scott (2010). Logistic Regression. From Introductory to Advanced Concepts and Applications. Los Angeles, CA: Sage.

Logits und Wahrscheinlichkeiten eLogit 1+eLogit Pi -4,595 0,010 1,010 -2,197 0,111 1,111 0,100 -1,386 0,250 1,250 0,200 -0,847 0,429 1,429 0,300 -0,405 0,667 1,667 0,400 0,000 1,000 2,000 0,500 0,405 1,500 2,500 0,600 0,847 2,333 3,333 0,700 1,386 4,000 5,000 0,800 2,197 9,000 10,000 0,900 4,595 99,000 100,000 0,990 Logits und Wahrscheinlichkeiten

Pointe: Logistische Regressionsmodelle schätzen die lineare Wirkung der Prädiktoren auf logits (logarithmierten Odds) an Stelle der nichtlinearen Wirkung der Prädiktoren auf die Wahrscheinlichkeit eines Ereignisses.

Die Beziehungen zwischen Prädiktoren und Logits, Odds und Wahrscheinlichkeiten linear additiv nicht intuitiv interpretierbar Odds multiplikativ intuitiv interpretierbar Wahrscheinlichkeiten nicht linear

Von logits zu Odds im multivariaten Modell

negative Konstante: weniger als 50% wenn Xi = 0 Positive Konstante: mehr als 50%nwenn Xi = 0

Der exponenzierte Koeffizient minus 1 und mit 100 multipliziert gibt an, um wie viel Prozent sich die Chancen (odds) verändern, wenn sich die unabhängige Variable um eine Einheit ändert.