Logistische Regression

Slides:



Advertisements
Ähnliche Präsentationen
Tutorat Statistik II im SS 09 Multiple Regression
Advertisements

Statistik-Tutorat SS 2009 Christina
Forschungsstatistik I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Regression und Korrelation
Mixed Models Jonathan Harrington library(ez) library(lme4)
Logistische Regression und die Analyse von Proportionen Jonathan Harrington.
Forschungsstatistik II
Heute Prüfung der Produkt-Moment Korrelation
Forschungsstatistik I
Forschungsstatistik I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Der Produkt-Moment- Korrelationskoeffizient Der Produkt-Moment Korrelationskoeffizient gibt Stärke und Richtung des linearen Zusammenhanges zweier Variablen.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2005/2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Der Binomialtest Man habe einen wahren Anteil P.
Modellvergleich.
Mehrfachregressionen
Quantitative Methoden I
Latente Variablen – Kennwerte zur Beurteilung von Modellen
Aufgabe Der Zusammenhang zwischen einem traumatischen Erlebnis und der Entstehung einer PTBS wird von mehreren Variablen …………….: Copingstrategien, Kontrollüberzeigung,
Was steht in einer ANOVA - Tabelle?
Nachholung der Vorlesung vom Freitag
Ab nächster Woche wird die Übungsgruppe Gruppe 2: Henrike Berg Di SR 222 wegen Personalmangel eingestellt.
Statistische Methoden I SS 2005 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.
Datenmatrix. Datentabelle für 2 Merkmale Kontingenztafel der absoluten Häufigkeiten.
Maximum-Likelihood-Schätzer ( diskreter Fall) Likelihood-Funktion mit oder M-L-Schätzer.
III. Induktive Statistik
Datenmatrix.
Test auf Normalverteilung
Klausur am :00 bis 13:00 Hörsaal Loefflerstraße und Hörsaal Makarenkostraße.
Tutorium
Tutorium
Tutorium
Tutorium Aufgabe 1 Informationen in Designmatrix in: - Darin sind die Prädiktoren enthalten - Aber sagt uns noch mehr! Untersuchungsdesign darin.
(Gini-Koeffizient, Lorenz-Kurve)
Probleme der Modellspezifikation
Wiederholung: Einfache Regressionsgleichung
Semipartialkorrelation Multiple Korrelation Inkrementelle Validität
Chi Quadrat Test Tamara Katschnig.
Kapitel 7 Lineare Restriktionen
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Logistische Regression
Das Allgemeine Lineare Modell (ALM)
Seminar: Datenerhebung
Exponentialfunktionen zu unterschiedlichen Basen
Statistik: Mehr zur Regression.
Kapitel 2 Das klassische Regressionsmodell
Lineare Restriktionen
Missspezifikation: Konsequenzen und Tests
Kapitel 5 Statistische Bewertung von Regressionsbezie-hungen
Bewertung von Regressionsbeziehungen
Kapitel 11 Heteroskedastizität
Einfache und multiple Regression
Annahmen des lineare Regressionsmodells
Kapitel 4 Annahmen des linearen Regressionsmodells
Ökonometrie I Modellvergleich (Übersicht) Ökonometrie I2 Vergleich von Modellen Fragestellungen für Modellvergleich 1.Fehlende Regressoren.
STATISIK LV Nr.: 0021 WS 2005/ November 2005.
Kapitel 14 Trends und Unit-root-Tests
1 STATISIK LV Nr.: 0021 WS 2005/ November 2005.
Regression Maria Morozova Lisa Ochsenhofer. Einführung Francis Galton 1886 Größe von Vater und Sohn Regression zum Mittelwert.
Lernmodelle und Experimentelle Untersuchungen
Weiterfu ̈ hrende statistische Methoden fu ̈ r Politikwissenschaftler Georg Wenzelburger / Sebastian Jäckle / Pascal König ISBN: © 2014.
Die einfache/multiple lineare Regression
STATISIK LV Nr.: 1852 WS 2005/ Jänner 2006.
setzt Linearität des Zusammenhangs voraus
Die einfache/multiple lineare Regression
Varianzanalyse und Eta²
Statistiken je nach Messniveau
Exkurs: Chi-quadrat und Modellgüte 1. ist ein Distanzmaß, welches die Distanz zwischen Modellvorhersage und Daten misst.  Je kleiner desto besser ist.
 Präsentation transkript:

Logistische Regression Datenauswertung Logistische Regression

Regressionskoeffizient b Logistische Regression – Zwischenbilanz OLS-Regression Logistische Regression Konstante c Regressionskoeffizient b F-Wert und F-Test Sums of Squares Determinantionskoeffizient R² t-Wert und T-Test

Logistische Regression: Modelgüte Maximum Likelihood Estimation In der logistischen Regression wird die Likelihood-Funktion maximiert.

Likelihoods bei verschiedenen vorhergesagte Wahrscheinlichkeiten Pi Vorhersage 1 0,9 gut 0,91 = 0,9 0,10=1 0,7 0,71 = 0,7 0,30=1 0,6 0,61 = 0,6 0,40=1 0,5 0,51 = 0,5 0,50=1 0,4 0,41 = 0,4 0,60=1 0,2 0,21 = 0,2 0,80=1 0,1 0,11 = 0,1 0,90=1 0,01 schlecht 0,011 = 0,01 0,990=1

Likelihoods bei verschiedenen vorhergesagte Wahrscheinlichkeiten Pi Vorhersage 0,9 schlecht 0,90 = 1 0,11 = 0,1 0,1 0,7 0,70 = 1 0,31 = 0,3 0,3 0,6 0,60 = 1 0,41 = 0,4 0,4 0,5 0,50 = 1 0,51 = 0,5 0,40 = 1 0,61 = 0,6 0,2 0,20 = 1 0,81 = 0,8 0,8 0,10 = 1 0,91 = 0,9 0,01 gut 0,010 = 1 0,991 = 0,99 0,99

Likelihoods bei verschiedenen vorhergesagte Wahrscheinlichkeiten Pi Vorhersage 1 0,9 gut 0,91 = 0,9 0,10=1 0,7 0,71 = 0,7 0,30=1 0,6 0,61 = 0,6 0,40=1 0,5 0,51 = 0,5 0,50=1 0,4 0,41 = 0,4 0,60=1 0,2 0,21 = 0,2 0,80=1 0,1 0,11 = 0,1 0,90=1 0,01 schlecht 0,011 = 0,01 0,990=1 0,90 = 1 0,70 = 1 0,31 = 0,3 0,3 0,60 = 1 0,50 = 1 0,40 = 1 0,20 = 1 0,81 = 0,8 0,8 0,10 = 1 0,010 = 1 0,991 = 0,99 0,99

Logistische Regression: Modelgüte Likelihood-Funktion Maximum Likelihood Estimation durch Berechnung der log Likelihood-Funktion

Logistische Regression: Omnibus-Signifikanztest des Modells: Es gilt: schlechte Modellanpassung gute Modellanpassung

Logistische Regression: Omnibus-Signifikanztest des Modells: Es gilt: gute Modellanpassung schlechte Modellanpassung

Logistische Regression: Omnibus-Signifikanztest des Modells: Vergleich des Modells mit Prädiktoren mit einem Modell ohne Prädiktoren baseline model: Wahrscheinlichkeiten werden nicht durch andere Faktoren beeinflusst  alle Koeffizienten bi= 0 nur Konstante c = durchschnittliche Wahrscheinlichkeit (grand mean)

Logistische Regression: Omnibus-Signifikanztest des Modells: Je größer die Differenz zwischen baseline log likelihood und model log likelihood, umso besser erklären die Koeffizienten des Modells die beobachteten Werte.

Logistische Regression: Omnibus-Signifikanztest des Modells: Likelihood-Ratio-Test Likelihood ratio = ln(baseline likelihood/model likelihood) Log-likelihood-Differenz = baseline log likelihood – model log likelihood mit Log-likelihood-Differenz∙ (-2) [sprich: minus-two log likelihood] bzw. Likelihood-ratio∙ (-2) sind chi-quadrat-verteilt mit df= Zahl der unabhängigen Variablen

Logistische Regression: PRE-Maße relative Verbesserung der Vorhersage im Vergleich zum Baseline-Model (nur Konstante) Pseudo-R² nach McFadden

Logistische Regression: PRE-Maße Pseudo-R²-Maße Mc-Fadden‘s Pseudo-R ² Pseudo-R²-Werte können nur in hierarchischen Modellen („geschachtelt bzw. „nested“) miteinander verglichen werden Cox-Snell Pseudo-R² Nagelkerke‘s Pseudo-R² Akaike's Information Criterion AIC Modellspezifische AIC-Werte bzw. BIC-Werte können über verschiedene Modelle hinweg verglichen werden. Je kleiner AIC bzw. BIC, umso besser ist das Modell Bayesian Information Criterion BIC

Logistische Regression: PRE-Maße Akaike information criterion 𝐴𝐼𝐶=−2𝐿𝐿+2 𝑘+1 Baysian information criterion 𝐵𝐼𝐶=−2𝐿𝐿+ln(n)∙(𝑘+1)

Logistische Regression: PRE-Maße If you want R², why not use R²? (Menard 2010: 52) Speichere die vorhergesagten Werte des logistischen Regressionsmodells. Berechne die Produkt-Moment-Korrelation r zwischen den beobachteten Werten der abhängigen Variable und den vorhergesagten Werten Die quadrierte Produkt-Moment-Korrelation r² ist der durch das Modell erklärte Anteil an Variation der abhängigen Variable

Logistische Regression: Signifikanztests Test der einzelnen Koeffizienten durch den Wald-Test Wald =Koeffizient/Standardfehler des Koeffizienten 𝑊 𝑗 = 𝐵 𝑗 𝑆𝐸 𝐵 𝑗 W ist z-verteilt

Regressionskoeffizient b Logistische Regression – Bilanz OLS-Regression Logistische Regression Konstante c Regressionskoeffizient b F-Wert (F-Test) -2LL-Differenz (χ²-Test) Sums of Squares -2LLs bzw. LLs Determinantionskoeffizient R² Pseudo-R², AIC, BIC t-Wert und T-Test Wald-Wert (Wald-Test)