Statistik: 2.11.04 Mehr zur Regression
Beispiel: Wohnungsmarkt Für 16 Angebote von Eigentumswohnungen wurden registriert: Fläche der Wohnung (m2) Angebotspreis (1000 EUR) Fläche 122 71 125 45 100 63 194 85 Preis 530 410 480 170 315 455 885 400 164 119 140 109 40 62 84 65 900 550 790 810 390 440 300 385 2.11.04 PI Statistik, WS 2004/05 (6)
Lineare Regression Gerade, die die Datenwolke im Streudiagramm bzw. die Beziehung zwischen den dargestellten Merkmalen möglichst gut repräsentiert Wohnungsmarkt: Daten und Regressionsgerade 2.11.04 PI Statistik, WS 2004/05 (6)
Regression in EXCEL: Ausgabe: Zusammenfassung Regressions-Statistik Multipler Korrela-tionskoeffizient 0,826 Bestimmtheitsmaß 0,682 Adj. Bestimmt-heitsmaß 0,659 Standardfehler 128,12 Beobachtungen 16 Koeffizi enten Standard fehler t-Statistik P-Wert Schnittpunkt 97,59 82,39 1,18 0,256 X Variable 1 4,19 0,76 5,47 8,2E-05 2.11.04 PI Statistik, WS 2004/05 (6)
Regression Schätzen und Bewerten Schätzen der Koeffizienten: Methode der kleinsten Quadrate Bewerten der erhaltenen Regressionsbeziehung Anwenden der Kriterien Bestimmtheitsmaß t-Statistik Analyse der Residuen 2.11.04 PI Statistik, WS 2004/05 (6)
Modell: lineare Regression Y: Abhängiges Merkmal, endogene Variable X: Unabhängiges Merkmal, exogene Variable einfaches lineares Regressionsmodell (statisches Modell) b: Koeffizient von X a: Interzept u: Zufallsfehler, Störgröße, Störterm, „Noise“ 2.11.04 PI Statistik, WS 2004/05 (6)
Dynamische Modelle einfaches dynamisches Modell autoregressives (AR-)Modell allgemeines dynamisches Modell ADL-Modell 2.11.04 PI Statistik, WS 2004/05 (6)
Mehrgleichungsmodelle Mit gemeinsamen Regressoren Interdependentes Mehrgleichungsmodell 2.11.04 PI Statistik, WS 2004/05 (6)
Lineare & nichtlineare Modelle (in den Parametern) lineare Modelle Nichtlineares, aber linearisierbares Modell Lineare Approximation ist oft lokal gut brauchbar 2.11.04 PI Statistik, WS 2004/05 (6)
Prinzip der Kleinsten Quadrate Modell: Beobachtungen: Summe der Fehlerquadrate Prinzip der Kleinsten Quadrate: Minimiere unter Variation von a, b 2.11.04 PI Statistik, WS 2004/05 (6)
Normalgleichungen partielles Ableiten von und Nullsetzen der Ableitungen gibt die Normalgleichungen Beachte! Die Normalgleichungen sind linear in a und b! 2.11.04 PI Statistik, WS 2004/05 (6)
Kleinste-Quadrate Schätzer auch OLS-Schätzer (ordinary least squares) mit 2.11.04 PI Statistik, WS 2004/05 (6)
Interpretation von b b: mittlere Änderung von Y, wenn DX = 1 Modell: OLS-Anpassung ergibt b: mittlere Änderung von Y, wenn DX = 1 2.11.04 PI Statistik, WS 2004/05 (6)
Eigenschaften von Schätzern Wünschenswerte Eigenschaften: Erwartungstreue: minimale Varianz Konsistenz asymptotisch minimale Varianz 2.11.04 PI Statistik, WS 2004/05 (6)
OLS-Schätzer: Eigenschaften Modell: Für die OLS-Schätzer a und b gilt: 1. Sie sind erwartungstreu 2. Ihre Varianzen sind minimal in der Klasse der linearen erwartungs- treuen Schätzer [Gauss-Markov] s 2 = V (u) 2.11.04 PI Statistik, WS 2004/05 (6)
Residuen Schätzung der Störgrößenvarianz s2 Streuungszerlegung 2.11.04 PI Statistik, WS 2004/05 (6)
Streuungszerlegung TSS: Gesamtvariation (total sum of squares) ESS: (durch die Regression) erklärte Variation (explained sum of squares) RSS: residuale oder nicht erklärte Variation (residual sum of squares) 2.11.04 PI Statistik, WS 2004/05 (6)
Bestimmtheitsmaß Anteil der durch das Modell erklärten Varianz an der Gesamtvarianz der Y Es gilt 0 ≤ R2 ≤ 1 R2 = 0 bedeutet: Modell erklärt nichts, R2 ist das Quadrat der Korrelation zwischen und Y 2.11.04 PI Statistik, WS 2004/05 (6)
Adjustiertes Bestimmtheitsmaß k: Anzahl der Regressoren (k =2 bei einfacher Regression) R2 wird mit der Anzahl der Regressoren tendenziell größer Zum Vergleich von Modellen mit unterschiedlicher Anzahl von Regressoren ist vorzuziehen 2.11.04 PI Statistik, WS 2004/05 (6)
Bewertung von Modellen Kriterien zum Bewerten von Regressions- beziehungen: t-Test F-Test Durbin-Watson Test 2.11.04 PI Statistik, WS 2004/05 (6)
t-Test Bei Annahme von normalverteilten Störgrößen gilt für den OLS-Schätzer b (k: Anzahl der Regressoren): T folgt der t-Verteilung mit n-k Freiheitsgraden Zum Test der Nullhypothese Ho: b = 0: Berechnung des p-Wertes zu b Die Nullhypothese Ho: b = 0 bedeutet: Die Regressorvariable hat keinen Erklärungsbeitrag für Y Ähnlich der F –Test bei mehreren Regressoren 2.11.04 PI Statistik, WS 2004/05 (6)
Spezifikationstests auch Adäquatheitstests genannt; ein Beispiel ist der Durbin-Watson Test auf serielle Korrelation der Störgrößen 2.11.04 PI Statistik, WS 2004/05 (6)
Wohnungsmarkt Regression Preis = a + b Fläche + u Daten und Regressionsgerade 2.11.04 PI Statistik, WS 2004/05 (6)
Regression in EXCEL: Ausgabe: Zusammenfassung Regressions-Statistik Multipler Korrela-tionskoeffizient 0,826 Bestimmtheitsmaß 0,682 Adj. Bestimmt-heitsmaß 0,659 Standardfehler 128,12 Beobachtungen 16 Koeffizi enten Standard fehler t-Statistik P-Wert Schnittpunkt 97,59 82,39 1,18 0,256 X Variable 1 4,19 0,76 5,47 8,2E-05 Preis = 97.59 + 4.19 Fläche 2.11.04 PI Statistik, WS 2004/05 (6)
Wohnungsmarkt, Forts. Geschätzte Regressionsgerade Preis = 97.59 + 4.19 Fläche 2.11.04 PI Statistik, WS 2004/05 (6)
Wohnungsmarkt, Forts. Geschätzte Regressionsgerade Preis = 97.59 + 4.19 Fläche Je m2 muss man im Durchschnitt mit Kosten von 4.19 Euro rechnen; dazu kommt ein fixer Betrag von im Durchschnitt 97.59 Euro 2.11.04 PI Statistik, WS 2004/05 (6)
Wohnungsmarkt, Forts. 2.11.04 PI Statistik, WS 2004/05 (6)
Wohnungsmarkt Residuen: zur Beurteilung der Qualität der Erklärung der Daten durch die Regressionsgerade, insb. des Effekts von einzelnen Beobachtungen 2.11.04 PI Statistik, WS 2004/05 (6)
Wohnungsmarkt: Residuen 2.11.04 PI Statistik, WS 2004/05 (6)