Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Statistik: 2.11.04 Mehr zur Regression. 2.11.04PI Statistik, WS 2004/05 (6)2 Beispiel: Wohnungsmarkt Fläche 122 71125451006319485 Preis 530 410480170315455885400.

Ähnliche Präsentationen


Präsentation zum Thema: "Statistik: 2.11.04 Mehr zur Regression. 2.11.04PI Statistik, WS 2004/05 (6)2 Beispiel: Wohnungsmarkt Fläche 122 71125451006319485 Preis 530 410480170315455885400."—  Präsentation transkript:

1 Statistik: Mehr zur Regression

2 PI Statistik, WS 2004/05 (6)2 Beispiel: Wohnungsmarkt Fläche Preis Fläche Preis Für 16 Angebote von Eigentumswohnungen wurden registriert: Fläche der Wohnung (m 2 ) Angebotspreis (1000 EUR)

3 PI Statistik, WS 2004/05 (6)3 Lineare Regression Gerade, die die Datenwolke im Streudiagramm bzw. die Beziehung zwischen den dargestellten Merkmalen möglichst gut repräsentiert Wohnungsmarkt: Daten und Regressionsgerade

4 PI Statistik, WS 2004/05 (6)4 Regression in EXCEL: Ausgabe: Zusammenfassung Regressions-Statistik Multipler Korrela- tionskoeffizient0,826 Bestimmtheitsmaß0,682 Adj. Bestimmt- heitsmaß0,659 Standardfehler128,12 Beobachtungen16 Koeffizi enten Standard fehlert-StatistikP-Wert Schnittpunkt97,5982,391,180,256 X Variable 14,190,765,478,2E-05

5 PI Statistik, WS 2004/05 (6)5 Regression Schätzen und Bewerten Schätzen der Koeffizienten: Methode der kleinsten Quadrate Bewerten der erhaltenen Regressionsbeziehung Anwenden der Kriterien Bestimmtheitsmaß t-Statistik Analyse der Residuen

6 PI Statistik, WS 2004/05 (6)6 Modell: lineare Regression Y: Abhängiges Merkmal, endogene Variable X: Unabhängiges Merkmal, exogene Variable einfaches lineares Regressionsmodell (statisches Modell) : Koeffizient von X : Interzept u: Zufallsfehler, Störgröße, Störterm, Noise

7 PI Statistik, WS 2004/05 (6)7 Dynamische Modelle einfaches dynamisches Modell autoregressives (AR-)Modell allgemeines dynamisches Modell ADL-Modell

8 PI Statistik, WS 2004/05 (6)8 Mehrgleichungsmodelle Mit gemeinsamen Regressoren Interdependentes Mehrgleichungsmodell

9 PI Statistik, WS 2004/05 (6)9 Lineare & nichtlineare Modelle (in den Parametern) lineare Modelle Nichtlineares, aber linearisierbares Modell Lineare Approximation ist oft lokal gut brauchbar

10 PI Statistik, WS 2004/05 (6)10 Prinzip der Kleinsten Quadrate Modell: Summe der Fehlerquadrate Prinzip der Kleinsten Quadrate: Minimiere unter Variation von, Beobachtungen:

11 PI Statistik, WS 2004/05 (6)11 Normalgleichungen partielles Ableiten von und Nullsetzen der Ableitungen gibt die Normalgleichungen Beachte! Die Normalgleichungen sind linear in a und b!

12 PI Statistik, WS 2004/05 (6)12 Kleinste-Quadrate Schätzer mit auch OLS-Schätzer (ordinary least squares)

13 PI Statistik, WS 2004/05 (6)13 Interpretation von b Modell: OLS-Anpassung ergibt b : mittlere Änderung von Y, wenn X = 1

14 PI Statistik, WS 2004/05 (6)14 Eigenschaften von Schätzern Wünschenswerte Eigenschaften: Erwartungstreue: minimale Varianz Konsistenz asymptotisch minimale Varianz

15 PI Statistik, WS 2004/05 (6)15 OLS-Schätzer: Eigenschaften 1. Sie sind erwartungstreu Modell: Für die OLS-Schätzer a und b gilt: 2. Ihre Varianzen sind minimal in der Klasse der linearen erwartungs- treuen Schätzer [Gauss-Markov] 2 = V (u)

16 PI Statistik, WS 2004/05 (6)16 Residuen Schätzung der Störgrößenvarianz 2 Streuungszerlegung

17 PI Statistik, WS 2004/05 (6)17 Streuungszerlegung TSS: Gesamtvariation (total sum of squares) ESS : (durch die Regression) erklärte Variation (explained sum of squares) RSS : residuale oder nicht erklärte Variation (residual sum of squares)

18 PI Statistik, WS 2004/05 (6)18 Bestimmtheitsmaß Anteil der durch das Modell erklärten Varianz an der Gesamtvarianz der Y Es gilt 0 R 2 1 R 2 = 0 bedeutet: Modell erklärt nichts, R 2 ist das Quadrat der Korrelation zwischen und Y

19 PI Statistik, WS 2004/05 (6)19 Adjustiertes Bestimmtheitsmaß k: Anzahl der Regressoren (k =2 bei einfacher Regression) R 2 wird mit der Anzahl der Regressoren tendenziell größer Zum Vergleich von Modellen mit unterschiedlicher Anzahl von Regressoren ist vorzuziehen

20 PI Statistik, WS 2004/05 (6)20 Bewertung von Modellen Kriterien zum Bewerten von Regressions- beziehungen: t-Test F-Test Durbin-Watson Test

21 PI Statistik, WS 2004/05 (6)21 t-Test Bei Annahme von normalverteilten Störgrößen gilt für den OLS-Schätzer b (k: Anzahl der Regressoren): T folgt der t-Verteilung mit n-k Freiheitsgraden Zum Test der Nullhypothese H o : = 0 : Berechnung des p-Wertes zu b Die Nullhypothese H o : = 0 bedeutet: Die Regressorvariable hat keinen Erklärungsbeitrag für Y Ähnlich der F –Test bei mehreren Regressoren

22 PI Statistik, WS 2004/05 (6)22 Spezifikationstests auch Adäquatheitstests genannt; ein Beispiel ist der Durbin-Watson Test auf serielle Korrelation der Störgrößen

23 PI Statistik, WS 2004/05 (6)23 Wohnungsmarkt Regression Preis = + Fläche + u Daten und Regressionsgerade

24 PI Statistik, WS 2004/05 (6)24 Regression in EXCEL: Ausgabe: Zusammenfassung Regressions-Statistik Multipler Korrela- tionskoeffizient0,826 Bestimmtheitsmaß0,682 Adj. Bestimmt- heitsmaß0,659 Standardfehler128,12 Beobachtungen16 Koeffizi enten Standard fehlert-StatistikP-Wert Schnittpunkt97,5982,391,180,256 X Variable 14,190,765,478,2E-05 Preis = Fläche

25 PI Statistik, WS 2004/05 (6)25 Wohnungsmarkt, Forts. Geschätzte Regressionsgerade Preis = Fläche

26 PI Statistik, WS 2004/05 (6)26 Wohnungsmarkt, Forts. Geschätzte Regressionsgerade Je m 2 muss man im Durchschnitt mit Kosten von 4.19 Euro rechnen; dazu kommt ein fixer Betrag von im Durchschnitt Euro Preis = Fläche

27 PI Statistik, WS 2004/05 (6)27 Wohnungsmarkt, Forts.

28 PI Statistik, WS 2004/05 (6)28 Wohnungsmarkt Residuen: zur Beurteilung der Qualität der Erklärung der Daten durch die Regressionsgerade, insb. des Effekts von einzelnen Beobachtungen

29 PI Statistik, WS 2004/05 (6)29 Wohnungsmarkt: Residuen


Herunterladen ppt "Statistik: 2.11.04 Mehr zur Regression. 2.11.04PI Statistik, WS 2004/05 (6)2 Beispiel: Wohnungsmarkt Fläche 122 71125451006319485 Preis 530 410480170315455885400."

Ähnliche Präsentationen


Google-Anzeigen