Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Statistik: 2.11.04 Mehr zur Regression.

Ähnliche Präsentationen


Präsentation zum Thema: "Statistik: 2.11.04 Mehr zur Regression."—  Präsentation transkript:

1 Statistik: Mehr zur Regression

2 Beispiel: Wohnungsmarkt
Für 16 Angebote von Eigentumswohnungen wurden registriert: Fläche der Wohnung (m2) Angebotspreis (1000 EUR) Fläche 122 71 125 45 100 63 194 85 Preis 530 410 480 170 315 455 885 400 164 119 140 109 40 62 84 65 900 550 790 810 390 440 300 385 PI Statistik, WS 2004/05 (6)

3 Lineare Regression Gerade, die die Datenwolke im Streudiagramm bzw.
die Beziehung zwischen den dargestellten Merkmalen möglichst gut repräsentiert Wohnungsmarkt: Daten und Regressionsgerade PI Statistik, WS 2004/05 (6)

4 Regression in EXCEL: Ausgabe: Zusammenfassung
Regressions-Statistik Multipler Korrela-tionskoeffizient 0,826 Bestimmtheitsmaß 0,682 Adj. Bestimmt-heitsmaß 0,659 Standardfehler 128,12 Beobachtungen 16 Koeffizi enten Standard fehler t-Statistik P-Wert Schnittpunkt 97,59 82,39 1,18 0,256 X Variable 1 4,19 0,76 5,47 8,2E-05 PI Statistik, WS 2004/05 (6)

5 Regression Schätzen und Bewerten
Schätzen der Koeffizienten: Methode der kleinsten Quadrate Bewerten der erhaltenen Regressionsbeziehung Anwenden der Kriterien Bestimmtheitsmaß t-Statistik Analyse der Residuen PI Statistik, WS 2004/05 (6)

6 Modell: lineare Regression
Y: Abhängiges Merkmal, endogene Variable X: Unabhängiges Merkmal, exogene Variable einfaches lineares Regressionsmodell (statisches Modell) b: Koeffizient von X a: Interzept u: Zufallsfehler, Störgröße, Störterm, „Noise“ PI Statistik, WS 2004/05 (6)

7 Dynamische Modelle einfaches dynamisches Modell
autoregressives (AR-)Modell allgemeines dynamisches Modell ADL-Modell PI Statistik, WS 2004/05 (6)

8 Mehrgleichungsmodelle
Mit gemeinsamen Regressoren Interdependentes Mehrgleichungsmodell PI Statistik, WS 2004/05 (6)

9 Lineare & nichtlineare Modelle
(in den Parametern) lineare Modelle Nichtlineares, aber linearisierbares Modell Lineare Approximation ist oft lokal gut brauchbar PI Statistik, WS 2004/05 (6)

10 Prinzip der Kleinsten Quadrate
Modell: Beobachtungen: Summe der Fehlerquadrate Prinzip der Kleinsten Quadrate: Minimiere unter Variation von a, b PI Statistik, WS 2004/05 (6)

11 Normalgleichungen partielles Ableiten von und Nullsetzen der Ableitungen gibt die Normalgleichungen Beachte! Die Normalgleichungen sind linear in a und b! PI Statistik, WS 2004/05 (6)

12 Kleinste-Quadrate Schätzer
auch OLS-Schätzer (ordinary least squares) mit PI Statistik, WS 2004/05 (6)

13 Interpretation von b b: mittlere Änderung von Y, wenn DX = 1 Modell:
OLS-Anpassung ergibt b: mittlere Änderung von Y, wenn DX = 1 PI Statistik, WS 2004/05 (6)

14 Eigenschaften von Schätzern
Wünschenswerte Eigenschaften: Erwartungstreue: minimale Varianz Konsistenz asymptotisch minimale Varianz PI Statistik, WS 2004/05 (6)

15 OLS-Schätzer: Eigenschaften
Modell: Für die OLS-Schätzer a und b gilt: 1. Sie sind erwartungstreu 2. Ihre Varianzen sind minimal in der Klasse der linearen erwartungs- treuen Schätzer [Gauss-Markov] s 2 = V (u) PI Statistik, WS 2004/05 (6)

16 Residuen Schätzung der Störgrößenvarianz s2 Streuungszerlegung 2.11.04
PI Statistik, WS 2004/05 (6)

17 Streuungszerlegung TSS: Gesamtvariation (total sum of squares)
ESS: (durch die Regression) erklärte Variation (explained sum of squares) RSS: residuale oder nicht erklärte Variation (residual sum of squares) PI Statistik, WS 2004/05 (6)

18 Bestimmtheitsmaß Anteil der durch das Modell erklärten Varianz an der Gesamtvarianz der Y Es gilt 0 ≤ R2 ≤ 1 R2 = 0 bedeutet: Modell erklärt nichts, R2 ist das Quadrat der Korrelation zwischen und Y PI Statistik, WS 2004/05 (6)

19 Adjustiertes Bestimmtheitsmaß
k: Anzahl der Regressoren (k =2 bei einfacher Regression) R2 wird mit der Anzahl der Regressoren tendenziell größer Zum Vergleich von Modellen mit unterschiedlicher Anzahl von Regressoren ist vorzuziehen PI Statistik, WS 2004/05 (6)

20 Bewertung von Modellen
Kriterien zum Bewerten von Regressions- beziehungen: t-Test F-Test Durbin-Watson Test PI Statistik, WS 2004/05 (6)

21 t-Test Bei Annahme von normalverteilten Störgrößen
gilt für den OLS-Schätzer b (k: Anzahl der Regressoren): T folgt der t-Verteilung mit n-k Freiheitsgraden Zum Test der Nullhypothese Ho: b = 0: Berechnung des p-Wertes zu b Die Nullhypothese Ho: b = 0 bedeutet: Die Regressorvariable hat keinen Erklärungsbeitrag für Y Ähnlich der F –Test bei mehreren Regressoren PI Statistik, WS 2004/05 (6)

22 Spezifikationstests auch Adäquatheitstests genannt; ein Beispiel ist der Durbin-Watson Test auf serielle Korrelation der Störgrößen PI Statistik, WS 2004/05 (6)

23 Wohnungsmarkt Regression Preis = a + b Fläche + u Daten und
Regressionsgerade PI Statistik, WS 2004/05 (6)

24 Regression in EXCEL: Ausgabe: Zusammenfassung
Regressions-Statistik Multipler Korrela-tionskoeffizient 0,826 Bestimmtheitsmaß 0,682 Adj. Bestimmt-heitsmaß 0,659 Standardfehler 128,12 Beobachtungen 16 Koeffizi enten Standard fehler t-Statistik P-Wert Schnittpunkt 97,59 82,39 1,18 0,256 X Variable 1 4,19 0,76 5,47 8,2E-05 Preis = Fläche PI Statistik, WS 2004/05 (6)

25 Wohnungsmarkt, Forts. Geschätzte Regressionsgerade
Preis = Fläche PI Statistik, WS 2004/05 (6)

26 Wohnungsmarkt, Forts. Geschätzte Regressionsgerade
Preis = Fläche Je m2 muss man im Durchschnitt mit Kosten von Euro rechnen; dazu kommt ein fixer Betrag von im Durchschnitt Euro PI Statistik, WS 2004/05 (6)

27 Wohnungsmarkt, Forts. PI Statistik, WS 2004/05 (6)

28 Wohnungsmarkt Residuen:
zur Beurteilung der Qualität der Erklärung der Daten durch die Regressionsgerade, insb. des Effekts von einzelnen Beobachtungen PI Statistik, WS 2004/05 (6)

29 Wohnungsmarkt: Residuen
PI Statistik, WS 2004/05 (6)


Herunterladen ppt "Statistik: 2.11.04 Mehr zur Regression."

Ähnliche Präsentationen


Google-Anzeigen