Statistik: 2.11.04 Mehr zur Regression.

Slides:



Advertisements
Ähnliche Präsentationen
Statistik-Tutorat SS 2009 Christina
Advertisements

Modellprämissen der linearen Regression
Heute 1.F – Test zur Varianzhomogenität 2.Bartlett-Test zur Varianzhomogenität 3.Chi – Quadrat Tests für Häufigkeiten 4.Chi – Quadrat Tests zur Verteilungsanpassung.
Induktive Statistik: Regressionsanalyse
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Mehrfachregressionen
K. Desch - Statistik und Datenanalyse SS05
Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des.
Mögliche Funktionenklassen
Datenmatrix. Datentabelle für 2 Merkmale Kontingenztafel der absoluten Häufigkeiten.
Datenmatrix.
Korrelationskoeffizient nach Bravais-Pearson Eigenschaften X und Y unabhängig.
Datentabelle für 2 Merkmale
Tutorium
Tutorium
(Gini-Koeffizient, Lorenz-Kurve)
(Un-)sicherheiten in der Ökosystemmodellierung
Eigenschaften der OLS-Schätzer
Einfache Regressionsgleichung
Probleme der Modellspezifikation
Multikollinearität Wann spricht man von Multikollinearität?
Wiederholung: Einfache Regressionsgleichung
Kapitel 9 Analyse der Modellstruktur
Kapitel 15 Instrumentvariablen- Schätzung
Relationen zwischen metrischen Merkmalen
Kapitel 7 Lineare Restriktionen
Logistische Regression
Auslegung eines Vorschubantriebes
Kapitel 15 Instrumentvariablen- Schätzung
Kapitel 10 Multikollinearität
Kapitel 9 Analyse der Modellstruktur Hackl, Einführung in die Ökonometrie 2 Rekursive OLS-Schätzung Spezifiziertes Modell: y = X + u y, u:
Kapitel 6 Variablenauswahl und Missspezifikation
Kapitel 2 Das klassische Regressionsmodell
Lineare Restriktionen
Kapitel 18 Dynamische Modelle: Schätzen der Parameter
Ökonometrie I Analyse der Modellstruktur Ökonometrie I2 Rekursive OLS-Schätzung Spezifiziertes Modell: y = X + u y, u: n-Vektoren; X: Ordnung.
Peter Hackl Sprechstunde: Fr, 10:30-11:30 Tel.:
Kapitel 1 Der Begriff „Ökonometrie“
Missspezifikation: Konsequenzen und Tests
Kapitel 5 Statistische Bewertung von Regressionsbezie-hungen
Kapitel 19 Kointegration
Kapitel 3 Lineare Regression: Schätzverfahren
Kapitel 21 Mehrgleichungs-Modelle: Schätzverfahren
Kapitel 16 Ökonometrische Modelle
Kapitel 14 Trends und Unit-root-Tests
Ökonometrie I Variablenauswahl.
Mehr zum Testen von Hypothesen
Bewertung von Regressionsbeziehungen
OLS-Schätzer und seine Eigenschaften
Kapitel 11 Heteroskedastizität
Einfache und multiple Regression
Annahmen des lineare Regressionsmodells
Kapitel 4 Annahmen des linearen Regressionsmodells
Kapitel 8 Prognose und Prognosequalität
Ökonometrie I Modellvergleich (Übersicht) Ökonometrie I2 Vergleich von Modellen Fragestellungen für Modellvergleich 1.Fehlende Regressoren.
Kapitel 18 Dynamische Modelle: Schätzen der Parameter.
Kapitel 21 Mehrgleichungs- Modelle: Schätzverfahren.
STATISIK LV Nr.: 0021 WS 2005/ November 2005.
Kapitel 9 Analyse der Modellstruktur
Kapitel 11 Heteroskedastizität
Kapitel 14 Trends und Unit-root-Tests
1 STATISIK LV Nr.: 0021 WS 2005/ November 2005.
Analyseprodukte numerischer Modelle
STATISIK LV Nr.: 1852 WS 2005/ Jänner 2006.
setzt Linearität des Zusammenhangs voraus
Die einfache/multiple lineare Regression
 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.
Außenhandelsbeziehungen zwischen China, USA, EU Makroökonometrie Vorlesung Dr. Oliver Bode.
 Präsentation transkript:

Statistik: 2.11.04 Mehr zur Regression

Beispiel: Wohnungsmarkt Für 16 Angebote von Eigentumswohnungen wurden registriert: Fläche der Wohnung (m2) Angebotspreis (1000 EUR) Fläche 122 71 125 45 100 63 194 85 Preis 530 410 480 170 315 455 885 400 164 119 140 109 40 62 84 65 900 550 790 810 390 440 300 385 2.11.04 PI Statistik, WS 2004/05 (6)

Lineare Regression Gerade, die die Datenwolke im Streudiagramm bzw. die Beziehung zwischen den dargestellten Merkmalen möglichst gut repräsentiert Wohnungsmarkt: Daten und Regressionsgerade 2.11.04 PI Statistik, WS 2004/05 (6)

Regression in EXCEL: Ausgabe: Zusammenfassung Regressions-Statistik Multipler Korrela-tionskoeffizient 0,826 Bestimmtheitsmaß 0,682 Adj. Bestimmt-heitsmaß 0,659 Standardfehler 128,12 Beobachtungen 16   Koeffizi enten Standard fehler t-Statistik P-Wert Schnittpunkt 97,59 82,39 1,18 0,256 X Variable 1 4,19 0,76 5,47 8,2E-05 2.11.04 PI Statistik, WS 2004/05 (6)

Regression Schätzen und Bewerten Schätzen der Koeffizienten: Methode der kleinsten Quadrate Bewerten der erhaltenen Regressionsbeziehung Anwenden der Kriterien Bestimmtheitsmaß t-Statistik Analyse der Residuen 2.11.04 PI Statistik, WS 2004/05 (6)

Modell: lineare Regression Y: Abhängiges Merkmal, endogene Variable X: Unabhängiges Merkmal, exogene Variable einfaches lineares Regressionsmodell (statisches Modell) b: Koeffizient von X a: Interzept u: Zufallsfehler, Störgröße, Störterm, „Noise“ 2.11.04 PI Statistik, WS 2004/05 (6)

Dynamische Modelle einfaches dynamisches Modell autoregressives (AR-)Modell allgemeines dynamisches Modell ADL-Modell 2.11.04 PI Statistik, WS 2004/05 (6)

Mehrgleichungsmodelle Mit gemeinsamen Regressoren Interdependentes Mehrgleichungsmodell 2.11.04 PI Statistik, WS 2004/05 (6)

Lineare & nichtlineare Modelle (in den Parametern) lineare Modelle Nichtlineares, aber linearisierbares Modell Lineare Approximation ist oft lokal gut brauchbar 2.11.04 PI Statistik, WS 2004/05 (6)

Prinzip der Kleinsten Quadrate Modell: Beobachtungen: Summe der Fehlerquadrate Prinzip der Kleinsten Quadrate: Minimiere unter Variation von a, b 2.11.04 PI Statistik, WS 2004/05 (6)

Normalgleichungen partielles Ableiten von und Nullsetzen der Ableitungen gibt die Normalgleichungen Beachte! Die Normalgleichungen sind linear in a und b! 2.11.04 PI Statistik, WS 2004/05 (6)

Kleinste-Quadrate Schätzer auch OLS-Schätzer (ordinary least squares) mit 2.11.04 PI Statistik, WS 2004/05 (6)

Interpretation von b b: mittlere Änderung von Y, wenn DX = 1 Modell: OLS-Anpassung ergibt b: mittlere Änderung von Y, wenn DX = 1 2.11.04 PI Statistik, WS 2004/05 (6)

Eigenschaften von Schätzern Wünschenswerte Eigenschaften: Erwartungstreue: minimale Varianz Konsistenz asymptotisch minimale Varianz 2.11.04 PI Statistik, WS 2004/05 (6)

OLS-Schätzer: Eigenschaften Modell: Für die OLS-Schätzer a und b gilt: 1. Sie sind erwartungstreu 2. Ihre Varianzen sind minimal in der Klasse der linearen erwartungs- treuen Schätzer [Gauss-Markov] s 2 = V (u) 2.11.04 PI Statistik, WS 2004/05 (6)

Residuen Schätzung der Störgrößenvarianz s2 Streuungszerlegung 2.11.04 PI Statistik, WS 2004/05 (6)

Streuungszerlegung TSS: Gesamtvariation (total sum of squares) ESS: (durch die Regression) erklärte Variation (explained sum of squares) RSS: residuale oder nicht erklärte Variation (residual sum of squares) 2.11.04 PI Statistik, WS 2004/05 (6)

Bestimmtheitsmaß Anteil der durch das Modell erklärten Varianz an der Gesamtvarianz der Y Es gilt 0 ≤ R2 ≤ 1 R2 = 0 bedeutet: Modell erklärt nichts, R2 ist das Quadrat der Korrelation zwischen und Y 2.11.04 PI Statistik, WS 2004/05 (6)

Adjustiertes Bestimmtheitsmaß k: Anzahl der Regressoren (k =2 bei einfacher Regression) R2 wird mit der Anzahl der Regressoren tendenziell größer Zum Vergleich von Modellen mit unterschiedlicher Anzahl von Regressoren ist vorzuziehen 2.11.04 PI Statistik, WS 2004/05 (6)

Bewertung von Modellen Kriterien zum Bewerten von Regressions- beziehungen: t-Test F-Test Durbin-Watson Test 2.11.04 PI Statistik, WS 2004/05 (6)

t-Test Bei Annahme von normalverteilten Störgrößen gilt für den OLS-Schätzer b (k: Anzahl der Regressoren): T folgt der t-Verteilung mit n-k Freiheitsgraden Zum Test der Nullhypothese Ho: b = 0: Berechnung des p-Wertes zu b Die Nullhypothese Ho: b = 0 bedeutet: Die Regressorvariable hat keinen Erklärungsbeitrag für Y Ähnlich der F –Test bei mehreren Regressoren 2.11.04 PI Statistik, WS 2004/05 (6)

Spezifikationstests auch Adäquatheitstests genannt; ein Beispiel ist der Durbin-Watson Test auf serielle Korrelation der Störgrößen 2.11.04 PI Statistik, WS 2004/05 (6)

Wohnungsmarkt Regression Preis = a + b Fläche + u Daten und Regressionsgerade 2.11.04 PI Statistik, WS 2004/05 (6)

Regression in EXCEL: Ausgabe: Zusammenfassung Regressions-Statistik Multipler Korrela-tionskoeffizient 0,826 Bestimmtheitsmaß 0,682 Adj. Bestimmt-heitsmaß 0,659 Standardfehler 128,12 Beobachtungen 16   Koeffizi enten Standard fehler t-Statistik P-Wert Schnittpunkt 97,59 82,39 1,18 0,256 X Variable 1 4,19 0,76 5,47 8,2E-05 Preis = 97.59 + 4.19 Fläche 2.11.04 PI Statistik, WS 2004/05 (6)

Wohnungsmarkt, Forts. Geschätzte Regressionsgerade Preis = 97.59 + 4.19 Fläche 2.11.04 PI Statistik, WS 2004/05 (6)

Wohnungsmarkt, Forts. Geschätzte Regressionsgerade Preis = 97.59 + 4.19 Fläche Je m2 muss man im Durchschnitt mit Kosten von 4.19 Euro rechnen; dazu kommt ein fixer Betrag von im Durchschnitt 97.59 Euro 2.11.04 PI Statistik, WS 2004/05 (6)

Wohnungsmarkt, Forts. 2.11.04 PI Statistik, WS 2004/05 (6)

Wohnungsmarkt Residuen: zur Beurteilung der Qualität der Erklärung der Daten durch die Regressionsgerade, insb. des Effekts von einzelnen Beobachtungen 2.11.04 PI Statistik, WS 2004/05 (6)

Wohnungsmarkt: Residuen 2.11.04 PI Statistik, WS 2004/05 (6)