Kapitel 10 Multikollinearität

Slides:

Advertisements

Ähnliche Präsentationen

Modellprämissen der linearen Regression

Advertisements

Kovarianz, Korrelation, (lineare) Regression Jonathan Harrington BITTE NOCH EINMAL dframes.zip (Webseite 4.1) herunterladen und in pfad auspacken.

Mehrfachregressionen

Quantitative Methoden I

K. Desch - Statistik und Datenanalyse SS05

Tutorium Aufgabe 1 Informationen in Designmatrix in: - Darin sind die Prädiktoren enthalten - Aber sagt uns noch mehr! Untersuchungsdesign darin.

Vorlesung: ANOVA I

Eigenschaften der OLS-Schätzer

Einfache Regressionsgleichung

Multikollinearität Wann spricht man von Multikollinearität?

Wiederholung: Einfache Regressionsgleichung

Matrix-Algebra Grundlagen 1. Matrizen und Vektoren

Kapitel 9 Analyse der Modellstruktur

Kapitel 15 Instrumentvariablen- Schätzung

Ausgleichungsrechnung I

Kapitel 7 Lineare Restriktionen

Logistische Regression

Statistik: Mehr zur Regression.

Kapitel 13 Zeitreihen und Zeitreihen-Modelle

Kapitel 15 Instrumentvariablen- Schätzung

Kapitel 12 Autokorrelation in den Residuen

Kapitel 10 Multikollinearität

Modul Statistische Datenanalyse

Kapitel 9 Analyse der Modellstruktur Hackl, Einführung in die Ökonometrie 2 Rekursive OLS-Schätzung Spezifiziertes Modell: y = X + u y, u:

Kapitel 6 Variablenauswahl und Missspezifikation

Kapitel 2 Das klassische Regressionsmodell

Lineare Restriktionen

Ökonometrie II Multikollinearität.

Kapitel 18 Dynamische Modelle: Schätzen der Parameter

Ökonometrie I Analyse der Modellstruktur Ökonometrie I2 Rekursive OLS-Schätzung Spezifiziertes Modell: y = X + u y, u: n-Vektoren; X: Ordnung.

Analyse der Modellstruktur

Peter Hackl Sprechstunde: Fr, 10:30-11:30 Tel.:

Kapitel 1 Der Begriff „Ökonometrie“

Missspezifikation: Konsequenzen und Tests

Kapitel 5 Statistische Bewertung von Regressionsbezie-hungen

Kapitel 19 Kointegration

Kapitel 3 Lineare Regression: Schätzverfahren

Kapitel 21 Mehrgleichungs-Modelle: Schätzverfahren

Kapitel 16 Ökonometrische Modelle

Kapitel 20 Mehrgleichungs-Modelle: Konzepte

Kapitel 14 Trends und Unit-root-Tests

Kapitel 13 Zeitreihen und Zeitreihen-Modelle

Ökonometrie I Variablenauswahl.

Mehr zum Testen von Hypothesen

Bewertung von Regressionsbeziehungen

OLS-Schätzer und seine Eigenschaften

Kapitel 11 Heteroskedastizität

Einfache und multiple Regression

Prognose und Prognosequalität

Ökonometrie I Peter Hackl Sprechstunde: Fr, 10:45-11:45 Tel.: Fr, 9:00-10:30.

Annahmen des lineare Regressionsmodells

Kapitel 4 Annahmen des linearen Regressionsmodells

Kapitel 8 Prognose und Prognosequalität

Ökonometrie I Modellvergleich (Übersicht) Ökonometrie I2 Vergleich von Modellen Fragestellungen für Modellvergleich 1.Fehlende Regressoren.

Kapitel 18 Dynamische Modelle: Schätzen der Parameter.

Kapitel 20 Mehrgleichungs- Modelle: Konzepte

Kapitel 21 Mehrgleichungs- Modelle: Schätzverfahren.

STATISIK LV Nr.: 0021 WS 2005/ November 2005.

Kapitel 9 Analyse der Modellstruktur

Kapitel 11 Heteroskedastizität

Kapitel 14 Trends und Unit-root-Tests

Kapitel 12 Autokorrelation

1 STATISIK LV Nr.: 0021 WS 2005/ November 2005.

STATISIK LV Nr.: 1852 WS 2005/ Jänner 2006.

setzt Linearität des Zusammenhangs voraus

 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.

Independent Component Analysis: Analyse natürlicher Bilder Friedrich Rau.

Präsentation transkript:

Kapitel 10 Multikollinearität

Hackl, Einführung in die Ökonometrie Der Sachverhalt Modell y = Xb + u, Ordnung von X: nxk Annahme A2: r(X) = k In der Realität: Spalten von X können Linearkombinationen anderer Spalten sein („Rangabfall“); Determinante von X‘X ist Null Regressoren können hoch korreliert sein; Determinante von X‘X hat Wert nahe bei Null Fragestellungen: Konsequenzen von Multikollinearität Möglichkeiten zum Identifizieren von Multikollinearität Möglichkeiten, die Auswirkungen von Multikollinearität zu vermindern Hackl, Einführung in die Ökonometrie

Hackl, Einführung in die Ökonometrie Ein Beispiel Rang von X‘X ist 2 Determinante det(X‘X) von X‘X hat Wert Null Die Inverse (X‘X)-1 kann ermittelt werden als (CX‘X: Matrix der Kofaktoren); ist nicht definiert, wenn det(X‘X) = 0 Achtung! Korrelation zwischen 2. und 3. Spalte von X ist 1! Hackl, Einführung in die Ökonometrie

Hackl, Einführung in die Ökonometrie Konsumfunktion C = b0 + b1 Ya + b2 Ye + b3 Yt + u C: Privater Konsum Ya: Einkommen aus unselbständiger Erwerbstätigkeit Ye: Einkommen aus Besitz und Unternehmung Yt: gesamtes Einkommen (Yt =Ye + Ya) X hat Ordnung nx4, aber Rang 3; X‘X hat Ordnung 4x4, aber Rang 3; die Inverse (X‘X)-1 existiert nicht! Hackl, Einführung in die Ökonometrie

Korrelierte Regressoren Ordnung von X: nxk X‘X kann eine nahezu singuläre Matrix sein Invertieren von X‘X liefert sehr große Werte Wegen Var{bt} = s2 (Xt’Xt)-1 sind Standardabweichungen der Schätzer gross Die t-Werte sind klein, die Macht der t-Tests ist reduziert Hackl, Einführung in die Ökonometrie

Hackl, Einführung in die Ökonometrie Konsumfunktion, Forts. C = a + b1 Ya + b2 Ye + u OLS-Schätzer für b1, geschrieben als partieller Regressionskoeffizient: bca: Schätzer aus einfacher Regression C = a + b1 Ya + u; analog bce, bea rae: Korrelationskoeffizient zwischen Ya und Ye rae = 1; z.B. für Ye = c Ya: bce = c bca, bae = c-1 bca.e = 0/0 (unbestimmte Form) für orthogonale Regressoren gelten rae = bae = 0 und bca.e = bca Hackl, Einführung in die Ökonometrie

Identifizierte Parameter C = a + b1 Ya + b2 Ye + u Lineare Abhängigkeit: Ye = c Ya C = a + (b1 + cb2 )Ya + u = a + g Ya + u OLS-Schätzer für g = b1 + cb2 kann problemlos berechnet werden, nicht aber für b1 und b2 Man sagt: g ist identifiziert, b1 und b2 sind nicht identifiziert Hackl, Einführung in die Ökonometrie

Hackl, Einführung in die Ökonometrie Konsumfunktion für 1976-2001 Datensatz DatS01 (Konsum und Einkommen) C = b0 + b1 YDR + b2 PC + b3 MP + u C: Privater Konsum YDR: verfügbares Einkommen der Haushalte PC: Konsumdeflator MP: privates Geldvermögen Hackl, Einführung in die Ökonometrie

Hackl, Einführung in die Ökonometrie Konsumfunktion, Forts. Dependent Variable: CR Method: Least Squares Date: 04/28/05 Time: 20:26 Sample(adjusted): 1976 2001 Included observations: 26 Variable Coefficient Std. Error t-Statistic Prob. C 2310.739 298.3735 7.744451 0.0000 YDR 0.393648 0.061877 6.361820 0.0000 MP 0.088677 0.007291 12.16215 0.0000 PC 1.283074 0.437438 2.937727 0.0076 R-squared 0.997563 Mean dependent var 8365.077 Adjusted R-squared 0.997230 S.D. dependent var 1590.255 S.E. of regression 83.69166 Akaike info criterion 11.83279 Sum squared resid 154094.5 Schwarz criterion 12.02635 Log likelihood -149.8263 F-statistic 3001.430 Durbin-Watson stat 1.539090 Prob(F-statistic) 0.000000 Hackl, Einführung in die Ökonometrie

Hackl, Einführung in die Ökonometrie Konsumfunktion, Forts. Dependent Variable: CR Method: Least Squares Date: 04/28/05 Time: 20:29 Sample(adjusted): 1976 2001 Included observations: 26 Variable Coefficient Std. Error t-Statistic Prob. C -766.3772 429.8791 -1.782774 0.0878 YDR 0.806083 0.140676 5.730050 0.0000 PC 1.835451 1.182595 1.552054 0.1343 R-squared 0.981175 Mean dependent var 8365.077 Adjusted R-squared 0.979538 S.D. dependent var 1590.255 S.E. of regression 227.4772 Akaike info criterion 13.80014 Sum squared resid 1190155. Schwarz criterion 13.94531 Log likelihood -176.4019 F-statistic 599.3971 Durbin-Watson stat 0.348434 Prob(F-statistic) 0.000000 Hackl, Einführung in die Ökonometrie

Hackl, Einführung in die Ökonometrie Multikollinearität Orthogonale Regressoren: für jedes Paar von Spalten xi und xj aus X gilt xi‘xj = 0 Unkorrelierte Regressoren: für jedes Paar von Spalten xi und xj aus X gilt rij = 0 Unter Multikollinearität versteht man das Nicht-Zutreffen der Orthogonalität der Regressoren bzw. das Nicht-Zutreffen der Unkorreliertheit der Regressoren Konsequenzen von Multikollinearität sind umso gravierender, je stärker die Regressoren korreliert sind Häufige Ursache für Multikollinearität ist ein gemeinsamer Trend zwischen den Regressoren; Achtung bei Lagstrukturen Hackl, Einführung in die Ökonometrie

Residuendarstellung von bi Modell y = Xb + u, Ordnung von X: nxk OLS-Schätzer für bi (vergl. Kap. 6.3 in Hackl, 2004): Mi: residuenerzeugende Matrix für Regression von Xi auf alle Spalten von X außer Regressor Xi („Hilfsregression für Xi“) = Mixi: Residuen der Regression von Xi auf alle Spalten von X außer Xi Hackl, Einführung in die Ökonometrie

Schätzer für unkorrelierte Daten Die Matrix A = I – i(i‘i)-1i‘, i=(1,…,1)‘, erzeugt zentrierte Xi: AX2 enthält Abweichungen von den Mittelwerten für die Spalten Xi, i=2,…,k Für orthogonale Regressoren ist X2‘AX2 eine Diagonalmatrix i-te Komponente von b2: mit bi* stimmt mit dem OLS-Schätzer von bi aus Y = a+biXi+u überein Hackl, Einführung in die Ökonometrie

Vergleich von bi und bi* OLS-Schätzer bi sind unverzerrt; das gilt für die Schätzer bi* im allgemeinen nicht die Varianz von bi kann sehr viel größere Werte annehmen als die Varianz von bi* der Schätzer der Varianz der Störgrößen ist unverzerrt Hackl, Einführung in die Ökonometrie

Ein Maß für Multikollinearität mit TSS = , RSS = Ri2 ist das Bestimmtheitsmaß der Regression von Xi auf die Spalten von X ohne Xi („Hilfsregression“) Ri2 ≈ 0: bi* ≈ bi, Korr{Xi,Xj} ≈ 0 für alle i ≠ j; Ri2 ≈ 1: RSS << TSS, d.h. Xi ist lineare Funktion der Spalten von X ohne Xi Multikollinearität bedeutet, dass Ri2 ≈ 1 für mindestens ein i Hackl, Einführung in die Ökonometrie

Indikatoren für Multikollinearität Bestimmtheitsmaße Ri2 der Hilfsregressionen VIFi (variance inflation factors) Determinante der Matrix der Korrelationskoeffizienten der Regressoren (ein Wert nahe bei Null zeigt Multikollinearität an) Konditionszahl (condition index, condition number) k von X‘X: lmax (lmin) ist maximaler (minimaler) Eigenwert von X‘X; ein großer Wert (>20) von k ist Hinweis auf Multikollinearität Effekt des Hinzufügens eines Regressors auf se(bi): Regressor ist (a) relevant: se(bi) wird größer; (b) multikollinear: se(bi) wird kleiner Hackl, Einführung in die Ökonometrie

Hackl, Einführung in die Ökonometrie Die Größen VIFi und Ri2 : variance inflation factor von bi Ergibt sich aus VIFi ≈ 1: Ri2 ≈ 0, bi* ≈ bi, Corr{Xi,Xj} ≈ 0 für alle i ≠ j; kein Problem mit Multikollinearität VIFi sehr groß für mindestens ein i: Ri2 ≈ 1, Xi ist lineare Funktion der Spalten von X ohne Xi; Achtung! Multikollinearität Hackl, Einführung in die Ökonometrie

Gründe für große Var{bi} Ist SXti2 klein: zu wenig Beobachtungen (extrem: n < k) Ist klein: zu geringe Varianz der Xti (extrem: Var {Xi} = 0) Ist : Multikollinearität (extrem: Ri2 = 1) Hackl, Einführung in die Ökonometrie

t-Test bei Multikollinearität Der Schätzer für s wird durch Multikollinearität nicht gestört; se(bi) wird bei Multikollinearität überschätzt t-Test von H0: bi=0; Teststatistik T = bi/se(bi) unter H0 gilt: T ~ t(n-k), unabhängig von Multikollinearität (kein Effekt auf Wahrscheinlichkeit des Typ I Fehlers) unter H1: bi ≠ 0 gilt: Wahrscheinlichkeit des Typ II Fehlers wächst mit Var{bi} Hackl, Einführung in die Ökonometrie

Maßnahmen bei Multikollinearität Vergrößern der in die Schätzung einbezogenen Datenmenge Eliminieren der für Multikollinearität verantwortlichen Regressoren Bei gemeinsamen Trends: Spezifikation des Modells in Differenzen statt in Niveauwerten Berücksichtigen von Information über Struktur der Parameter Hackl, Einführung in die Ökonometrie