Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Ökonometrie II Multikollinearität. 29.4.2005Multikollinearität2 Der Sachverhalt Modell Y = X + u, Ordnung von X: n x k Annahme A2: r(X) = k In der Realität:

Ähnliche Präsentationen


Präsentation zum Thema: "Ökonometrie II Multikollinearität. 29.4.2005Multikollinearität2 Der Sachverhalt Modell Y = X + u, Ordnung von X: n x k Annahme A2: r(X) = k In der Realität:"—  Präsentation transkript:

1 Ökonometrie II Multikollinearität

2 Multikollinearität2 Der Sachverhalt Modell Y = X + u, Ordnung von X: n x k Annahme A2: r(X) = k In der Realität: Spalten von X können Linearkombinationen anderer Spalten sein (Rangabfall); Determinante von XX ist Null Regressoren können hoch korreliert sein; Determinante von XX hat Wert nahe bei Null Fragestellungen: Konsequenzen von Multikollinearität Möglichkeiten zum Identifizieren von Multikollinearität Möglichkeiten, die Auswirkungen von Multikollinearität zu vermindern

3 Multikollinearität3 Ein Beispiel Rang von XX ist 2 Determinante det(XX) von XX hat Wert Null Die Inverse (XX) -1 kann ermittelt werden als (C XX : Matrix der Kofaktoren); ist nicht definiert, wenn det(XX) = 0 Achtung! Korrelation zwischen 2. und 3. Spalte von X ist 1!

4 Multikollinearität4 Konsumfunktion C = Y a + 2 Y e + 3 Y t + u C: Privater Konsum Y a : Einkommen aus unselbständiger Erwerbstätigkeit Y e : Einkommen aus Besitz und Unternehmung Y t : gesamtes Einkommen (Y t =Y e + Y a ) X hat Ordnung n x 4, aber Rang 3; XX hat Ordnung 4 x 4, aber Rang 3; die Inverse (XX) -1 existiert nicht!

5 Multikollinearität5 Korrelierte Regressoren Ordnung von X: n x k XX kann eine nahezu singuläre Matrix sein Invertieren von XX liefert sehr große Werte Wegen Var{b t } = 2 (X t X t ) -1 sind Standardabweichungen der Schätzer gross Die t-Werte sind klein, die Macht der t-Tests ist reduziert

6 Multikollinearität6 Konsumfunktion, Forts. C = + 1 Y a + 2 Y e + u OLS-Schätzer für 1, geschrieben als partieller Regressionskoeffizient: b ca : Schätzer aus einfacher Regression C = + 1 Y a + u; analog b ce, b ea r ae : Korrelationskoeffizient zwischen Y a und Y e r ae = 1; z.B. für Y e = c Y a : b ce = c b ca, b ae = c -1 b ca.e = 0/0 (unbestimmte Form) für orthogonale Regressoren gelten r ae = b ae = 0 und b ca.e = b ca

7 Multikollinearität7 Identifizierte Parameter C = + 1 Y a + 2 Y e + u Lineare Abhängigkeit: Y e = c Y a C = + ( 1 + c 2 )Y a + u = + Y a + u OLS-Schätzer für = 1 + c 2 kann problemlos berechnet werden, nicht aber für 1 und 2 Man sagt: ist identifiziert, 1 und 2 sind nicht identifiziert

8 Multikollinearität8 Konsumfunktion für Datensatz DatS01 (Konsum und Einkommen) C = YDR + 2 PC + 3 MP + u C: Privater Konsum YDR: verfügbares Einkommen der Haushalte PC: Konsumdeflator MP: privates Geldvermögen

9 Multikollinearität9 Konsumfunktion, Forts. Dependent Variable: CR Method: Least Squares Date: 04/28/05 Time: 20:26 Sample(adjusted): Included observations: 26 VariableCoefficientStd. Errort-StatisticProb. C YDR MP PC R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson stat Prob(F-statistic)

10 Multikollinearität10 Konsumfunktion, Forts. Dependent Variable: CR Method: Least Squares Date: 04/28/05 Time: 20:29 Sample(adjusted): Included observations: 26 VariableCoefficientStd. Errort-StatisticProb. C YDR PC R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson stat Prob(F-statistic)

11 Multikollinearität11 Multikollinearität Orthogonale Regressoren: für jedes Paar von Spalten x i und x j aus X gilt x i x j = 0 Unkorrelierte Regressoren: für jedes Paar von Spalten x i und x j aus X gilt r ij = 0 Unter Multikollinearität versteht man das Nicht-Zutreffen der Orthogonalität der Regressoren bzw. das Nicht-Zutreffen der Unkorreliertheit der Regressoren Konsequenzen von Multikollinearität sind umso gravierender, je stärker die Regressoren korreliert sind Häufige Ursache für Multikollinearität ist ein gemeinsamer Trend zwischen den Regressoren; Achtung bei Lagstrukturen

12 Multikollinearität12 Residuendarstellung von b i Modell Y = X + u, Ordnung von X: n x k OLS-Schätzer für i (vergl. Kap. 6.3 in Hackl, 2004): M i : residuenerzeugende Matrix für Regression von X i auf alle Spalten von X außer Regressor X i (Hilfsregression für X i ) = M i x i : Residuen der Regression von X i auf alle Spalten von X außer X i

13 Multikollinearität13 Schätzer für unkorrelierte Daten Die Matrix A = I – i(ii) -1 i, i=(1,…,1), erzeugt zentrierte X i : AX 2 enthält Abweichungen von den Mittelwerten für die Spalten X i, i=2,…,k Für orthogonale Regressoren ist X 2 AX 2 eine Diagonalmatrix i-te Komponente von b 2 : mit b i * stimmt mit dem OLS-Schätzer von i aus Y = + i X i +u überein

14 Multikollinearität14 Vergleich von b i und b i * OLS-Schätzer b i sind unverzerrt; das gilt für die Schätzer b i * im allgemeinen nicht die Varianz von b i kann sehr viel größere Werte annehmen als die Varianz von b i * der Schätzer der Varianz der Störgrößen ist unverzerrt

15 Multikollinearität15 Ein Maß für Multikollinearität mit TSS =, RSS = R i 2 ist das Bestimmtheitsmaß der Regression von X i auf die Spalten von X ohne X i (Hilfsregression) R i 2 0: b i * b i, Korr{X i,X j } 0 für alle i j; R i 2 1: RSS << TSS, d.h. X i ist lineare Funktion der Spalten von X ohne X i Multikollinearität bedeutet, dass R i 2 1 für mindestens ein i

16 Multikollinearität16 Indikatoren für Multikollinearität Bestimmtheitsmaße R i 2 der Hilfsregressionen VIF i (variance inflation factors) Determinante der Matrix der Korrelationskoeffizienten der Regressoren (ein Wert nahe bei Null zeigt Multikollinearität an) Konditionszahl (condition index, condition number) k von XX: max ( min ) ist maximaler (minimaler) Eigenwert von XX; ein großer Wert (>20) von k ist Hinweis auf Multikollinearität Effekt des Hinzufügens eines Regressors auf se(b i ): Regressor ist (a) relevant: se(b i ) wird größer; (b) multikollinear: se(b i ) wird kleiner

17 Multikollinearität17 Die Größen VIF i und R i 2 : variance inflation factor von b i Ergibt sich aus VIF i 0: R i 2 0, b i * b i, Corr{X i,X j } 0 für alle i j; kein Problem mit Multikollinearität VIF i 1 für mindestens ein i: R i 2 1, X i ist lineare Funktion der Spalten von X ohne X i ; Achtung! Multikollinearität

18 Multikollinearität18 Gründe für große Var{b i } Ist X ti 2 klein: zu wenig Beobachtungen (extrem: n < k) Ist klein: zu geringe Varianz der X ti (extrem: Var {X i } = 0) Ist : Multikollinearität (extrem: R i 2 = 1)

19 Multikollinearität19 t-Test bei Multikollinearität Der Schätzer für wird durch Multikollinearität nicht gestört; se(b i ) wird bei Multikollinearität überschätzt t-Test von H 0 : i =0; Teststatistik T = b i /se(b i ) unter H 0 gilt: T ~ t(n-k), unabhängig von Multikollinearität (kein Effekt auf Wahrscheinlichkeit des Typ I Fehlers) unter H 1 : i 0 gilt: Wahrscheinlichkeit des Typ II Fehlers wächst mit Var{b i }

20 Multikollinearität20 Maßnahmen bei Multikollinearität Vergrößern der in die Schätzung einbezogenen Datenmenge Eliminieren der für Multikollinearität verantwortlichen Regressoren Bei gemeinsamen Trends: Spezifikation des Modells in Differenzen statt in Niveauwerten Berücksichtigen von Information über Struktur der Parameter


Herunterladen ppt "Ökonometrie II Multikollinearität. 29.4.2005Multikollinearität2 Der Sachverhalt Modell Y = X + u, Ordnung von X: n x k Annahme A2: r(X) = k In der Realität:"

Ähnliche Präsentationen


Google-Anzeigen