Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Prof. Dr. Ulrich van Suntum Empirische Methoden der Regionalökonomik SS 2010 2. Einfache Regressionsanalyse.

Ähnliche Präsentationen


Präsentation zum Thema: "Prof. Dr. Ulrich van Suntum Empirische Methoden der Regionalökonomik SS 2010 2. Einfache Regressionsanalyse."—  Präsentation transkript:

1 Prof. Dr. Ulrich van Suntum Empirische Methoden der Regionalökonomik SS Einfache Regressionsanalyse

2 y(x) x α 2. Einfache Regressionsanalyse (Vgl. K. Backhaus u.a., Multivariate Analysemethoden. Eine anwendungsorientierte Einführung, Berlin, 10. Aufl. 2003, S. 45 ff.; sowie Stock/ Watson, Introduction to Econometrics, Boston u.a., 1st ed. 2003, S. 89 ff)) Ziel: Empirische Bestimmung einfacher funktionaler Zusammenhänge Linearer Ansatz: Kleinste-Quadrate-Verfahren => Minimierung von Schätzfehlern 2 © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse

3 3 Die Residuen u i geben Differenz zwischen Schätzwerten ŷ i und empirisch beobachteten Werten y an Minimiert wird die Summe der quadrierten Residuen u i (Kleinste-Quadrate- Schätzung bzw. ordinary least square = OLS-Ansatz) Die y i bzw u i müssen voneinander unabhängig sein (d.h. keine Autokorrelation => Durbin-Watson-Test) die u i müssen normalverteilt sein es muss ein linearer Zusammenhang vorliegen © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse y(x) x

4 4 Bestimmtheitsmaß R 2 (in Einfachregressionen): Quadrat des Pearson´schen Korrelationskoeffizienten R gibt an, inwieweit die Varianz von y durch die Varianz von x erklärbar liegt zwischen 0 und 1 (=100%) Definition: Kritik an R 2 : sagt nichts über Signifikanz (Zusammenhang kann zufällig sein) ist problematisch bei zeitabhängigen Variablen (Trends) steigt tendenziell mit Anzahl der Stichprobenwerte © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse

5 5 Tests der Zuverlässigkeit I: F-Test (Fisher-Test): prüft, ob R 2 zufällig ist Nullhypothese: es besteht kein linearer Zusammenhang y(x) in der Grundgesamtheit Definition: n = Zahl der Probanden J = Zahl der Regressoren (hier nur x => J = 1) n-J-1 = Zahl der Freiheitsgrade kritischer F-Wert ergibt sich aus verlangtem Signifikanzniveau F emp. > F krit. => Ablehnung der Nullhypothese => R 2 signifikant © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse

6 6 Tests der Zuverlässigkeit II: t-Test: prüft, ob Regressoren signifikant sind Nullhypothese: es besteht kein linearer Zusammenhang y(x) in der Grundgesamtheit Definition: b = Koeffizient von Regressor j (hier Koeffizient von x) s j = Standardabweichung von Regressor j kritischer t-Wert ergibt sich aus verlangtem Signifikanzniveau t emp > t krit => Ablehnung der Nullhypothese => b j (hier: x) signifikant Faustregel: t-Wert > 3 => Regressor ist hinreichend signifikant exakter: p-Wert = (1-Signifikanzniveau des betreffenden Koeffizienten) © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse

7 7 (y max ) Wenn x der Rang einer Stadt innerhalb einer Region nach der Größe ist, dann entspricht ihre Einwohnerzahl y (etwa) dem X-ten Teil der Einwohnerzahl der größten Stadt y max. Im Idealfall: Beispiel: Überprüfung der sogen. Rank Size Rule: © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse Rang (x)StadtEinwohner (y) 1Metropolis Gerngroß Provinzia Biederhausen Unterkirch Kuhdorf10.000

8 Strenge Form der Rank-Size-Rule (F. Auerbach 1913): d.h. für jede Stadt eines Landes gilt Bevölkerung (y) · Rang (x) = Bevölkerung der größten Stadt (y max ) Empirische Evidenz damals für USA, Deutschland, Österreich, z.B.: 8 © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse (Quelle: Matznetter, StadtMio. Einwohner Wien 1,7 Budapest 0,85 Prag 0,57 Lemberg 0,425

9 Allgemeinere Form der Rank-Size-Rule (Lotka 1925): Vergleich mit strenger Rank-Size-Rule: Bei b > 1 nimmt die EW-Zahl stärker ab Bei b < 1 nimmt die EW-Zahl schwächer ab Bei b = 0 sind alle Städte gleich groß Bei b => oo sind alle EW des Landes in einer Stadt Für die USA wird b mit 0,93 angegeben 9 © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse

10 10 Linearer Schätzansatz erfordert Logarithmierung © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse x yln(x)ln(y) Logarithmierte Darstellung des Idealfalls: Ergebnis: ln(y max ) = 11 b = -1 R² = 1

11 11 Anmerkung: Dies ist ein so genanntes: log-log-Modell: => Eine 1% Veränderung in x, ist verbunden mit einer b% Veränderung in y, so dass b die Elastizität von y zu x ist Es gibt aber noch zwei Alternativen: log-lin-Modell: => eine Veränderung in x um 1 Einheit (x = 1), ist verbunden mit einer 100b% Veränderung in y lin-log-Modell: => eine 1% Veränderung in x, ist verbunden mit einer Veränderung in y von 0,01b (vgl. Stock/Watson (2003), S. 215) © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse

12 12 Empirische Prüfung für den Regierungsbezirk Düsseldorf Ergebnis: b = -0,72, R 2 = 0,88 © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse StadtRang (x)EW in (y) Essen1627,3 Düsseldorf2578,1 Dusiburg3539,1 Wuppertal4388,1 Mönchengladbach5265,1 Krefeld6248,4 Oberhausen7226,0 Mülheim8177,0 Solingen9167,1 Remscheid10124,1

13 13 Empirische Prüfung für den Kreis Neuss Ergebnis: b = -1,01; R 2 = 0,87 © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse StadtRang (x)EW in (y) Neuss1149,0 Grevenbroich262,9 Dormagen359,6 Meerbusch453,3 Kaarst540,9 Korschenbroich630,7 Juechen721,9 Rommerskirchen811,9

14 14 © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse Rank Size Rule in NRW? Essen Düsseldorf Duisburg Wuppertal Mönchengladbach Krefeld Oberhausen Mülheim Solingen Remscheid Neuss Grevenbroich Dormagen Meerbusch Kaarst Korschenbroich Juechen Rommerskirchen RB Düsseldorf (b=0,72; R² = 0,88), Kreis Neuss (b= 1,01; R² = 0,87)

15 Ergebnis der empirischen Prüfung Im Regierungsbezirk Düsseldorf (b = -0,72) sind Stadtgrößen homogener als im Kreis Neuss (b = -1,01) Im Kreis Neuss ist die Rank Size Rule insgesamt annähernd erfüllt, aber Zusammenhang nicht perfekt (b nahe –1, mit einer geringeren erklärten Streuung => R 2 = 0,87 ) Kritik: Verwaltungsgrenzen willkürlich, Fallzahlen gering, gleich große Städte stören Zusammenhang 15 © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse

16 2. Anwendungsversuch: Kreis Coesfeld 16 © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse

17 17 Idee: Bildung von Gemeindegrößenklassen: © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse StadtRang (x)Einwohner (y) Dülmen Coesfeld Lüdinghausen Nottuln/Senden Ascheberg Olfen/Havixbeck/Billerbeck Nordkirchen/Rosendahl

18 18 Test auf Gültigkeit der Rank-Size-Rule für die 7 Größenklassen: a) Regression mit Originalwerten: Ergebnis: a = b = => y max = a + b = R 2 = 0,90 (Achtung: a steht hier nicht für Y max, sondern für x = 0, d.h. Y max = a + b·1) © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse StadtEinwohner (y) Schätzwert ( ŷ ) Dülmen Coesfeld Lüdinghausen Nottuln/Senden Ascheberg Olfen/Havixbeck/Billerbeck Nordkirchen/Rosendahl

19 19 Grafik/Bewertung: Ergebnis schon nicht schlecht aber offensichtlich keine lineare Beziehung (Residuen systematisch verzerrt) vielleicht geht es mit Logarithmierung ja noch besser... © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse Rank Size Rule: lineare Schätzung Einwohner (y) Schätzwert (ŷ)

20 20 b) 2. Versuch: Regression mit logarithmierten Werten Ergebnis: ln(Y max ) = 10,92 b = - 0,80 R 2 = 0,96 © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse Stadtln(x)ln(y)ln(ŷ)ŷ Dülmen Coesfeld Lüdinghausen Nottuln/Senden Ascheberg Olfen/Havixbeck/Billerbeck Nordkirchen/Rosendahl

21 21 Bestimmtheitsmaß höher als bei Schätzung mit Originalwerten Residuen sind gleichmäßiger verteilt Grafik/Bewertung: © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse Rank Size Rule: logarithmierte Darstellung Einwohner (lny) Schätzwert (lnŷ)

22 22 3. Versuch: Logarithmierung mit quadratischem Regressor Ergebnis: ln(Y max ) = 10,68 b = - 0,40 R 2 = 0,98 © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse Stadtln(x)²ln(y)ln(ŷ)ŷ Dülmen Coesfeld Lüdinghausen Nottuln/Senden Ascheberg Olfen/Havixbeck/Billerbeck Nordkirchen/Rosendahl

23 23 Grafik/Bewertung: Ergebnis nochmals verbessert man kann auch andere Exponenten als Quadrat versuchen der Phantasie sind keine Grenzen gesetzt, aber besser wäre eine Theorie... © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse Logarithmierung Darstellung mit quadratischem Regressor Schätzwert (lnŷ) Einwohner (lny)

24 24 Beispiel aus der Demografie: zeitliche Trendschätzung E = – 5216 t R 2 = 0,83 Pro Jahr ca Ehen weniger als im Vorjahr aber: andere Faktoren mit einbeziehen (z.B. Bevölkerung im heiratsfähigen Alter, wilde Ehen, Konfessionen, Wirtschaftslage) © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse

25 25 Beispiel aus der Demografie II: Geburtenzahl G = – 8874 tR 2 = 0,57 Zusammenhang insgesamt schwächer als bei Ehen Seit den 80er Jahren aber ähnlich eng Andere Einflußfaktoren: Zahl der potentiellen Mütter, Konfession und wirtschaftliche Lage, politische Anreize, wirtschaftliche Lage © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse

26 26 Zusammenhang Eheschließungen und Geburten G = ,76 ER 2 = 0,74 pro zusätzlicher Eheschließung knapp 2 Kinder mehr zu prüfen: gilt das auch für nicht-eheliche Gemeinschaften? evntl. reverse causality: Erst das Kind, dann die Ehe © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse

27 27 Beispiel regionale Immobilienprognose I (InSiWo 2006, auf Basis von 97 ROR) © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse

28 28 Beispiel regionale Immobilienprognose II (InSiWo 2006, auf Basis von 97 ROR) © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse

29 29 Beispiel regionale Immobilienprognose III (InSiWo 2006, auf Basis von 97 ROR) Schlechte Korrelationen evtl. durch Eliminierung von Ausreißern verbessern © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse

30 30 Beispiel regionale Immobilienprognose IV (InSiWo 2006, auf Basis von 97 ROR) Prüfen, ob Bevölkerungszahl insgesamt genauso gut (oder sogar besser!) funktioniert © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse

31 31 W = 0, ,29 * B R 2 = 0,36 Empirischer Zusammenhang Beschäftigungszuwachs und Wanderungssaldo (97 ROR, Durchschnittsdaten ) Beispiel für zirkuläre Kausalität: Bevölkerungs- und Arbeitsmarktentwicklung © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse

32 Empirie ohne Theorie? Problem Scheinkorrelationen: Geburtenrate ist mit Zahl der Störche korreliert (beide sinken) Weltbevölkerung korreliert mit Alter der englischen Königin (beide steigen) Welttemperatur steigt mit abnehmender Zahl der Piraten (siehe Abb.) cum hoc non est propter hoc 32 © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse

33 33 Vorsicht vor Scheinkorrelationen! XY Z Beispiel A: Zahl der Kinder (Y) sinkt regional mit der Zahl der Störche (X) Mögliche Erklärung: Mit steigendem Urbanisierungsgrad (Z) sinkt sowohl Kinder- wie auch Storchenzahl Beispiel B: In CDU-regierten Kommunen (X) gibt es weniger Kriminalität (Y) Mögliche Erklärung: CDU regiert vor allem im ländlichen Raum (Z), dort ist die Kriminalität geringer (auch bei SPD-Regierung) Evtl. Z als Kontrollvariable in die Regression aufnehmen © U. van SuntumEmpirische Methoden der Regionalökonomik: 2. Einfach Regressionsanalyse


Herunterladen ppt "Prof. Dr. Ulrich van Suntum Empirische Methoden der Regionalökonomik SS 2010 2. Einfache Regressionsanalyse."

Ähnliche Präsentationen


Google-Anzeigen