Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Einkommensanalysen mit Paneldaten Vortrag zum STATA User-Meeting August 2003 Berlin Johannes Giesecke Humboldt Universität zu Berlin Institut für Sozialwissenschaften.

Ähnliche Präsentationen


Präsentation zum Thema: "Einkommensanalysen mit Paneldaten Vortrag zum STATA User-Meeting August 2003 Berlin Johannes Giesecke Humboldt Universität zu Berlin Institut für Sozialwissenschaften."—  Präsentation transkript:

1 Einkommensanalysen mit Paneldaten Vortrag zum STATA User-Meeting August 2003 Berlin Johannes Giesecke Humboldt Universität zu Berlin Institut für Sozialwissenschaften

2 Gliederung 1.Theoretische Vorüberlegungen zum Thema 2.Methodische Aspekte 3.Beschreibung der Daten 4.Ergebnisse/Umsetzung mit STATA 5.Fazit

3 Theorie Einkommensmodelle: –klassische Humankapitalmodelle (z.B. Mincer, Becker): Bildung und Berufserfahrung –erweiterte Modelle: angebotsseitige Charakteristika (z.B. sozio-strukturelle Merkmale der Individuen) sowie nachfrageseitige Faktoren (z.B. Branche, Betriebsgröße) bisher weniger untersucht: Effekte flexibler Beschäftigungsformen (z.B. Befristung, Teilzeit)

4 Theorie hier von Interesse: Teilzeit Einkommenseffekte von Teilzeit: – Arbeitseinkommen pro Stunde (hier: Bruttoeinkommen) Hypothesen zu Einkommenseffekten von Teilzeit: sowohl positive als auch negative Effekte zu erwarten

5 Theorie positive Einkommenseffekte zu erwarten aufgrund von: –Produktivitätssteigerung –weniger unbezahlten Überstunden, damit höherer Stundenlohn –Anreizsetzung von Seiten der Unternehmen mit Ziel der Erhöhung der Flexibilität

6 Theorie negative Einkommenseffekte zu erwarten aufgrund von: –geringerer Produktivität wegen geringerem Humankapital –karrierehemmender Wirkung von TZ –Brutto-/Nettoeffekt der progressiven Besteuerung

7 Theorie weitere Überlegungen: –Teilzeit homogenes Phänomen? reguläre Teilzeit (16-34 Stunden/Woche) marginale Teilzeit (bis zu 15 Stunden/Woche) –Effekte abhängig von Stellung im Arbeitsmarkt? z.B. Interaktion von Teilzeit mit Bildung –Selektionseffekte bestimmter Typus von ArbeitnehmerInnen in Teilzeit?

8 Methodische Aspekte Schätzungen von Einkommensgleichungen mit Querschnittsdaten (einmalig erhobene Daten) typische Probleme für OLS-Schätzung: –heteroskedastische Fehler u i –endogene unabhängige Variablen

9 Methodische Aspekte Heteroskedastizität: –inkorrekte Berechnung der Standardfehler –kann mit robuster Varianzschätzung oder GLS-Schätzung korrigiert werden Endogene UV: –verzerrte Schätzung der Koeffizienten –mögliche Lösung: IV-Schätzung (z.B. 2SLS) mit Instrumenten für diejenigen x, die mit Fehler korrelieren –Beispiel: Teilzeit korreliert mit (unbeobachteter) Motivation/Erwerbsneigung

10 Methodische Aspekte Paneldaten erlauben Schätzung des Modells: hier neu: unbeobachteter Individueneffekt c i (als zeitkonstant angenommen) damit Problem der Endogenität abgeschwächt, jedoch noch nicht vollständig beseitigt Wahl des Schätzverfahrens hängt zunächst von nur einer Frage ab: Korrelieren einige/alle der UV mit dem unbeobachteten Individueneffekt c i ?

11 Methodische Aspekte Korrelieren einige/alle der UV mit dem unbeobachteten Individueneffekt c i ? OLS-Schätzung: konsistente Schätzer für Koeffizienten, jedoch keine effiziente Schätzung random-effects-Schätzung: konsistente und effiziente Schätzung (unter bestimmten Annahmen) fixed-effects-Schätzung: konsistente und effiziente Schätzung (unter bestimmten Annahmen) first-difference-Schätzung: konsistente und effiziente Schätzung (unter bestimmten Annahmen) nein ja

12 Methodische Aspekte größter Nachteil der fe- bzw. fd-Modelle: Effekte zeitkonstanter UV können nicht geschätzt werden größter Nachteil des re-Modells: liefert verzerrte Schätzungen für Koeffizienten, wenn UV doch mit Individueneffekt korrelieren

13 Daten Sozio-ökonomisches Panel (SOEP) nur Frauen, da TZ hauptsächlich weibliches Phänomen Arbeiterinnen, Angestellte und Beamtinnen nur Westdeutsche abhängige Variable: ln(Bruttostundenlohn) unabhängige Variablen: –Humankapital: Alter und Alter² als Proxy für Berufserfahrung, Bildung, Anzahl vorheriger Arbeitslosigkeitsphasen –weitere individuelle Variablen: Familienstand, Anzahl Kinder im HH –Arbeitsplatzmerkmale: Teilzeit (regulär und marginal), Branche, Betriebsgröße, Befristung

14 Daten Bildung: –nahezu zeitkonstant für Erwerbstätige –Interaktionen mit anderen UV Modelle nach Bildungskategorien getrennt berechnen (Kategorien angelehnt an CASMIN) niedriges Ausbildungslevel mittleres berufliches Ausbildungslevel mittleres allgemeines Ausbildungslevel hohes Ausbildungslevel hier nur betrachtet: mittleres berufliches Ausbildungslevel

15 Ergebnisse Hausman-Test: signifikante Abweichung der re- von der fe-Schätzung

16 Ergebnisse/STATA Signifikanztests im fe-Modell basieren auf Annahme homoskedastischer und seriell unkorrelierter Fehler u it sinnvolle Annahme? robuste Varianzschätzungen erlauben konservative Schätzung der Standardfehler mögliches Problem dann: sehr große Standardfehler

17 Ergebnisse

18 Konsistenz der FE-Schätzer basiert auf Annahme der strikten Exogenität Annahme: idiosynkratische Fehler u it korrelieren nicht mit: vergangenen Werten der UV –nach Kontrolle der UV haben Lags der UV keinen Einfluss auf die AV –Lösungsmöglichkeit: Aufnahme der Lags in das Modell aktuellen Werten der UV –nicht berücksichtigte Variablen, Simultanität, Messfehler –Lösungsmöglichkeit: IV-Schätzung zukünftigen Werten der UV –feed-back-Modelle: u it bzw. y it hat Einfluss auf x it+s –Lösungsmöglichkeit: IV-Schätzung

19 Ergebnisse/STATA Erzeugen von Lags und Leads –per Hand: verlangt Sorgfalt (Stichwort: Lücken im Panel) sicherster Weg: erzeugen eines balanced panels (fillin) –über tsset: sicher (interne Kontrolle von Lücken) sehr bequem

20 Ergebnisse

21 Aufnahme der Lags in das Modell: Interpretation als distributed lag-Modell

22 Ergebnisse weiterhin bestehende Probleme: –feed-back: über- oder unterdurchschnittlicher Stundenlohn beeinflusst zukünftigen Vollzeit-/Teilzeit-Status –mögliche kontemporäre Korrelation von Teilzeit und u it, z.B. aufgrund nicht beobachteter (zeitlich variabler) Effekte IV-Schätzungen als mögliche Lösung hier jedoch problematisch, da –endogene UV aus zwei Dummyvariablen besteht –auch die Lags instrumentiert werden müssen –gute, möglichst exklusive Instrumente rar sind

23 Ergebnisse Probleme durch Selektion? –nur dann problematisch, wenn für Selektion verantwortliche Variablen mit u it bzw. y it korrelieren –Panelmodelle kontrollieren bereits nach unbeobachteten zeitkonstanten Individueneffekte –dennoch ist Selektionsproblematik relevant Welche Selektion? –Selektion in AV –Missing data in AV und/oder UV –Panelausfälle

24 Ergebnisse hier von Interesse: erzeugt das Hinzunehmen der Lags ein Selektionsproblem? mögliche Tests: –Unterschiede in Koeffizienten im restringierten und unrestringierten Sample –Indikatorvariable, ob vorangegangene Beobachtung mit im Modell ist oder nicht (dabei Verlust einer Beobachtung pro Individuum)

25 Ergebnisse Hausman-Test: signifikante Abweichungen

26 Ergebnisse

27 mögliche Korrektur der Selektionsverzerrung: Verfahren nach Wooldridge ähnelt der Heckman-Korrektur, Schätzung eines Probit- Modells für Inklusionswahrscheinlichkeit deshalb auch hier: zusätzliche Variablen für Probit- Modell benötigt, die nicht in Einkommensgleichung sind Kandidaten hier: Familienstand und Anzahl der Kinder im HH (beide Effekte nicht signifikant)

28 Ergebnisse

29 Fazit inhaltlich: –Beschäftigungsform der Teilzeit hat Effekt auf Arbeitseinkommen –positiver Anfangseffekt wird durch negative Karriereeffekte konterkariert –deutliche Unterschiede zwischen regulärer und marginaler Teilzeit –Prozesse der Selbstselektion in Teilzeit zu erkennen, am deutlichsten für marginale Teilzeit

30 Fazit methodisch: –Panelmodelle mit deutlichen Vorteilen gegenüber Analyseverfahren für Querschnittsdaten Kontrolle von unbeobachteter Heterogenität (wichtig für konsistente Schätzung der Parameter) flexiblere Modellgestaltung (z.B. Testen des Einflusses von Lags) –jedoch: sorgfältige Überprüfung der Annahme unbedingt notwendig –Selektionseffekte können wichtig werden (hier z.B. nicht behandelt: Selektion aufgrund von Panelausfällen)

31 Fazit STATA: –Grundlagenbefehle vorhanden, werden erkennbar ausgebaut (siehe STATA 8) –für weitergehende Modelle: eigenes Programmieren notwendig –Tests auf Annahmeverletzungen sollten verstärkt implementiert werden (wie etwa Diagnosemöglichkeiten für OLS)


Herunterladen ppt "Einkommensanalysen mit Paneldaten Vortrag zum STATA User-Meeting August 2003 Berlin Johannes Giesecke Humboldt Universität zu Berlin Institut für Sozialwissenschaften."

Ähnliche Präsentationen


Google-Anzeigen