Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Einkommensanalysen mit Paneldaten

Ähnliche Präsentationen


Präsentation zum Thema: "Einkommensanalysen mit Paneldaten"—  Präsentation transkript:

1 Einkommensanalysen mit Paneldaten
Vortrag zum STATA User-Meeting August 2003 Berlin Johannes Giesecke Humboldt Universität zu Berlin Institut für Sozialwissenschaften

2 Gliederung Theoretische Vorüberlegungen zum Thema Methodische Aspekte
Beschreibung der Daten Ergebnisse/Umsetzung mit STATA Fazit

3 Theorie Einkommensmodelle:
klassische Humankapitalmodelle (z.B. Mincer, Becker): Bildung und Berufserfahrung erweiterte Modelle: angebotsseitige Charakteristika (z.B. sozio-strukturelle Merkmale der Individuen) sowie nachfrageseitige Faktoren (z.B. Branche, Betriebsgröße) bisher weniger untersucht: Effekte „flexibler“ Beschäftigungsformen (z.B. Befristung, Teilzeit)

4 Theorie hier von Interesse: Teilzeit Einkommenseffekte von Teilzeit:
Arbeitseinkommen pro Stunde (hier: Bruttoeinkommen) Hypothesen zu Einkommenseffekten von Teilzeit: sowohl positive als auch negative Effekte zu erwarten

5 Theorie positive Einkommenseffekte zu erwarten aufgrund von:
Produktivitätssteigerung weniger unbezahlten Überstunden, damit höherer Stundenlohn Anreizsetzung von Seiten der Unternehmen mit Ziel der Erhöhung der Flexibilität

6 Theorie negative Einkommenseffekte zu erwarten aufgrund von:
geringerer Produktivität wegen geringerem Humankapital karrierehemmender Wirkung von TZ Brutto-/Nettoeffekt der progressiven Besteuerung

7 Theorie weitere Überlegungen: Teilzeit homogenes Phänomen?
reguläre Teilzeit (16-34 Stunden/Woche) marginale Teilzeit (bis zu 15 Stunden/Woche) Effekte abhängig von Stellung im Arbeitsmarkt? z.B. Interaktion von Teilzeit mit Bildung Selektionseffekte bestimmter Typus von ArbeitnehmerInnen in Teilzeit?

8 Methodische Aspekte Schätzungen von Einkommensgleichungen mit Querschnittsdaten (einmalig erhobene Daten) typische Probleme für OLS-Schätzung: heteroskedastische Fehler ui endogene unabhängige Variablen

9 Methodische Aspekte Heteroskedastizität: Endogene UV:
inkorrekte Berechnung der Standardfehler kann mit robuster Varianzschätzung oder GLS-Schätzung korrigiert werden Endogene UV: verzerrte Schätzung der Koeffizienten mögliche Lösung: IV-Schätzung (z.B. 2SLS) mit Instrumenten für diejenigen x, die mit Fehler korrelieren Beispiel: Teilzeit korreliert mit (unbeobachteter) Motivation/Erwerbsneigung

10 Methodische Aspekte Paneldaten erlauben Schätzung des Modells:
hier neu: unbeobachteter Individueneffekt ci (als zeitkonstant angenommen) damit Problem der Endogenität abgeschwächt, jedoch noch nicht vollständig beseitigt Wahl des Schätzverfahrens hängt zunächst von nur einer Frage ab: Korrelieren einige/alle der UV mit dem unbeobachteten Individueneffekt ci ?

11 Methodische Aspekte Korrelieren einige/alle der UV mit dem unbeobachteten Individueneffekt ci ? nein ja OLS-Schätzung: konsistente Schätzer für Koeffizienten, jedoch keine effiziente Schätzung random-effects-Schätzung: konsistente und effiziente Schätzung (unter bestimmten Annahmen) fixed-effects-Schätzung: konsistente und effiziente Schätzung (unter bestimmten Annahmen) first-difference-Schätzung: konsistente und effiziente Schätzung (unter bestimmten Annahmen)

12 Methodische Aspekte größter Nachteil der fe- bzw. fd-Modelle: Effekte zeitkonstanter UV können nicht geschätzt werden größter Nachteil des re-Modells: liefert verzerrte Schätzungen für Koeffizienten, wenn UV doch mit Individueneffekt korrelieren

13 Daten Sozio-ökonomisches Panel (SOEP) 1985-2001
nur Frauen, da TZ hauptsächlich weibliches Phänomen Arbeiterinnen, Angestellte und Beamtinnen nur Westdeutsche abhängige Variable: ln(Bruttostundenlohn) unabhängige Variablen: Humankapital: Alter und Alter² als Proxy für Berufserfahrung, Bildung, Anzahl vorheriger Arbeitslosigkeitsphasen weitere individuelle Variablen: Familienstand, Anzahl Kinder im HH Arbeitsplatzmerkmale: Teilzeit (regulär und marginal), Branche, Betriebsgröße, Befristung

14 Daten Bildung: nahezu zeitkonstant für Erwerbstätige Interaktionen mit anderen UV Modelle nach Bildungskategorien getrennt berechnen (Kategorien angelehnt an CASMIN) niedriges Ausbildungslevel mittleres berufliches Ausbildungslevel mittleres allgemeines Ausbildungslevel hohes Ausbildungslevel hier nur betrachtet: mittleres berufliches Ausbildungslevel

15 Ergebnisse Hausman-Test: signifikante Abweichung der re- von der fe-Schätzung

16 Ergebnisse/STATA Signifikanztests im fe-Modell basieren auf Annahme homoskedastischer und seriell unkorrelierter Fehler uit sinnvolle Annahme? robuste Varianzschätzungen erlauben „konservative“ Schätzung der Standardfehler mögliches Problem dann: sehr große Standardfehler

17 Ergebnisse

18 Ergebnisse Konsistenz der FE-Schätzer basiert auf Annahme der strikten Exogenität Annahme: idiosynkratische Fehler uit korrelieren nicht mit: vergangenen Werten der UV nach Kontrolle der UV haben Lags der UV keinen Einfluss auf die AV Lösungsmöglichkeit: Aufnahme der Lags in das Modell aktuellen Werten der UV nicht berücksichtigte Variablen, Simultanität, Messfehler Lösungsmöglichkeit: IV-Schätzung zukünftigen Werten der UV feed-back-Modelle: uit bzw. yit hat Einfluss auf xit+s

19 Ergebnisse/STATA Erzeugen von Lags und Leads per Hand: über tsset:
verlangt Sorgfalt (Stichwort: Lücken im Panel) sicherster Weg: erzeugen eines „balanced panels“ (fillin) über tsset: sicher (interne Kontrolle von Lücken) sehr bequem

20 Ergebnisse

21 Ergebnisse Aufnahme der Lags in das Modell: Interpretation als distributed lag-Modell

22 Ergebnisse weiterhin bestehende Probleme:
feed-back: über- oder unterdurchschnittlicher Stundenlohn beeinflusst zukünftigen Vollzeit-/Teilzeit-Status mögliche kontemporäre Korrelation von Teilzeit und uit, z.B. aufgrund nicht beobachteter (zeitlich variabler) Effekte IV-Schätzungen als mögliche Lösung hier jedoch problematisch, da endogene UV aus zwei Dummyvariablen besteht auch die Lags instrumentiert werden müssen gute, möglichst exklusive Instrumente rar sind

23 Ergebnisse Probleme durch Selektion? Welche Selektion?
nur dann problematisch, wenn für Selektion verantwortliche Variablen mit uit bzw. yit korrelieren Panelmodelle kontrollieren bereits nach unbeobachteten zeitkonstanten Individueneffekte dennoch ist Selektionsproblematik relevant Welche Selektion? Selektion in AV Missing data in AV und/oder UV Panelausfälle

24 Ergebnisse hier von Interesse: erzeugt das Hinzunehmen der Lags ein Selektionsproblem? mögliche Tests: Unterschiede in Koeffizienten im restringierten und unrestringierten Sample Indikatorvariable, ob vorangegangene Beobachtung mit im Modell ist oder nicht (dabei Verlust einer Beobachtung pro Individuum)

25 Ergebnisse Hausman-Test: signifikante Abweichungen

26 Ergebnisse

27 Ergebnisse mögliche Korrektur der Selektionsverzerrung: Verfahren nach Wooldridge ähnelt der Heckman-Korrektur, Schätzung eines Probit-Modells für Inklusionswahrscheinlichkeit deshalb auch hier: zusätzliche Variablen für Probit-Modell benötigt, die nicht in Einkommensgleichung sind Kandidaten hier: Familienstand und Anzahl der Kinder im HH (beide Effekte nicht signifikant)

28 Ergebnisse

29 Fazit inhaltlich: Beschäftigungsform der Teilzeit hat Effekt auf Arbeitseinkommen positiver Anfangseffekt wird durch negative Karriereeffekte konterkariert deutliche Unterschiede zwischen regulärer und marginaler Teilzeit Prozesse der Selbstselektion in Teilzeit zu erkennen, am deutlichsten für marginale Teilzeit

30 Fazit methodisch: Panelmodelle mit deutlichen Vorteilen gegenüber Analyseverfahren für Querschnittsdaten Kontrolle von unbeobachteter Heterogenität (wichtig für konsistente Schätzung der Parameter) flexiblere Modellgestaltung (z.B. Testen des Einflusses von Lags) jedoch: sorgfältige Überprüfung der Annahme unbedingt notwendig Selektionseffekte können wichtig werden (hier z.B. nicht behandelt: Selektion aufgrund von Panelausfällen)

31 Fazit STATA: Grundlagenbefehle vorhanden, werden erkennbar ausgebaut (siehe STATA 8) für weitergehende Modelle: eigenes Programmieren notwendig Tests auf Annahmeverletzungen sollten verstärkt implementiert werden (wie etwa Diagnosemöglichkeiten für OLS)


Herunterladen ppt "Einkommensanalysen mit Paneldaten"

Ähnliche Präsentationen


Google-Anzeigen