Einkommensanalysen mit Paneldaten

Slides:



Advertisements
Ähnliche Präsentationen
Tutorat Statistik II im SS 09 Mediator- & Moderatoranalyse
Advertisements

Einkommensungleichheit
Theorie psychometrischer Tests, III
Thema der Stunde I. Einführung in die Varianzanalyse:
Gliederung Vertrauensintervalle Arten von Hypothesen
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Mehrfachregressionen
SoSe 2005 Seminar: Arbeitsmarkt und Beschäftigung Dozent: Prof. Dr. Krol Arbeitszeitverkürzung als Strategie zur Bekämpfung der Arbeitslosigkeit Judith.
Anwendungsseminar: Kausale Modellbildung
Institutionelle Infrastruktur und allgemeine Charakteristika von Sozialstatistiken II Die Zuverlässigkeit retrospektiv erhobener Lebensverlaufsdaten Analysen.
Mehrdeutigkeit eines positiven Effekts bei Querschnittsdaten
Reliabilitätsanalysen
Latente Variablen – Kennwerte zur Beurteilung von Modellen
Statistiktutorat: Datenkontrolle
Strukturgleichungsmodelle
Erwerbskarrieren in Ostdeutschland – 20 Jahre nach der Deutschen Einheit und darüber hinaus - Korreferat – Birgit Schultz IWH/IAB-Workshop: 20.
Institut für Wirtschaftsforschung Halle How important are plant and regional characteristics for labor demand? Plant-level evidence for Germany -Korreferat-
Lohnentwicklung im Lebenszyklus
Tutorium
Tutorium
Tutorium
Tutorium
Tutorium
Tutorium Aufgabe 1 Informationen in Designmatrix in: - Darin sind die Prädiktoren enthalten - Aber sagt uns noch mehr! Untersuchungsdesign darin.
LIAB: Beispiel Lutz Bellmann und André Pahnke Laser empirisch Veranstaltung am 12. Februar 2008.
Analyse kategorialer Variablen
Einführung in die Metaanalyse
Dummy-Variablen Gleicher Lohn bei gleicher Qualifikation: Frauen verdienen im Durchschnitt zwar weniger als Männer, aber ist die Ursache dafür in der Diskriminierung.
Einfache Regressionsgleichung
Probleme der Modellspezifikation
Multikollinearität Wann spricht man von Multikollinearität?
Wiederholung: Einfache Regressionsgleichung
Deutsch als Zweitsprache: Experimentelle Methoden WS 2013/2014
Korreferat zu Zum Einfluss von Alter und Erfahrung auf Produktivitäts- und Lohnprofile 7. IWH/IAB-Workshop zur Arbeitsmarktpolitik 21. Oktober 2010, Halle.
Kinonachfrage in Deutschland
Kapitel 15 Instrumentvariablen- Schätzung
Varianzanalyse IV: Messwiederholung
Anke Mümken, Clemens Freytag, Wolfgang Keil & Ursula Piontkowski
Statistik: Mehr zur Regression.
Kapitel 15 Instrumentvariablen- Schätzung
Kapitel 10 Multikollinearität
Kapitel 2 Das klassische Regressionsmodell
Kapitel 18 Dynamische Modelle: Schätzen der Parameter
Kapitel 19 Kointegration
Kapitel 21 Mehrgleichungs-Modelle: Schätzverfahren
Kapitel 16 Ökonometrische Modelle
Kapitel 11 Heteroskedastizität
Kapitel 18 Dynamische Modelle: Schätzen der Parameter.
FAMILIENERNÄHRERINNEN AUF DEM ARBEITSMARKT:
Empirische Softwaretechnik
Framing Effekt: Der getrennte Einfluss von Wahrscheinlichkeiten und Utilities Ralf Stork, E. H. Witte Universität Hamburg, Fachbereich Psychologie, Von-Melle-Park.
Zum Einfluss subjektiver und objektiver Merkmale auf die Wiedererkennung von Werbeplakaten Antje Bauer & Stefanie Frehse Institut für Allgemeine Psychologie.
Universität Karlsruhe (TH) Forschungsuniversität · gegründet 1825 Lehrstuhl für Programmiersysteme Fakultät für Informatik 1 Anforderungen und Probleme.
Methoden der Sozialwissenschaften
Mathematisch-Statistische Verfahren des Risikomanagements - SS Weitere Methoden Interne Daten reichen als einzige Datenquelle nicht aus Andere Modelle.
setzt Linearität des Zusammenhangs voraus
Varianzanalyse und Eta²
Thema der Stunde Varianzanalyse mit Messwiederholung
Thema der Stunde I. Die Form der Stichprobenkennwerteverteilung
Statistiken je nach Messniveau
Testtheorie (Vorlesung 12: ) Wiederholung: Reliabilität
Die klassischen Methoden der historisch-vergleichenden Forschung Universität Zürich Soziologisches Institut Seminar: Methoden des internationalen Vergleichs.
Spärliche Kodierung von Videos natürlicher Szenen Vortragender: Christian Fischer.
 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.
Außenhandelsbeziehungen zwischen China, USA, EU Makroökonometrie Vorlesung Dr. Oliver Bode.
Identifying the effects of gendered language on economic behavior
 Präsentation transkript:

Einkommensanalysen mit Paneldaten Vortrag zum STATA User-Meeting August 2003 Berlin Johannes Giesecke Humboldt Universität zu Berlin Institut für Sozialwissenschaften

Gliederung Theoretische Vorüberlegungen zum Thema Methodische Aspekte Beschreibung der Daten Ergebnisse/Umsetzung mit STATA Fazit

Theorie Einkommensmodelle: klassische Humankapitalmodelle (z.B. Mincer, Becker): Bildung und Berufserfahrung erweiterte Modelle: angebotsseitige Charakteristika (z.B. sozio-strukturelle Merkmale der Individuen) sowie nachfrageseitige Faktoren (z.B. Branche, Betriebsgröße) bisher weniger untersucht: Effekte „flexibler“ Beschäftigungsformen (z.B. Befristung, Teilzeit)

Theorie hier von Interesse: Teilzeit Einkommenseffekte von Teilzeit: Arbeitseinkommen pro Stunde (hier: Bruttoeinkommen) Hypothesen zu Einkommenseffekten von Teilzeit: sowohl positive als auch negative Effekte zu erwarten

Theorie positive Einkommenseffekte zu erwarten aufgrund von: Produktivitätssteigerung weniger unbezahlten Überstunden, damit höherer Stundenlohn Anreizsetzung von Seiten der Unternehmen mit Ziel der Erhöhung der Flexibilität

Theorie negative Einkommenseffekte zu erwarten aufgrund von: geringerer Produktivität wegen geringerem Humankapital karrierehemmender Wirkung von TZ Brutto-/Nettoeffekt der progressiven Besteuerung

Theorie weitere Überlegungen: Teilzeit homogenes Phänomen? reguläre Teilzeit (16-34 Stunden/Woche) marginale Teilzeit (bis zu 15 Stunden/Woche) Effekte abhängig von Stellung im Arbeitsmarkt? z.B. Interaktion von Teilzeit mit Bildung Selektionseffekte bestimmter Typus von ArbeitnehmerInnen in Teilzeit?

Methodische Aspekte Schätzungen von Einkommensgleichungen mit Querschnittsdaten (einmalig erhobene Daten) typische Probleme für OLS-Schätzung: heteroskedastische Fehler ui endogene unabhängige Variablen

Methodische Aspekte Heteroskedastizität: Endogene UV: inkorrekte Berechnung der Standardfehler kann mit robuster Varianzschätzung oder GLS-Schätzung korrigiert werden Endogene UV: verzerrte Schätzung der Koeffizienten mögliche Lösung: IV-Schätzung (z.B. 2SLS) mit Instrumenten für diejenigen x, die mit Fehler korrelieren Beispiel: Teilzeit korreliert mit (unbeobachteter) Motivation/Erwerbsneigung

Methodische Aspekte Paneldaten erlauben Schätzung des Modells: hier neu: unbeobachteter Individueneffekt ci (als zeitkonstant angenommen) damit Problem der Endogenität abgeschwächt, jedoch noch nicht vollständig beseitigt Wahl des Schätzverfahrens hängt zunächst von nur einer Frage ab: Korrelieren einige/alle der UV mit dem unbeobachteten Individueneffekt ci ?

Methodische Aspekte Korrelieren einige/alle der UV mit dem unbeobachteten Individueneffekt ci ? nein ja OLS-Schätzung: konsistente Schätzer für Koeffizienten, jedoch keine effiziente Schätzung random-effects-Schätzung: konsistente und effiziente Schätzung (unter bestimmten Annahmen) fixed-effects-Schätzung: konsistente und effiziente Schätzung (unter bestimmten Annahmen) first-difference-Schätzung: konsistente und effiziente Schätzung (unter bestimmten Annahmen)

Methodische Aspekte größter Nachteil der fe- bzw. fd-Modelle: Effekte zeitkonstanter UV können nicht geschätzt werden größter Nachteil des re-Modells: liefert verzerrte Schätzungen für Koeffizienten, wenn UV doch mit Individueneffekt korrelieren

Daten Sozio-ökonomisches Panel (SOEP) 1985-2001 nur Frauen, da TZ hauptsächlich weibliches Phänomen Arbeiterinnen, Angestellte und Beamtinnen nur Westdeutsche abhängige Variable: ln(Bruttostundenlohn) unabhängige Variablen: Humankapital: Alter und Alter² als Proxy für Berufserfahrung, Bildung, Anzahl vorheriger Arbeitslosigkeitsphasen weitere individuelle Variablen: Familienstand, Anzahl Kinder im HH Arbeitsplatzmerkmale: Teilzeit (regulär und marginal), Branche, Betriebsgröße, Befristung

Daten Bildung: nahezu zeitkonstant für Erwerbstätige Interaktionen mit anderen UV Modelle nach Bildungskategorien getrennt berechnen (Kategorien angelehnt an CASMIN) niedriges Ausbildungslevel mittleres berufliches Ausbildungslevel mittleres allgemeines Ausbildungslevel hohes Ausbildungslevel hier nur betrachtet: mittleres berufliches Ausbildungslevel

Ergebnisse Hausman-Test: signifikante Abweichung der re- von der fe-Schätzung

Ergebnisse/STATA Signifikanztests im fe-Modell basieren auf Annahme homoskedastischer und seriell unkorrelierter Fehler uit sinnvolle Annahme? robuste Varianzschätzungen erlauben „konservative“ Schätzung der Standardfehler mögliches Problem dann: sehr große Standardfehler

Ergebnisse

Ergebnisse Konsistenz der FE-Schätzer basiert auf Annahme der strikten Exogenität Annahme: idiosynkratische Fehler uit korrelieren nicht mit: vergangenen Werten der UV nach Kontrolle der UV haben Lags der UV keinen Einfluss auf die AV Lösungsmöglichkeit: Aufnahme der Lags in das Modell aktuellen Werten der UV nicht berücksichtigte Variablen, Simultanität, Messfehler Lösungsmöglichkeit: IV-Schätzung zukünftigen Werten der UV feed-back-Modelle: uit bzw. yit hat Einfluss auf xit+s

Ergebnisse/STATA Erzeugen von Lags und Leads per Hand: über tsset: verlangt Sorgfalt (Stichwort: Lücken im Panel) sicherster Weg: erzeugen eines „balanced panels“ (fillin) über tsset: sicher (interne Kontrolle von Lücken) sehr bequem

Ergebnisse

Ergebnisse Aufnahme der Lags in das Modell: Interpretation als distributed lag-Modell

Ergebnisse weiterhin bestehende Probleme: feed-back: über- oder unterdurchschnittlicher Stundenlohn beeinflusst zukünftigen Vollzeit-/Teilzeit-Status mögliche kontemporäre Korrelation von Teilzeit und uit, z.B. aufgrund nicht beobachteter (zeitlich variabler) Effekte IV-Schätzungen als mögliche Lösung hier jedoch problematisch, da endogene UV aus zwei Dummyvariablen besteht auch die Lags instrumentiert werden müssen gute, möglichst exklusive Instrumente rar sind

Ergebnisse Probleme durch Selektion? Welche Selektion? nur dann problematisch, wenn für Selektion verantwortliche Variablen mit uit bzw. yit korrelieren Panelmodelle kontrollieren bereits nach unbeobachteten zeitkonstanten Individueneffekte dennoch ist Selektionsproblematik relevant Welche Selektion? Selektion in AV Missing data in AV und/oder UV Panelausfälle

Ergebnisse hier von Interesse: erzeugt das Hinzunehmen der Lags ein Selektionsproblem? mögliche Tests: Unterschiede in Koeffizienten im restringierten und unrestringierten Sample Indikatorvariable, ob vorangegangene Beobachtung mit im Modell ist oder nicht (dabei Verlust einer Beobachtung pro Individuum)

Ergebnisse Hausman-Test: signifikante Abweichungen

Ergebnisse

Ergebnisse mögliche Korrektur der Selektionsverzerrung: Verfahren nach Wooldridge ähnelt der Heckman-Korrektur, Schätzung eines Probit-Modells für Inklusionswahrscheinlichkeit deshalb auch hier: zusätzliche Variablen für Probit-Modell benötigt, die nicht in Einkommensgleichung sind Kandidaten hier: Familienstand und Anzahl der Kinder im HH (beide Effekte nicht signifikant)

Ergebnisse

Fazit inhaltlich: Beschäftigungsform der Teilzeit hat Effekt auf Arbeitseinkommen positiver Anfangseffekt wird durch negative Karriereeffekte konterkariert deutliche Unterschiede zwischen regulärer und marginaler Teilzeit Prozesse der Selbstselektion in Teilzeit zu erkennen, am deutlichsten für marginale Teilzeit

Fazit methodisch: Panelmodelle mit deutlichen Vorteilen gegenüber Analyseverfahren für Querschnittsdaten Kontrolle von unbeobachteter Heterogenität (wichtig für konsistente Schätzung der Parameter) flexiblere Modellgestaltung (z.B. Testen des Einflusses von Lags) jedoch: sorgfältige Überprüfung der Annahme unbedingt notwendig Selektionseffekte können wichtig werden (hier z.B. nicht behandelt: Selektion aufgrund von Panelausfällen)

Fazit STATA: Grundlagenbefehle vorhanden, werden erkennbar ausgebaut (siehe STATA 8) für weitergehende Modelle: eigenes Programmieren notwendig Tests auf Annahmeverletzungen sollten verstärkt implementiert werden (wie etwa Diagnosemöglichkeiten für OLS)