Methoden der Mehrebenenanalyse

Slides:

Advertisements

Ähnliche Präsentationen

Einfache Arbeit in Deutschland

Advertisements

Mathematik hat Geschichte

Heute 1.F – Test zur Varianzhomogenität 2.Bartlett-Test zur Varianzhomogenität 3.Chi – Quadrat Tests für Häufigkeiten 4.Chi – Quadrat Tests zur Verteilungsanpassung.

Was ist Testtheorie?.

Einkommensanalysen mit Paneldaten

CPCP Institute of Clinical Pharmacology AGAH Annual Meeting, 29. Februar 2004, Berlin, Praktischer Umgang mit den Genehmigungsanträgen gemäß 12. AMG Novelle.

Seminar „Extrapolationsmethoden für zufällige Felder“

Modelle und Methoden der Linearen und Nichtlinearen Optimierung (Ausgewählte Methoden und Fallstudien) U N I V E R S I T Ä T H A M B U R G November 2011.

Potentiale und Grenzen von Mehrebenenmodellen

IB mit t&t Wintersemester 2004/05 1 Tutorien Mo.12-14Zeljo BranovicIhne 22/E2 Mo.12-14Silke LodeIhne 22/UG2 Mo.12-14Simon SottsasOEI 301 Di.14-16Harald.

Thema der Stunde I. Einführung in die Varianzanalyse:

Forschungsstatistik II

Forschungsstatistik II

Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26.

Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.

Der Binomialtest Man habe einen wahren Anteil P.

Algorithmentheorie 04 –Hashing

Grundkurs Theoretische Informatik, Folie 2.1 © 2006 G. Vossen,K.-U. Witt Grundkurs Theoretische Informatik Kapitel 2 Gottfried Vossen Kurt-Ulrich Witt.

Anwendungsseminar: Kausale Modellbildung

Hypothesen testen: Grundidee

Betreuerin: Kathleen Jerchel

Institut für Wirtschaftsforschung Halle How important are plant and regional characteristics for labor demand? Plant-level evidence for Germany -Korreferat-

Wirkungen der aktiven Arbeitsmarktpolitik

Lohnhöhe, Rent-Sharing und Tarifbindung

Lohnentwicklung im Lebenszyklus

Tutorium Aufgabe 1 Informationen in Designmatrix in: - Darin sind die Prädiktoren enthalten - Aber sagt uns noch mehr! Untersuchungsdesign darin.

LIAB: Beispiel Lutz Bellmann und André Pahnke Laser empirisch Veranstaltung am 12. Februar 2008.

Mehrebenen-Modelle: Methodische Ansätze und Schätzung

Rechneraufbau & Rechnerstrukturen, Folie 12.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 12.

Analyse kategorialer Variablen

Dummy-Variablen Gleicher Lohn bei gleicher Qualifikation: Frauen verdienen im Durchschnitt zwar weniger als Männer, aber ist die Ursache dafür in der Diskriminierung.

Eigenschaften der OLS-Schätzer

Einfache Regressionsgleichung

Probleme der Modellspezifikation

Multikollinearität Wann spricht man von Multikollinearität?

Wiederholung: Einfache Regressionsgleichung

Bild 1.1 Copyright © Alfred Mertins | Signaltheorie, 2. Auflage Vieweg+Teubner PLUS Zusatzmaterialien Vieweg+Teubner Verlag | Wiesbaden.

Kapitel 15 Instrumentvariablen- Schätzung

Leistungsbeschreibung Brückenplanung RVS RVS

K. Meusburger & C. Alewel finanziert vom BAfU

STATISIK LV Nr.: 1375 SS März 2005.

Statistik: Mehr zur Regression.

Kapitel 15 Instrumentvariablen- Schätzung

Kapitel 10 Multikollinearität

Kapitel 9 Analyse der Modellstruktur Hackl, Einführung in die Ökonometrie 2 Rekursive OLS-Schätzung Spezifiziertes Modell: y = X + u y, u:

Kapitel 2 Das klassische Regressionsmodell

Kapitel 18 Dynamische Modelle: Schätzen der Parameter

Missspezifikation: Konsequenzen und Tests

Kapitel 16 Ökonometrische Modelle

Kapitel 14 Trends und Unit-root-Tests

Kapitel 4 Annahmen des linearen Regressionsmodells

Kapitel 18 Dynamische Modelle: Schätzen der Parameter.

STATISIK LV Nr.: 0021 WS 2005/ November 2005.

Analyse von Ablaufdiagrammen

IK Ökonomische Entscheidungen und Märkte

PROCAM Score Alter (Jahre)

Großer Altersunterschied bei Paaren fällt nicht auf!

1 (C)2006, Hermann Knoll, HTW Chur, FHO Quadratische Reste Definitionen: Quadratischer Rest Quadratwurzel Anwendungen.

Schutzvermerk nach DIN 34 beachten 20/05/14 Seite 1 Grundlagen XSoft Lösung :Logische Grundschaltung IEC-Grundlagen und logische Verknüpfungen.

Ertragsteuern, 5. Auflage Christiana Djanani, Gernot Brähler, Christian Lösel, Andreas Krenzin © UVK Verlagsgesellschaft mbH, Konstanz und München 2012.

Tutorium Statistik II Übung IV Philipp Schäpers Mi – 11.45

1 Medienpädagogischer Forschungsverbund Südwest KIM-Studie 2014 Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.

Monatsbericht Ausgleichsenergiemarkt Gas – Oktober

Monatsbericht Ausgleichsenergiemarkt Gas – November

Die klassischen Methoden der historisch-vergleichenden Forschung Universität Zürich Soziologisches Institut Seminar: Methoden des internationalen Vergleichs.

 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.

Außenhandelsbeziehungen zwischen China, USA, EU Makroökonometrie Vorlesung Dr. Oliver Bode.

Präsentation transkript:

Methoden der Mehrebenenanalyse dgdg Methoden der Mehrebenenanalyse Zur Untersuchung der sozialen und ökonomischen Einbindung von Subjekten und Organisationen LASER Workshop Mehrebenenanalyse Nürnberg, 30. Oktober 2008 Uwe Blien Phan thi Hong Van

Gliederung Einführung: Einige typische Fragestellungen der Mehrebenenanalyse Kapitel: Konzeptionelle Mehrebenenanalyse Kapitel: Statistische Mehrebenenanalyse Kapitel: Ein empirisches Beispiel Fazit

Einführung: Einige typische Fragestellungen der Mehrebenenanalyse

Einführung: Einige typische Fragestellungen der Mehrebenenanalyse Wie hängt der Erfolg von Schülern in Leistungstests von eigenen Merkmalen und von solchen ihrer Klassen, Schulen und Nachbarschaften ab? Wie wird der Lohn von Arbeitskräften von der regionalen Arbeitslosenquote beeinflusst? Haben Kinderbetreuungseinrichtungen in der Nachbarschaft Einfluss auf die Erziehungsmotivation von Müttern? Zur Untersuchung all dieser Fragestellungen sind Modelle notwendig, Modelle der Mehrebenenanalyse

Ausgangspunkt: Ein einfaches Regressionsmodell 0: Regressionskonstante, Achsenabschnitt, Intercept 1: Steigung der Regressionsgeraden, Slope r: Fehlerterm Das Modell spezifiziert einen Zusammenhang zwischen der abhängigen und den unabhängigen Variablen und einen Zufallsprozess für den Fehlerterm.

Hierarchie der Ebenen Häufig sind die Beziehungen zwischen Individual- und Kollektiveinheiten genestet, d. h. von hierarchischer Natur: Mütter leben in Familien in Gemeinden in Regionen Arbeitskräfte arbeiten in Firmen in Gemeinden in Regionen Schüler lernen in Klassen in Schulen in Bundesländern Darüber hinaus gibt es soziale Kontexte, die keine Hierarchie bilden, sondern „kreuzklassifiziert“ sind: - Schüler haben eine soziale Umgebung in einer Klasse und eine in ihrer Wohngegend, die sich teilweise überschneiden.

Typisierung von Mehrebenenansätzen Konzeptionelle Ansätze Methodische Ansätze Rational Choice Ansätze (i.e.S.) Modelle mit zufälligen Effekten & Koeffizienten Modelle mit fixen Effekten und Interaktionstermen Verallgemeinerte individuelle Wahl Systemtheoretische Mehrebenenansätze

Konzeptionelle Mehrebenenanalyse

2. Kapitel: Konzeptionelle Mehrebenenanalyse Von konzeptioneller Mehrebenenanalyse wird gesprochen, wenn in einer Forschungsfragestellung Individuen mit größeren sozialen Einheiten verbunden werden, die ihrerseits wieder in hierarchischen oder überkreuzten Bezie- hungen stehen können. Derartige Fragestellungen betreffen den Kern der soziologi- schen und ökonomischen Analyse (Stichworte „Individuum und Gesellschaft“, „Handlung und Struktur“, „Akteur und Kontext“, „Mikrofundierung der Makroökonomie“ etc.).

Individuelle Handlungen Mehrebenenanalyse im Rational Choice Ansatz oder in vergleichbaren Arbeiten Individueller „Umweg“ zur Erklärung von Makrophänomenen Schema nach McClelland (1961), Coleman (1990), Esser (1988/1993): Makrobedingungen Makroresultat Individuelle Akteure Individuelle Akteure Individuelle Handlungen Mikrofundierung von gesellschaftlichen Phänomenen

Mehrebenenanalyse im Ansatz verallgemeinerter individueller Wahl Nicht nur Bedingungen beeinflussen das individuelle Kallkül, auch die Präferenzen sind endogen: Bedingungen, Sozialisation etc. Makroresultat Individuelle Akteure Individuelle Akteure Individuelle Handlungen Zusätzliche Makrofundierung individuellen Handelns

Systemtheoretische Mehrebenenanalyse Z. B. Huinink (1989) Beliebige Einflüsse zwischen den Ebenen zulässig Makrobedingungen Makroresultat Individueller Akteur Individuelle Handlung Systeme handeln, nicht Individuen (hier nicht weiter verfolgt)

Statistische Mehrebenenanalyse

Grundlegende Typologie von Mehrebenenmodellen 3. Kapitel: Statistische Mehrebenenanalyse Grundlegende Typologie von Mehrebenenmodellen Modellart Einsatzbereich bei Mehrebenenproblemen Pooled Regression Nur zu empfehlen, wenn Gruppenstruktur keine Rolle spielt Zufällige Effekte (“Mehrebenenmodelle“) Keine Korrelation zwischen exogenen Variablen und Störtermen Gruppeneinheiten Zufallsstichprobe Fixe Effekte Wenn keine Multikollinearität zwischen Gruppenvariablen mit fixen Effekten

Wozu Mehrebenenanalyse? Verbindung von Individual- und Aggregatdaten auf der Ebene der Individuen (oder „kleiner“ Aggregate): Aggregatmerkmale werden zu Individualdaten dazugespielt Schätzen von Regressionsmodellen Interpretation der Resultate für Individual- und Aggregat-variablen Wo ist das Problem?

Ein erster Hinweis auf ein Problem kann den unterschiedlichen Fallzahlen auf den Ebenen entnommen werden Aggregatebene mit viel weniger Beobachtungen als Individualebene Wird in der Schätzung von Modellen nirgendwo berücksichtigt Signifikanztests basieren nicht auf (z. B.) 326 Kreisen West, sondern auf den Beobachtungen auf der Individualebene

Statistische Mehrebenenmodelle sind notwendig, wenn Untersuchungseinheiten systematisch von den gleichen unbeobachteten Einflüssen betroffen sind Moulton (1990) fand in einer Regression mit dem Lohn als abhängiger Variablen „signifikante“ Effekte von exogenen Regionalvariablen, die keine sinnvolle Interpretation aufweisen (z. B. Seengrößen oder Zufallszahlen) Korrelieren die Störgrößen von Beobachtungen innerhalb der übergeordneten Einheiten, z. B. innerhalb von Regionen, werden die Koeffizienten ineffizient und ihre Standardfehler verzerrt geschätzt.

Regressionsanalyse mit zufällig variierender Steigung (slope) der Regressionsgeraden (II) Schulleistung x x x x x x x x x x x x x x x Regressionsgeraden x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x Modelle mit variierenden Slopes werden hier nicht weiter verfolgt! x x x x x x x x x x x x Index soziale Herkunft

Einige Annahmen, die bei Mehrebenenmodellen mit zufälligen Effekten oder Koeffizienten notwendig sind Spezifikation der funktionalen Form des Modells Spezifikation der Verteilung der Zufallsvariablen - Unkorreliertheit der Störterme zwischen den Ebenen Unkorreliertheit der exogenen Variablen von den Störter- men auf den verschiedenen Ebenen (kritische Annahme) Wenn die letzte Annahme verletzt ist, werden die Modellpara- meter verzerrt geschätzt. In den Sozialwissenschaften und der sie beratenden Statistik wird dies im allgemeinen als nicht beson- ders problematisch eingestuft, anders in der Ökonometrie.

Modelle mit fixen oder mit zufälligen Effekten? (1) Für zufällige Effekte spricht: Elementareinheiten den Einheiten auf höheren Ebenen zufällig zugeordnet Einheiten auf höheren Ebenen Zufallsauswahl E. auf höheren Ebenen „austauschbar“, gegeben X - E. auf höheren Ebenen „klein“ (< 50 Elementareinheiten) - Effekte von Aggregatvariablen wichtig

Modelle mit fixen oder mit zufälligen Effekten? (2) Für fixe Effekte spricht: Elementareinheiten den Einheiten auf höheren Ebenen nicht zufällig zugeordnet Einheiten auf höheren Ebenen mit klarer Identität - Größe der fixen Effekte wichtig - Keine Aggregatvariablen relevant (diese sind in der Grundform des Modells multikollinear mit den fixen Effekten) - Erklärende Variablen mit fixen Effekten korreliert

Modelle mit fixen oder mit zufälligen Effekten? (3) Problem: Fixe und zufällige Effekte führen im Zweifelsfall zu unterschiedlichen Ergebnissen, welches Modell ist „richtig“? Außerdem: Gibt es eine Möglichkeit, die jeweils zu Grunde gelegten Annahmen zu überprüfen?

Hausman (1978) Spezifikationstest zum Test Random versus Fixed (1) Random-Effects Schätzer effizient und konsistent, wenn Unkorre- liertheitsannahme (etc.) zutreffend Fixed-Effects Schätzer nicht effizient, aber konsistent auch bei Korrelation zwischen X und dem Störterm auf Aggregatebene Unterschiede bei Zutreffen der U.annahme nur zufällig Vergleich der Vektoren der geschätzten Koeffizienten zwischen dem Random und dem Fixed Effects Modell im Hausman-Test - Wenn signifikanter Unterschied, Unkorreliertheitshypo. abgelehnt

Hausman (1978) Spezifikationstest zum Test Random versus Fixed (2) Test, ob der Wahrscheinlichkeitslimes der Differenz von FE und RE-Schätzer von Null verschieden ist Teststatistik: mit: Die Kovarianz der Schätzer kann in der folgenden Weise angegeben werden, wenn einer der beiden Schätzer effizient ist: Bei Gültigkeit der Nullhpypothese folgt H asymptotisch einer χ2 –Verteilung.

Hausman-Test Diskussion Unterschied FE- und RE-Schätzer kann durch Korrelation zwischen Errorterm und erklärender Variable hervorgerufen sein. Unterschied kann auf Fehlspezifikation beider Modelle zurück- zuführen sein. - Bei Heteroskedastie oder serieller Korrelation ist die RE-Schätzung nicht mehr effizient. Teststatistik gilt nur asymptotisch: Im praktischen Fall ständige Probleme mit „negativen Varianzen“ und nicht positiv-def. Matrix

Lehrbücher zur Mehrebenenanalyse mit einer klaren Präferenz für Random Effects: (Auszug) De Leeuw, Meijer (2008), Gelman, Hill (2007), Schwetz, Subram- anian (2005), Langer (2004), Snijders, Bosker (2004), Goldstein (2003), Hox (2002), Little, Schnabel, Baumert (2000), Kreft, De Leeuw (1998), Engel (1998), Ditton (1998), Hox (1994), Longford (1993), Searle, Casella, McCulloch (1992), Bryk, Raudenbush (1992) Der Hausman-Test wird jeweils nicht erwähnt

Lehrbücher zur Ökonometrie mit einer Darstel-lung von Random und Fixed-Effects Modellierung (sehr kleiner Auszug) Baltagi (2005), Greene (2003), Wooldridge (2002) Der Hausman-Test wird jeweils behandelt

Die Bezeichnung Mehrebenenmodell in erster Linie in den Sozialwissenschaften üblich In den Sozialwissenschaften sind Mehrebenenmodelle und Modelle mit zufälligen Effekten (und Koeffizienten) nahezu synonym. In der Ökonometrie wird bei der Anwendung eines Modells mit zufälligen Effekten ein Hausman-Test verlangt; dieser verwirft sehr häufig das Modell mit zufälligen Effekten. Sofern er korrekt funktioniert!

4. Ein empirisches Beispiel

4. Kapitel: Ein empirisches Beispiel: Auswirkungen der regionalen Arbeitslosigkeit auf das Lohnniveau Blanchflower/ Oswalds (1994, 2006) "empirisches Gesetz“: Die Elastizität des Lohns im Hinblick auf die regionale Arbeitslosigkeit ist -0,1 ln Wr = -0,1 ln Ur + weitere Terme (Lohnkurvenbeziehung)

Die Lohnkurve W1 W2 U1 U2 Löhne Lohnkurve Arbeitsnachfrage Region 1 regionale Arbeitslosenquote

Bedeutung der Lohnkurvenbeziehung In der Volkswirtschaftslehre: Untersuchung einer Beziehung zwischen zwei fundamentalen ökonomischen Größen Untersuchungen zur „Flexibilität“ In der Soziologie: Verbindung zwischen zwei zentralen Dimensionen sozialer Ungleichheit

Theoretische Begründungen der Lohnkurve Verhandlungsansätze: Arbeitslosigkeit schwächt die Position von Gewerkschaften und einzelnen Arbeitskräften in Lohnverhandlungen (Sanfey 1992) Effizienzlohnansätze: Hohe Löhne und hohe Arbeitslosigkeit sind Substitute für die Firmen, um sich eine leistungsbereite und qualifizierte Belegschaft zu sichern (Shapiro/ Stiglitz 1984)

Hauptunterschied zwischen den wichtigsten Typen von Mehrebenenmodellen Modelle mit zufälligen Effekten: Aufspaltung des Fehlerterms in zufällige Effekte, die verschiedenen Ebenen zugeordnet sind Annahmen zur Unkorreliertheit von explanatorischen und Störvariablen Modelle mit fixen Effekten: Schätzung der Effekte unbeobachteter Variabler höherer Ebenen als fixe Effekte von Dummyvariablen, Paneldaten vorausgesetzt

Modellspezifikationen: Mehrebenenmodelle mit fixen und zufälligen Effekten Blanchflower/ Oswald: Individualdaten mit fixen Effekten: Blanchflower/ Oswald: Aggregatdaten mit fixen Effekten: Mehrebenenmodell (Individualdaten) mit zufälligen Effekten:

Daten der IAB-Beschäftigtenstichprobe (IABS) 1993-2004: 3 870 048 Beobachtungen Relevante Variablen: Bruttolöhne Geschlecht Alter Beruf Qualifikation etc. Zusammengefügt mit Arbeitslosenquoten und Gebietstypen für Kreise

Einige Untersuchungen zur deutschen Lohnkurve Gerlach, Wagner (1994) Fixed Effects Blanchflower, Oswald (1994, 1996) Pooled/ Fixed Effects Blien (1995) Random Effects Bellmann, Blien (1996/2001) Random Effects Büttner (1996) Fixed Effects Baltagi, Blien (1998) Fixed effects Baltagi, Blien, Wolf (2000) Fixed Effects, Ostdeutschland Pannenberg, Schwarze (2000) Fixed Effects Baltagi, Blien, Wolf (2008) Fixed Effects

Ergebnisse (nur der Koeffizient für die Arbeitslosenquote) Pooled RE FGLS RE ML FE Individual o. R. -0,043 -0,027 -0,022 -0,020 Individual m. R. -0,079 -0,032 -0,025 Aggregat o. R. -0,050 -0,017 -0,011 -0,009 Aggregat m. R. -0,051 -0,018 -0,013 R: Regionstyp Kürzere Zeitperioden: RE FGLS (2004): -0,067, RE FGLS (2001-04): -0,040, FE (2001-04): 0,028 Alle Effekte sind hoch signifikant.

Hausman-Test Prüfgröße: 1384,55 Das Random Effects Modell wird abgelehnt Aber: Aus der in der aktuellen Stata-Version ausgegebenen Information über die Konstruktion des Tests ist zu entnehmen, dass der Rang der Differenzen-Varianzmatrix nicht der Zahl der Variablen entspricht. Außerdem treten „negative Varianzen“ auf. Verschiedene Optionen zur Variation der Berechnung des Tests verbessern das Ergebnis nur unwesentlich.

Ergebniszusammenfassung (1) Fixed Effects Modell nur möglich, weil durch den Einbezug der Zeit- dimension auch Aggregatvariablen aufgenommen werden können Kombination von Aggregat- und Individualdaten im Mehrebenen- modell der Aggregatmodellierung überlegen - Fixed und Random Effects Modell der Pooled Regression überlegen Kaum Unterschiede für Individualvariablen in den Varianten des Mehrebenenmodells Beobachtung eines langen Zeitraums wichtig zur Identifikation der Lohnkurvenbeziehung

Ergebniszusammenfassung (2) Hausman-Test zur Prüfung des Random Effects Modells nicht in rationaler Weise realisierbar Anwendung des Fixed Effects Modells erfordert weniger starke Annahmen

5. Fazit

5. Kapitel: Fazit Mehrebenenanalyse mächtiges Instrument zur Analyse der sozialen und ökonomischen Eingebundenheit von Subjekten Unterschiede zwischen Fixed und Random Effects Modellen sollten rational diskutiert werden, die Abgrenzung der Disziplinen ist kein geeignetes Kriterium Die Diskussion über die Vorzüge der jeweiligen Ansätze sollte fortgesetzt werden.