Querschnitt- und Längsschnitterhebungen 24.4.2006 Christoph Buchinger Thomas Elssenwenger LV 0361: Methoden I, Dr. Regina Dittrich
Agenda Begriffsdefinitionen Daten und Designs Kohortendesigns Auswahl von Erhebungsdesigns
Begriffsdefinitionen Querschnittdesigns, Trend- und Paneldesigns
Unterscheidung Unterscheidung nach zeitlichen Faktor der Datenerhebung: einmalig Querschnittsdaten mehrmalig Längsschnittdaten Trenddesign Paneldesign Frage nach Einsatz der Methode Interview Beobachtung Umfrage etc.
Unterschied Querschnitt und Längsschnittdesign
Unterscheidung Trend- und Paneldesign Trenddesign: wiederholte Messung der gleichen Variablen mit jeweils unterschiedlichen Stichproben Stichprobe aus Personenmenge Stichprobenproblematik in Zusammenhang mit Trends Paneldesign: wiederholte Messung der gleichen Variablen bei gleichen Untersuchungseinheiten der untersuchte Personenkreis bleibt derselbe
Graphik Unterschied Trend- und Paneldesign
Informationshierarchie Paneldesign informativer als Trenddesign Querschnittsdesign
Probleme des Paneldesigns zwar generell informativer Theoretisch keinerlei Stichproben- und Messfehler Häufige praktische Probleme Frage der stetigen Aktualität der zu beobachten Menge Schwundquote pro Erhebungswelle (Panelmortalität) bei europäischen Populationsfragen Mittelschichtbias potentieller Mehraufwand daher Wirtschaftlichkeit
Daten und Designs
Daten und Designs Erhebungsdesigns dienen der Sammlung aussagekräftiger Daten: Überprüfung Hypothesen deskriptive Studien: Beschreibung sozialer oder ökonomischer Verhältnisse Anwendung: Querschnittdesigns Querschnittdaten Trenddesigns Trenddaten Paneldesigns Paneldaten Voraussetzung: Messungszeitpunkt = Erhebungszeitpunkt Ereignisse in Vergangenheit?
Retrospektivfragen Ereignisse aus Vergangenheit Arten: „harte“ sozialdemographische Fakten (Bildungsabschluss, Jahr der Eheschließung, ...) konkrete Handlungen (Anzahl Zahnarztbesuche im letzten Jahr) Längschnittsdaten durch Retrospektivfragen auch als Querschnitterhebung (limitierend: Erinnerungsvermögen) Beispiel: Gegenwärtige Berufsposition, vor einem und vor zwei Jahren Design A: Paneldesign mit drei Wellen in den Jahren 03, 04 und 05 Design B: Querschnittserhebung mit Retrospektivfragen im Jahr 05 Unterschied Datenqualität: Was bei monatlichen Einkommen vor 10 Jahren, Einstellungen?
Beispiel Retrospektivfragen: Wählerstromanalysen Querschnittsdesign: Befragung des Wählers nach Verlassen des Wahllokals: Aktuelle Stimmabgabe Stimmabgabe bei der letzten Wahl (Recallfrage, mit Ungenauigkeit behaftet) Paneldaten:
Datentypen nach Zeitbezug: Querschnittdaten Beschreibung: Variablenwerte der Untersuchungseinheiten beziehen sich auf einen Zeitpunkt Anwendung: Erforschung von Beziehungen zwischen Variablen durch Unterschiede zwischen Beobachtungseinheiten (Individuen, ...) zu einem bestimmten Zeitpunkt Beispiele: Beobachtung von Konsumenten, Beschäftigte, Firmen zu einem bestimmten Zeitpunkt
Datentypen nach Zeitbezug: Zeitreihendaten Beschreibung: Daten für eine einzelne Einheit (Person, Firma, ...) die zu aufeinander folgenden Zeitpunkten beobachtet werden. Anwendung: Studium der Entwicklung von Variablen im Zeitablauf (auch zur Vorhersage zukünftiger Entwicklungen dieser Variablen) Beispiel Armutsquote: (‚Armutsquoten in Westdeutschland 1984 bis 1989) 1984 1985 1986 1987 1988 1989 Alle 11,0 12,4 10,6 10,7 Deutsche 10,3 10,2 11,5 9,9 10,1 8,8 Ausländer 24,1 24,8 29,4 24,4 22,9 24,3
Datentypen nach Zeitbezug: Paneldaten Beschreibung: mehrere Untersuchungseinheiten für jede Einheit Beobachtungen bei zumindest zwei Zeitpunkten (T>1) identischer Zeitintervall zwischen Beobachtungen (Zeitintervall meist gering, Zahl der Untersuchungseinheiten N relativ groß) Anwendung: Erforschung ökonomischer Beziehungen zwischen Beobachtungen sowie deren Entwicklung für einzelne Einheiten Beispiel: ORF-Panel
Datentypen nach Zeitbezug: Verlaufs- oder Ereignisdaten Beschreibung: Verlaufs- oder Ereignisdaten messen Zeitintervalle zwischen zwei Ereignissen Sowohl Querschnitt- (Retrospektivfragen) als auch Paneldesigns möglich höherer Informationsgehalt als bei Paneldaten, da nicht stichtags- sondern ereignisbezogen! Anwendung: Erhebung von Ereignisdaten
Datentypen nach Zeitbezug: Verlaufs- oder Ereignisdaten Beschreibung: Verlaufs- oder Ereignisdaten messen Zeitintervalle zwischen zwei Ereignissen Sowohl Querschnitt- (Retrospektivfragen) als auch Paneldesigns möglich höherer Informationsgehalt als bei Paneldaten, da nicht stichtags- sondern ereignisbezogen! Anwendung: Erhebung von Ereignissen Beispiel: Entwicklung Familienstand
Datentypen nach Zeitbezug: Verlaufs- oder Ereignisdaten Beschreibung: Verlaufs- oder Ereignisdaten messen Zeitintervalle zwischen zwei Ereignissen Sowohl Querschnitt- (Retrospektivfragen) als auch Paneldesigns möglich höherer Informationsgehalt als bei Paneldaten, da nicht stichtags- sondern ereignisbezogen! Anwendung: Erhebung von Ereignissen Beispiel: Entwicklung Familienstand
Entwicklung Familienstand
Kohortendesign
Kohortendesign Kohorte: sich im Gleichschritt vorwärtsbewegende Bevölkerungsgruppe mit gemeinsamen Startereignis Hintergrund: Mitglieder einer Kohorte sind gemeinsamen kulturellen und sozialökonomischen Einflüssen ausgesetzt, die sich auf den Lebensverlauf auswirken (Kohorteneffekte) Ex-ante- (Lebensverlaufsstudie) und ex-post (nachträglich Zusammenfassung) Unterscheidung: Kalenderzeit, Prozesszeit Beispiele: Alterskohorte (70-79 Jahre) Geburtenkohorte (Geburtsjahr 1980, Geburtsspanne 1980-1984) Eheschließungskohorte (verheiratet seit 6-10 Jahren) Berufsseintrittskohorte (berufstätig seit 21-25 Jahren) Kundenkohorte (Kunde seit 1 Jahr, Kunde seit 2004)
Kohortenuntersuchungen: 1. Kohorteneffekte Kohorteneffekte beziehen sich auf systematische Unterschiede zwischen Kohorten Beispiel: Scheidungsrisiko steigt seit Mitte der 50er Jahre (Anteil geschiedener Ehen bis zu einer Ehedauer von 9,5 Jahren in %)
Kohortenuntersuchungen: 2. Lebenszykluseffekte Systematische Zusammenhänge zwischen Merkmalen und seit Startereignis verstrichener Zeit Kalenderzeit-Untersuchungen: Abhängigkeiten von Projektzeit Beispiel: Kundenbindung pro Jahr nach Dauer der Kundenbeziehung
Kohortenuntersuchungen: 3. Periodeneffekte Historisch einmalig Beispiel: Scheidungen in Westdeutschland 1978: Abwarten der Gesetzesreform Periodeneffekt
Identifizierung von Effekten im Kohortendesign Zur Separierung von Kohorten- und Lebenszykluseffekten benötigt man Längsschnittdaten Praxis: mangels besserer Daten Lebenszykluseffekte nur mittels Querschnittdaten geschätzt (nur bei Annahme, dass keine Kohorteneffekte vorliegen, möglich). „Lebenszyklus-Fehlschluss“: Bsp.: Altersabhängigkeit von Intelligenz (Geringere Schulbildung älterer Probanden). Wenn möglich, Schätzung von Alters- (=Lebenzyklus-)Effekten getrennt nach Kohorten Sterbetafeln: Beobachtung 100 Jahre, Prognose für weitere 100 Jahre
Identifizierung von Effekten im Kohortendesign
Auswahl von Erhebungsdesigns
Auswahl von Erhebungsdesigns Ausgangspunkt: Hypothese Ermittlung erforderlichen Datentyp Auswahl geeignetes Erhebungsdesig Erfassung zuverlässig und mit geringem Aufwand Retrospektivfragen zulässig? Bsp: Hypothese XY Querschnitt- oder Längschnittdaten? Querschnitt- oder Längschnittdesign?
Danke für die Aufmerksamkeit! Weitere Infos zu Panels: Sozioökonomisches Panel (SÖP): Befragung von ca. 12 000 Personen zu zahlreichen Merkmalen der ökonomischen und sozialen Lage, Erwerbstätigkeit, Familie etc (stehen Forschern bei begründetem Interesse zur Verfügung): www..... Allgemeine Bevölkerungsumfrage: .... www....