Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Messungen – Skalen – Indizes Empirische Sozialforschung Renate Prantner Christoph Schantl.

Ähnliche Präsentationen


Präsentation zum Thema: "Messungen – Skalen – Indizes Empirische Sozialforschung Renate Prantner Christoph Schantl."—  Präsentation transkript:

1 Messungen – Skalen – Indizes Empirische Sozialforschung Renate Prantner Christoph Schantl

2 Folie 2 Übersicht Messung nicht-direkt beobachtbarer Eigenschaften Big-Mac-Index Einstellungsmessung Likert - Technik Gütekriterien (Objektivität, Reliabilität, Validität) Guttman-Skala Polaritätsprofil Messung und Skalenniveaus

3 Folie 3 Begriffsbeschreibung Operationalisierung einer Variablen Anweisungen, nach denen Untersuchungseinheiten den Kategorien einer Variable zugewiesen werden Messung Zuordnung von Zahlen zu Objekten nach bestimmten Regeln Skalierung Spezialfall der Messung - auf der Basis eines Skalierungsmodells Unterstellt empirisch prüfbare Annahmen über Struktur der Beobachtung Indizes Variablen, deren Werte sich aus einer Rechenoperation mehrerer anderer Variablen ergeben

4 Folie 4 Indirekte Messung Beispiel Wasserverbrauch der Stadt Leverkusen an einem Wochentag Heute Kommissar Hawaii Fünf-Null Sendeschluss Messung der Fernsehbeteiligung

5 Folie 5 Messung nicht-direkt beobachtbarer Eigenschaften Theoretisches Konstrukt Umweltbewusstsein, Lebensstandard Auswahl eines oder mehrer Indikatoren Qualitätskriterien einer Messung Reliabilität (Reproduzierbarkeit) Validität (Gültigkeit) Prüfung des Indikators - Validierungstest Korrelationskoeffizient (+1, -1, 0) Stärke des linearen Zusammenhangs zwischen zwei Variablen

6 Folie 6 Messung nicht-direkt beobachtbarer Eigenschaften Berechnung des Korrelationskoeffizienten Korrelationskoeffizient Kovarianz von X und Y Standardabweichung

7 Folie 7 Big-Mac-Index Messung der realen Kaufkraft einer Währung Theorie der Kaufkraftparität Der Wechselkurs zweier Währungen wird durch unterschiedliche Preisniveaus in zwei Ländern bestimmt Big-Mac-Index Homogenes Gut Weltweit erhältlich Lokale Big-Mac Preise, Produkte und Dienstleistungen „Arbeitszeitaufwand für Big-Mac“ als Indikator des Lebensstandards

8 Folie 8 Big-Mac-Index

9 Folie 9 Big-Mac-Index Prüfung des Indikators – Validierungstest Korrelation zwischen Big-Mac-Index und akzeptierten Maß BSP/Kopf „Human Development Index“ (HDI) der UN Lebenserwartung bei Geburt, Alphabetisierungsrate, BSP/Kopf

10 Folie 10 Big-Mac-Index

11 Folie 11 Einstellungsmessung Likert – Technik „Technik der summierten Einschätzungen“ Einstellungsmessung mit multiplen Indikatoren Qualitätskriterien der Testtheorie – Reliabilität und Validität Ziel Trennung geeigneter von wenig geeigneten Items Zuweisung eines Skalenwertes Technik Schriftlichen Befragung oder „Face-to-face“ Interview Punkte-Antwortskala Grad der Zustimmung zu jedem Item

12 Folie 12 Einstellungsmessung Likert – Technik Item C: „Wenn wir so weitermachen wie bisher, steuern wir auf eine Umweltkatastrophe zu“ (1)Stimme überhaupt nicht zu (2)Stimme nicht zu (3)Teils /Teils (4)Stimme zu (5)Stimme voll zu Beispiel

13 Folie 13 Einstellungsmessung Likert – Technik „Item-Non-Response“ Personen mit „missing values“ bleiben unberücksichtigt Gründe für „missing values“: Antwortverweigerung Keine Meinung zum spezifischen Item Vergessen eine Antwort zu geben

14 Folie 14 Einstellungsmessung Likert – Technik Konsistenz Items weisen eine gemeinsame Dimension auf Gründe für Inkonsistenz zufällige Messfehler systematische Verzerrungen durch einzelne Items mehrdimensionale Items (unterschiedliche Interpretationen)

15 Folie 15 Einstellungsmessung Likert – Technik Konsistenztest „Trennschärfekoeffizient“/„Item-Summenscore-Korrelation“ Aussondierung geeigneter Items Berechnung der einzelnen Items mit dem Summenscore Voraussetzung: Mehrzahl der Items die Zieldimension im hohen Maße anspricht. Annahmen dieses Konsistenztests In der Summe irrt man sich weniger als bei der Formulierung von Einzelitems

16 Folie 16 Einstellungsmessung Likert – Technik Beispiel

17 Folie 17 Gütekriterien der Messung Objektivität Ausmaß der Unabhängigkeit der Ergebnisse vom Anwender des Messinstrumentes Reliabilität Maß für die Reproduzierbarkeit von Messergebnissen Validität Grad der Genauigkeit des Messinstrumentes hinsichtlich der zumessenden Variablen bzw. des Verhaltens

18 Folie 18 Objektivität Ausmaß der Unabhängigkeit der Ergebnisse Korrelationskoeffizient Durchführungsobjektivität Niedrige Durchführungsobjektivität: unterschiedliche Interviewer lösen beim gleichen Befragten X jeweils ein anderes Antwortverhalten aus. Auswertungsobjektivität Geringe Auswertungsobjektivität: unterschiedliche Messergebnisse, von zwei Auswerter A und B bei gleichem Antwortverhalten von X

19 Folie 19 Objektivität Beispiel Durchführungsobjektivität Durchführungsobjektivität von unterschiedliche Sympathieträger, unterschiedliches Naheverhältnissen, vom Thema abhängig. Auswertungsobjektivität Schularbeiten von 2 Lehrern korrigieren lassen Deutsch (geringe Auswertungsobjektivität) Mathematik (hohe Auswertungsobjektivität)

20 Folie 20 Reliabilität Maß für die Reproduzierbarkeit von Messergebnissen Korrelationskoeffizienten Paralleltest-Methode (Paralleltest-Reliabilität) Messung mit zwei vergleichbaren Messinstrumenten Reliabilität nicht mit Validität verwechseln! (Zeitungsleser) Test-Retest-Methode (Test-Retest-Reliablilität) Wiederholte Anwendung nach einem bestimmten Zeitintervall Erfordert ein Paneldesign Methode der Testhalbierung („Split-half-Reliabilität“) Aufsplitterung einer Itemsbatterie in zwei Paralleltests Verkürzung führt zur Unterschätzung der Reliabilität

21 Folie 21 Reliabilität Formel von Spearman und Brown Unterschätzung des Reliabilitätskoeffizienten wird mit Hilfe der Formel von Spearman und Brown korrigiert

22 Folie 22 Reliabilität Formel von Spearman und Brown Alternierende Items S1 = B + D + F + H + J S2 = C + E + G + I + K Korrelationskoeffizient = 0,66 Unterschätzung des Reliabilitätskoeffizienten wird mit Hilfe der Formel von Spearman und Brown korrigiert Korrigierter Wert = 0,79 Beispiel

23 Folie 23 Validität Definition Grad der Genauigkeit, mit dem der Test diejenige Verhaltensweise, die er messen soll, tatsächlich misst Arten der Validität Inhaltsvalidität: Repräsentative Stichprobe der zu messenden Eigenschaft Kriteriumsvalidität: Korrelation der Resultate eines Messinstrument mit anderen empirisch relevanten Merkmalen (Außenkriterium) Unterscheidungsvalidität: parallel erhobenes Außenkriterium Vorhersagegevalidität: prognostiziertes Kriterium Konstruktvalidität: Prüfung zur Eignung von Messinstrumenten für die Entwicklung von Theorien

24 Folie 24 Validität Inhaltsvalide Messung Sammlung umweltrelevanter Aussagen in öffentlichen Diskussion mittels einer Inhaltsanalyse und Ziehung einer Stichprobe aus diesem „Universum“ „Expertenrating“: Expertenurteile bezüglich der Repräsentativität der Items als Hinweis auf die Inhaltsvalidität eines Messinstrumentes Kriteriumsvalidität Übereinstimmungsvalidität Zusammenhang zwischen Messwerten und Mitgliedschaft in Umweltorganisationen Vorhersagevalidität Zusammenhang zwischen Messwerten und einer späteren Wahl von Umweltparteien (politischen Wahlverhaltens) Beispiel

25 Folie 25 Validität Konstruktvalidität Brauchbarkeit von Messinstrumenten für die Entwicklung von Theorien wird hiermit geprüft Das von einem Messinstrument erfasste Konstrukt soll einer empirischen Prüfung standhalten Multitrait-Multimethod-Matrix (M-M-Matrix) stärker formalisiertes Verfahren der Konstruktvalidität Korrelationsanalysen Voraussetzung: Messung mindestens zwei hypothetische Konstrukte mit mindestens je zwei verschiedenen Methoden

26 Folie 26 Validität Konstruktvalidität „Konvergente Validität“ Korrelation zwischen den Messergebnissen verschiedener Methoden zur Erfassung des gleichen Konstrukts „Diskriminierende Validität“ Korrelation zwischen den Messergebnissen verschiedener Konstrukte mit der gleichen Methode

27 Folie 27 Validität Konstruktvalidität: Multitrait-Multimethod-Matrix Reliabilitätskoeffizienten („Split-half-Korrelation“) gleiche Methode, gleiches Konstrukt Validitätskoeffizienten gleiches Konstrukt, verschiedene Methoden Beispiel

28 Folie 28 Objektivität, Reliabilität, Validität Hierarchisches Verhältnis der drei Güterkriterien Minimalvoraussetzungen Objektivität ist eine notwendige, aber nicht hinreichende Bedingung der Reliabilität. Reliabilität ist wiederum eine notwendige, aber nicht hinreichende Bedingung der Validität. Validität Ziel ist die Konstruktion valider Messinstrumente Erfüllung mindestens eines der Validitätskriterien Ausmaß der Validität begrenzt durch Ausmaß der Reliabilität

29 Folie 29 Testtheorie Klassische Testtheorie Objektivität, Reliabilität und Validität Zusammenhang zwischen Messinstrumenten und theoretischen Konstrukten mittels mathematisch-statistischen Modells X = T + E Messwert X setzt sich aus T und E zusammen Probabilistische Testtheorie Wahrscheinlichkeit, dass Items sich lösen lassen hängt ab vom Schwierigkeitsgrad und von Fähigkeit der Person Intelligenztest

30 Folie 30 Guttmann-Skalierung Erfasst Einstellungen zu einer Sache bzw. auch zu Personen (z.B. Umweltbewusstsein) Deterministisches, eindimensionales, ordinales Skalierungsmodell Anteil der Ja-Antworten nimmt von A – D ab Items haben eine unterschiedliche Intensität bzgl. der latenten Dimension „Umweltengagement“

31 Folie 31 Beispiel: Umweltengagement A: Haben Sie sich schon einmal in eine Unterschriftenliste eingetragen, bei der es um Umweltschutzprobleme ging? B: Haben Sie schon einmal oder häufiger Geld für eine Umweltschutzaktion oder eine Umweltorganisation gespendet? C: Sind Sie aktives oder passives Mitglied einer Umweltschutzorganisation oder einer Vereinigung, die Umweltschutzinteressen verfolgt? D: Haben Sie schon einmal ein Treffen oder eine Veranstaltung einer Umweltschutzorganisation besucht? 58% 42% 17% 16% JA „Je höher die Kosten des Verhaltens, desto geringer ist das Engagement.“

32 Folie 32 Itemcharakteristik der Guttman-Skala Annahme: Person besitzt eine bestimmte Anschauung – Befragte stimmt allen Items zu, die eine weniger extreme Anschauung ausdrücken, als er selbst besitzt, extremere Items werden hingegen abgelehnt. Wahrscheinlichkeit JA Latente Eigenschaft T Aus der Itemcharakterisik folgt ein eindeutig bestimmbares ideales Antwortmuster !

33 Folie 33 Antwortmatrix der Guttman-Skala ABDDSkalenwertPosition auf dem latenten Kontinuum 00000T < τ τ1 ≤ T < τ τ2 ≤ T < τ τ3 ≤ T < τ τ4 ≤ T Zustimmung zu einem intensiveren Item, schließt Zustimmung zu schwächerem Item ein Skalenwert als Summe der gegebenen „Ja“ einer Person Person c mit Skalenwert von 3 hat höheres Umweltengagement als z.B. Person a (Skalenwert 0) Skalenwerte zeigen Rangordnung - ordinales Skalenniveau!

34 Folie 34 Bedingungen für Guttman-Skala Beobachteten Antworten müssten theoretisch exakt mit erwartetem Antwortmuster übereinstimmen Abweichungen aufgrund Messfehler sind möglich (geringfügige Fehlerquote ist tolerabel) -„verbotene Antwortmuster“ sollten relativ selten sein Bei n Items dürfen n + 1 Antwortkombinationen auftreten Tatsächlich gibt es jedoch 2 n = 16 Antworten Bei Bsp. Umweltengagement sind alle 16 Antwortmöglichkeiten vorhanden!

35 Folie 35 Beispiel: Beobachtete Antwortmatrix Nr.ABCD Skalen wert Fehler Anzahl P. Fehler – 15…………………… Summe „Je höher der Reproduzierbarkeitskoeffizient, desto besser die Skala.“

36 Folie 36 Polaritätsprofil Beschreibung eines Objekt durch Darstellung charakteristischer Merkmalsmuster (Profil) Voraussetzungen: Auswahl geeigneter Eigenschaften  Vergleich mehrerer Objekte mittels Polaritätsprofil möglich (z.B. Profile zweier Politiker) Verwendung in Markt- und Wahlforschung, sowie Persönlichkeitspsychologie

37 Folie 37 Beispiel: Umweltverhalten Untersuchung zum Image von Freilandeiern vs. Bodenhaltungseiern 7 Eigenschaften zur Beschreibung des Produktimages ausgewählt Für jede Eigenschaft wird ein Gegensatzpaar gebildet Ca. 50 Kunden werden um Einschätzung gebeten Mittelwerte der Einstufungen werden in die Polaritätsprofile eingetragen

38 Folie 38 Bodenhaltungseier tierfeindlich tierfreundlich Umwelts Umweltf. ungesund gesund billig teuer Schlecht Gut Kurz haltbar Lang haltbar Schl. Qualität Gute Qualität

39 Folie 39 Freilandeier tierfeindlich tierfreundlich Umwelts Umweltf. ungesund gesund billig teuer Schlecht Gut Kurz haltbar Lang haltbar Schl. Qualität Gute Qualität

40 Folie 40 Meßtheorie Mit welchen Regeln können Zahlen zu Objekten zugeordnet werden? Beispiel: Peter liest Stephen King (k), lieber hätte er ein Scheckbuch (s), King zieht er Diekmann (d) vor, schlimmste Horror ist Einführung in die Statistik (e) Menge A: s, k, d, e Menge B: 1,2,3,4 φ(s)=4; φ(k)=3; … (1)s, k, d, etc. ist die Menge der empirischen Objekte mit Relation (empirisches Relativ) (2)Menge von Zahlen mit Relation (Numerisches Relativ)

41 Folie 41 Messung Isomorphismus Jedem Objekt (z.B. King) in der Menge A wird eindeutig eine Zahl (z.B. 3) zugeordnet und jeder Zahl in B (z.B. 2) wird eindeutig ein Objekt (z.B. Diekmann) zugeordnet. Homomorphismus Jedem Objekt in der Menge A kann eindeutig eine Zahl zugeordnet werden (Stephen King wird die Zahl 3 zugeordnet). Definition: Messung liegt vor, wenn ein Isomorphismus oder Homomorphismus zwischen einem empirischen und einem numerischen Relativ existiert.

42 Folie 42 Repräsentation, Eindeutigkeit und … Repräsentation z.B. beim Homomorphismus wird ein Objekt durch eine Zahl „repräsentiert“ (King wird repräsentiert durch die Zahl 3) Bedingungen (Axiome) für diesen H. müssen gefunden werden → Repräsentationsproblem Eindeutigkeitsproblem Bezeichnet welche Transformationen möglich sind, sodass die Rangordnung der Messwerte bewahrt wird. (z.B. kann ich statt 4,3,2,1 auch 10,7,5,1 beim Bücherbeispiel verwenden)

43 Folie 43 Bedeutsamkeit Aussage gilt als bedeutsam, wenn der Wahrheitswert nach den Transformationen unverändert bleibt. Welche Aussagen und Schlussfolgerungen, Rechenoperationen sind bei einer bestimmten Art der Messung zulässig oder unzulässig? Beispiel: Dienstag 18°C, Mittwoch 27°C Aussage 1: Mittwoch ist es wärmer als Dienstag Aussage 2: Mittwoch ist es um 50% wärmer als Dienstag (bedeutsam???)

44 Folie 44 Skalenniveaus Skalen Zu jeder Messstruktur gibt es ein Repräsentationstheorem (Bedingungen) und ein Eindeutigkeitstheorem (Klasse der möglichen Transformationen = Skalenniveau) Für jedes Skalenniveau lässt sich angeben, welche Aussagen und Rechenoperationen zulässig sind Verschiedene Skalen Nominalskala (unterstes Messniveau) Ordinalskala Intervallskala Ratioskala Absolutskala (höchstes Messniveau)

45 Folie 45 Nominalskala Klassifikation von Objekten nach der Relation Gleichheit oder Verschiedenheit Zuordnung nach Geschlecht (m/w), Arten von Freizeitaktivitäten, Religionszugehörigkeit, Haarfarbe, etc. Aussagen: gleich oder verschieden Jede Äquivalenzklasse kann mit einer Zahl kodiert werden (Männer = 0, Frauen = 1 oder Männer = 5, Frauen =10) Transformation: Ein-eindeutige Transformationen der zugewiesenen Zahlen sind möglich, auch Männer = 5 und Frauen = 10 bedeutet Verschiedenheit, Wichtig bleibt nur Unterscheidbarkeit! Einziger sinnvoller „Mittelwert“ ist der Modalwert!

46 Folie 46 Ordinalskala Eine Rangordnung der Objekte bzgl. einer Eigenschaft wird vorausgesetzt (Rangskala) Schulnoten (1 besser als 2 besser als 3 etc.), Einkommen (hoch > mittel > niedrig), Dienstgrad (General > Oberst > Gefreiter) Aussagen: größer, kleiner oder gleich Transformation: Positive monotone Transformationen sind möglich (Rangordnung der Skalenwerte muss bewahrt werden) Mittelwert ist der Median Abstände zwischen den Skalenwerten sind nicht sinnvoll interpretierbar!

47 Folie 47 Intervallskala Aussage über die Rangordnung der Messwerte ist möglich, zusätzlich informieren die Skalenwerte auch über die Abstände (Intervalle) zw. den Messwerten Temperatur in C° oder °F, Zeitpunkte, Metrische Maße, Intelligenztests, etc. Aussagen: Vergleichbarkeit von Differenzen Nullpunkt und Skaleneinheit kann willkürlich festgelegt werden Transformation: positive lineare Prozentuale Zuwächse oder Verhältnisse von Skalenwerten sind nicht zulässig (Bsp. Temperatur, IQ) Berechnung arithmetischer Mittelwerte hingegen zulässig Bsp: Peter IQ 110, Max IQ 100, Peter ist um 10% klüger als Max – nicht zulässig

48 Folie 48 Ratioskala Verfügen über natürlichen Nullpunkt Temperatur in Kelvin (absoluter Nullpunkt), Einkommen und Vermögen (Nullpunkt = Besitzlosigkeit) etc. Aussagen: Aussagen über Verhältnisse, prozentuale Vergleiche Transformation: positiv proportionale (Freiheit in der Wahl der Skaleneinheit) Aussagen über Verhältnisse sind zulässig Geometrische Mittelwerte können berechnet werden

49 Folie 49 Absolutskala Eindeutig festgelegt, nicht einmal Wahl der Skaleneinheit ist frei wählbar Wahrscheinlichkeitswerte und Häufigkeiten, z.B. Anzahl von Demonstrationsteilnehmern, Mitgliederzahl in einer Gewerkschaft, Anzahl kriegerischer Konflikte in einem Jahr, etc. Transformation: nicht möglich

50 Folie 50 Zusammenfassend zu Skalenniveaus Zahl der zulässigen Transformationen wird eingeschränkt mit steigendem Messniveau (von Nominal- bis zur Absolutskala) Umfang der Menge zulässiger Rechenoperationen und erlaubter Aussagen wächst mit dem Skalenniveau Statistische Kennziffern, die auf niedrigem Niveau sinnvoll berechenbar sind, können immer auch auf höherem Niveau berechnet werden Informationsgehalt der Messhypothesen (Aussagen) steigt mit dem Skalenniveau

51 Folie 51 Hinweise und praktische Tipps Auswahl des Meßverfahrens Mehrdimensionale vor eindimensionalen Verfahren Probabilistische vor deterministischen Verfahren Messungen auf Basis eines Repräsentationstheorems vor Messungen ohne Prüfung der Skalenvoraussetzungen Möglichst hohes Skalenniveau Abhängig von Art der Daten, Arbeitsaufwand Untersuchungsziele Zu untersuchende Eigenschaft

52 Folie 52 Hinweise und praktische Tipps 2 Skalenniveau Vom Skalenniveau der Variablen und Indizes hängt ab, welche statistischen Analyseverfahren später verwendet werden können! Einstellungsskalen Einstellungsskalen müssen nicht jeweils neu konstruiert werden, eine Vielzahl existiert bereits, es spricht nichts dagegen diese zu verwenden, anstatt das Rad neu zu erfinden!


Herunterladen ppt "Messungen – Skalen – Indizes Empirische Sozialforschung Renate Prantner Christoph Schantl."

Ähnliche Präsentationen


Google-Anzeigen