Vorbereitung der Auswertung: Codieren

Slides:



Advertisements
Ähnliche Präsentationen
Messung, Skalen und Indizes
Advertisements

Tests zur Messung von Arbeitszufriedenheit
Messen „Messen ist die Bestimmung der Ausprägung einer
Bewegungswissenschaft
Rating-Skalen: Definition
Untersuchungsarten im quantitativen Paradigma
Theorie psychometrischer Tests, III
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Lautbildungstest für Vorschulkinder
Einführung in das Thema Testgütekriterien
Philosophische Fakultät 3: Empirische Humanwissenschaften Fachrichtung Erziehungswissenschaft Statistik I Anja Fey, M.A.
Forschungsstatistik I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Patrick Rössler Methoden der Datenerhebung und -auswertung Vorlesung BA Kommunikationswissenschaft (G21) 1.
Patrick Rössler Methoden der Datenerhebung und -auswertung Vorlesung BA Kommunikationswissenschaft (G21) 1.
Mehrfachregressionen
Hypothesen testen: Grundidee
Diskurs Fragebögen Auswertung.
Reliabilitätsanalysen
Grundlagen der klassischen Testtheorie
Strukturgleichungsmodelle
Univariate Statistik M. Kresken.
VL Diagnostische Kompetenz (Bewegungslehre 2) 3
Sportwissenschaftliche Forschungsmethoden SS Statistischer Test.
VL Diagnostische Kompetenz (Bewegungslehre 2) 3. Korrelation und Gütekriterien.
Das wars!.
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Multikollinearität Wann spricht man von Multikollinearität?
Deutsch als Zweitsprache: Experimentelle Methoden WS 2013/2014
Externe Bewertung in IB-Biologie
Objektivität, Reliabilität, Validität
Ausgleichungsrechnung II
© Forschungsgruppe Metrik – Damm Deringer & Zinn GbR Streifzug durch die Testtheorie Winfried Zinn.
Einführung in SPSS/PASW. Inhaltsübersicht 1. Intro ( ) 2. Deskriptive Statistik ( ) (In Buch 1 Seite 85ff.) Kennwerte (Erwartungswert,
STATISIK LV Nr.: 0028 SS Mai 2005.
Die Struktur von Untersuchungen
Theoriereferat Indexes, Scales and Typologies The Logic of Sampling
Kapitel 10 Multikollinearität
Wahrscheinlichkeitsrechnung
Theorie psychometrischer Tests, IV
„Postmaterielle Werte“
Theorie psychometrischer Tests, II
Statistik Statistik I Seminar + Blockveranstaltung Statistik I
Testgütekriterien Tamara Katschnig.
Statistik – Regression - Korrelation
Methodische Grundlagen zu standardisierten Erhebungsinstrumenten
Veranstaltung 4.
Einführung zur Fehlerrechnung
Gegenstand der Psychologie
Messen Zuordnung von Zahlen zu Objekten/Ereignissen gemäß Regeln
Messen und Testen.
Statistik I demnächst in Hörsaal 16 !!.
Mathematik für BiologInnen WS 05
setzt Linearität des Zusammenhangs voraus
Die Generelle Interessen Skala (GIS)
Überblick: Erhebungsmethoden
Varianzanalyse und Eta²
Faktorenanalyse Tamara Katschnig.
Reliabilität.
Verteilungen, Varianz Tamara Katschnig.
Skalenniveaus Tamara Katschnig.
Statistiken je nach Messniveau
Testtheorie (Vorlesung 13: ) Wiederholung: Richtigstellung
Testtheorie (Vorlesung 12: ) Wiederholung: Reliabilität
Deskriptive Statistik, Korrelationen, Mittelwertvergleiche, Graphiken
 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.
Grafische Darstellung von Gruppenunterschieden.
Testtheorie (Vorlesung 14: ) Testtheorie allgemein:  Ziele und Inhalte der Testtheorie:  Beurteilung der Eigenschaften von Tests  Speziell: Güte.
Ökonometrie und Statistik Wiederholung
 Präsentation transkript:

Vorbereitung der Auswertung: Codieren Ihr Alter __24__ Jahre Ihr Geschlecht X Mann O Frau Stimmen Sie der Einführung von Studiengebühren zu? O ja X nein Wie stark werden Studiengebühren die Lehre verbessern? gar nicht 1 X 3 4 5 sehr Codierung: 24 1 0 2

Die codierten Werte werden dann in eine Datenmatrix eingegeben Codieren Bei einigen Variablen ergibt sich die Zuordnung von Zahlen zu Variablenausprägungen unproblematisch, z.B. Alter in Jahren – 20 Bei anderen Variablen muss man Entscheidungen treffen, z.B. beim Geschlecht Mann=1, Frau=2 Die codierten Werte werden dann in eine Datenmatrix eingegeben

Alter Geschlecht Vp 1 20 1 Vp 2 Vp 3 Vp 4 Vp 5 Vp 6 Vp 7 Vp 8 … Datenmatrix Alter Geschlecht Vp 1 20 1 Vp 2 Vp 3 Vp 4 Vp 5 Vp 6 Vp 7 Vp 8 …

Vorbereitung der Auswertung: Variablenbenennung und Umpolung Ich bin ängstlich. stimmt nicht 1 2 3 4 5 6 7 stimmt Ich bin ruhig. stimmt nicht 1 2 3 4 5 6 7 stimmt recode It2 (1=7) (2=6) (3=5) (4=4) (5=3) (6=2) (7=1) (zuvor wurden die Items als It1, It2 benannt)

Skalierung Häufig werden mehrere Variablen gemessen, die gemeinsam eine neue Variable ergeben: Index: eine Variable (soziale Schicht) ergibt sich aus mehreren anderen Variablen (Einkommen, Bildung, Berufsprestige). Die Berechnung der neuen aus den alten Variablen erfolgt nach definierten Rechenoperationen; im Beispiel ergibt sich das Problem unterschiedlicher Einheiten

Ich bin ganz ruhig. nein 1 2 3 4 5 ja Skalierung Skala: die Summe oder der Mittelwert aus mehreren Items (Fragen), die dasselbe Konstrukt messen sollen. Die Einheiten sind bei allen Items gleich. Es werden mehrere Items vorgelegt, um die Messgenauigkeit zu erhöhen. Wenn einige Items gegensinnig formuliert sind, müssen sie umgepolt werden, z.B. Ich habe Angst. nein 1 2 3 4 5 ja Ich bin ganz ruhig. nein 1 2 3 4 5 ja recode It2 (1=5) (2=4) (3=3) (4=2) (5=1).

Der Skalenwert ergibt sich aus dem Mittelwert der einzelnen Items. Skalierung Der Skalenwert ergibt sich aus dem Mittelwert der einzelnen Items. Die Mittelung hat gegenüber einer Summierung zwei Vorteile: Das Minimum und das Maximum der Werte, die auftreten können, sind wie bei den Items, die Werte sind leichter interpretierbar. Fehlende Werte werden ausgeglichen, da nur durch die Anzahl vorhandener Werte geteilt wird.

Schwierigkeit und Trennschärfe Der Begriff Schwierigkeit stammt aus der Leistungsdiagnostik: Prozentsatz der Personen, die eine Frage falsch beantworten. Im Fragebogen (zu Einstellungen oder Persönlichkeitsmerkmalen) ist es der Prozentsatz der Personen, die ein Item verneinen. Gibt es mehr Möglichkeiten als „ja“ und „nein“, betrachtet man den Mittelwert aller Personen. Je höher der ist, desto „leichter“ ist das Item. Items, die zu leicht oder zu schwierig sind, werden aus dem Fragebogen entfernt, da sie nicht gut zwischen den Individuen differenzieren können.

Schwierigkeit und Trennschärfe Die Trennschärfe ist die Korrelation zwischen einem Item und dem Rest des Fragebogens (Summe aller anderen Items). Sie gibt an, wie gut das Item bereits das Gesamtergebnis vorhersagen kann. Niedrige Trennschärfen bedeuten, dass das Item etwas anderes misst als der gesamte Test, Items mit niedrigen Trennschärfen (Faustregel < .30) werden aussortiert.

Testgütekriterien (1) 1. Objektivität (Versuchsleiterunabhängigkeit) Durchführungsobjektivität Auswertungsobjektivität Interpretationsobjektivität   2. Reliabilität (Genauigkeit) Retest-Reliabilität - Stabilität über die Zeit - Korrelation der Werte zweier Messzeitpunkte Innere Konsistenz – hohe Korrelation der Testteile. Man kann den Test in 2 Teile aufteilen und beide korrelieren (Split-half-Reliabilität) – oder in so viele Teile, wie der Test Items hat: ein Gesamtwert für die innere Konsistenz ist Cronbach´s Alpha. Bei Intelligenztests muss er um .90 liegen, bei anderen Fragebögen reicht auch .80 oder .70, je nach Testlänge (je länger, desto höher)

Testgütekriterien (2) 3. Validität (Gültigkeit)   Inhaltsvalidität - Sind die Items eine repräsentative Auswahl aller möglichen Items, die das Konstrukt messen könnten? Wird oft über Expertenurteil erfasst. Konstruktvalidität - Zusammenhang mit dem hypothetischen Konstrukt, welches der Fragebogen messen soll. Da das Konstrukt hypothetisch, daher nicht messbar ist, kann sie nicht als Korrelation zwischen FB und Konstrukt erhoben, sondern nur indirekt geschätzt werden: Der FB soll mit konstruktnahen Variablen (FB oder Verhaltensbeobachtungen, die dasselbe Konstrukt messen) hoch korrelieren (konvergente Validität) und darf mit konstruktfernen Variablen nicht hoch zusammenhängen (diskriminante Validität). Ein Intelligenztest soll z.B. mit einem anderen Intelligenztest und mit intelligentem Verhalten hoch, mit einem Gedächtnistest dagegen niedrig korrelieren. Konstruktvalidierung ist die Überprüfung möglichst vieler Hypothesen über Zusammenhänge zwischen dem Fragebogen und anderen Variablen.

Testgütekriterien (3) Kriteriumsvalidität – Korrelation zwischen einem FB und einem Außenkriterium. Das Kriterium ist eine andere Messung des Konstrukts, das der FB messen oder vorhersagen soll (z.B. mit Fremdbeurteilung, Verhaltensbeobachtung oder mit einem anderen Test, dessen Validität erwiesen ist). Z.B. korreliert ein Aggressivitäts-Test mit aggressivem Verhalten oder ein Einstellungstest mit dem Berufserfolg? Wenn das Kriterium gleichzeitig erhoben wird, spricht man von konkurrenter Validität, wenn es erst zeitlich nach der FB-Messung auftritt (z.B. späterer Berufserfolg), von prädiktiver Validität.

Messen: schematische Darstellung 1 Hauptschule Realschule 2 1 Hauptschule 3 Gymnasium Numerisches Relativ Empirisches Relativ

Messen und Messniveau (1) "Unter 'Messen' wird allgemein die Zuordnung von Zahlen ('Messwerten') zu Objekten gemäß festgelegten Regeln verstanden. Die Mängel dieser Definition werden bereits dadurch deutlich, dass die Zuweisung von Schulnoten durch Würfeln eine definitionsgemäße Messung wäre. Eine brauchbare Definition muss für eine Messung fordern, dass die Messwerte zueinander Beziehungen aufweisen, die den Beziehungen der gemessenen Objekte entsprechen. So wird z.B. für eine sinnvolle Längenmessung gefordert, dass der 'größte' Messwert dem 'längsten' Objekt entspricht, der 'kleinste' Messwert dem 'kürzesten' Objekt. Eine Messung in diesem Sinne ist eine 'strukturtreue Abbildung': Die Beziehungen der Objekte ('kürzer' - 'länger') werden durch die Beziehungen der zugeordneten Zahlen ('kleiner' - 'größer') korrekt wiedergegeben." (Schnell et al. 1993: 143, Herv. im Original)

Messen und Messniveau (2) "Die Verwendung eines bestimmten Kriteriums, z.B. Länge, definiert eine bestimmte Beziehung ('Relation') der Objekte zueinander. Eine Menge von Objekten, über die eine Relation definiert wurde, bezeichnet man als 'empirisches Relativ', eine Menge von Zahlen, über die eine Relation definiert wurde, als 'numerisches Relativ'. [...] Das Problem der Messung besteht nun darin, eine Zuordnung der Zahlen zu den Objekten zu finden, so dass die Ordnung im numerischen Relativ der Ordnung im empirischen Relativ entspricht: Das Problem besteht in der Angabe einer Regel, die eine strukturtreue Abbildung ermöglicht." (Schnell et al. 1993: 143f., Herv. im Original)

Skalenniveaus Skalenniveaus Nominal-skala Name Geschlecht =  Eigenschaft: Beispiel: erlaubte Rechenoperationen Nominal-skala Name Geschlecht =  Ordinal-skala Rangfolge Schulnoten < > Intervall-skala mit gleichen Intervallabständen Temperatur (Celsius) + - Verhältnis-skala mit absolutem Nullpunkt Länge (Meter), Alter * /

Diskrete Variablen haben begrenzte Ausprägungen, z.B. Zahl der Kinder Arten von Variablen Diskrete Variablen haben begrenzte Ausprägungen, z.B. Zahl der Kinder Kontinuierliche Variablen: zwischen zwei Werten ist jeder Zwischenwert möglich, z.B. Alter, Größe für die Statistik reicht folgende Unterscheidung: Kategoriale Variablen: wenige Ausprägungen Kontinuierliche Variablen: viele Ausprägungen

Anzahl der Ausprägungen Arten von Variablen Unterscheidung nach... Bezeichnungen Messniveau nominal ordinal intervall-, verhältnisskaliert nicht-metrisch metrisch Anzahl der Ausprägungen diskret kontinuierlich Art der Datenanalyse kategorial

Mittelwerte und Streuungsmaße nach Messniveau (1) Zentrale Tendenz (Mittelwerte) Nominal Ordinal Intervall Verhältnis Modus ja Median nein Ja Arithm. Mittel Geom. Mittel

Mittelwerte und Streuungsmaße nach Messniveau (2) Streuung (Streuungsmaße) Nominal Ordinal Intervall Verhältnis Spannweite nein (ja) ja Quartilsabstand Mittl. absolute Abweichung Varianz Standardabweichung Variationskoeffizient