Theorie psychometrischer Tests, I U. Mortensen Mainz, 2009.

Slides:



Advertisements
Ähnliche Präsentationen
Entscheiden unter Unsicherheit: Heuristiken und Biases
Advertisements

Leistungsmotivationstest L-M-T
Einführung in die Wirtschaftspädagogik – Vorlesung im SS 2009
Was ist Testtheorie?.
Präsentation bei der PAL
1 1. Splineglättung 1.1 Motivation 1.2 Notation 1.3 Splineglättung
Klassifikationsmodell psychologischer und pädagogischer Tests
Definition: Beobachtung
Definition: Beobachtung
Rating-Skalen: Definition
Untersuchungsarten im quantitativen Paradigma
Theorie psychometrischer Tests, III
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Lautbildungstest für Vorschulkinder
Lautunterscheidungstest für Vorschulkinder (4-7 Jahre) LUT
Gliederung Vertrauensintervalle Arten von Hypothesen
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.
Klassische Testtheorie
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Der Binomialtest Man habe einen wahren Anteil P.
Die Chaos-Theorie Oder warum das Apfelmännchen sich selbst ähnlich ist und Computer einfach anfangen, falsch zu rechnen...
Forschungsmethoden und Diagnostik
Pädagogische Beobachtung und diagnostische Gesprächsführung
Reliabilitätsanalysen
Grundlagen der klassischen Testtheorie
Auswahl von Aufgabenformaten und Formulierung von Items
Forschungsmethoden der Psychologie 2
Wiederholung zum Thema Informationsverarbietungsmodelle.
Die Bedeutung der Testdiagnostik für den Beratungsprozess
Forschungsprozess Car
Über den Einsatz normierter diagnostischer Verfahren in der Arbeitstherapie Von der Anwendung bestehender psychometrischer Tests zur Normierung der eigenen.
Allgemeine Literatur Fricke & Treinies (1985): Einführung in die Metaanalyse Schwarzer (1989): Meta-Analysis Programs Gutes Manual! Beelmann & Bliesener.
VL Diagnostische Kompetenz (Bewegungslehre 2) 3
VL Diagnostische Kompetenz (Bewegungslehre 2) 3. Korrelation und Gütekriterien.
Zur Kommunikation von Wahrscheinlichkeiten
Deutsch als Zweitsprache: Experimentelle Methoden WS 2013/2014
Externe Bewertung in IB-Biologie
Objektivität, Reliabilität, Validität
Coloured Progressive Matrices (CPM) nach Raven
Problemstellung und Hypothesenbildung
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/
Hartmut Klauck Universität Frankfurt WS 06/
Wahrscheinlichkeitsrechnung
Theorie psychometrischer Tests, IV
Theorie psychometischer Tests, V Nichtklassische Modelle
Theorie psychometrischer Tests, II
Item-Response-Theorie – oder probabilistische Testtheorie
Testgütekriterien Tamara Katschnig.
LEISTUNGSMESSUNG Testen und Prüfen
Gegenstand der Psychologie
Einführung / Formalitäten
Methoden der Sozialwissenschaften
Messen und Testen.
setzt Linearität des Zusammenhangs voraus
Das dichotome Rasch-Modell
Ziele /Aufgaben der Psychologie
Einstellungsforschung mittels Umfragen: Reliabilität der in der Umfrageforschung üblicherweise eingesetzten Instrumente Siegfried Schumann.
Testtheorie (Vorlesung 13: ) Wiederholung: Richtigstellung
Testtheorie (Vorlesung 12: ) Wiederholung: Reliabilität
Probleme empirischer Forschung
Statistik I Statistik I Statistische Grundbegriffe
Kommunikation mit Patienten Rothenburg ob der Tauber 19. November 2004.
Die klassischen Methoden der historisch-vergleichenden Forschung Universität Zürich Soziologisches Institut Seminar: Methoden des internationalen Vergleichs.
Grafische Darstellung von Gruppenunterschieden.
Testtheorie (Vorlesung 14: ) Testtheorie allgemein:  Ziele und Inhalte der Testtheorie:  Beurteilung der Eigenschaften von Tests  Speziell: Güte.
Methoden der Psychologie
Kapitel 2: Testtheorie / Testmodelle
 Präsentation transkript:

Theorie psychometrischer Tests, I U. Mortensen Mainz, 2009

Experten versus Tests Diagnose ExpertenPsychometr. Tests Professoren, Lehrer, Psychiater, Psychologen etc Intelligenztests Zulassungstest (Medizin, Management, etc) Persönlichkeitstests, etc Urteile: Wissen, Erfahrung Empirisch getestete Gültigkeit und Zuverlässigkeit (Lundberg, 1941)(Sarbin, 1943)

Experten versus Tests Experten – „Kliniker‘‘ SelbstbildFremdbild (Psychometriker) bedeutungsvoll, holistisch, subtil, konfigural, einfühlsam, tief, echt, dynamisch, global, lebensnah, mystisch, transzendent metaphysisch unzuverlässig, grob unverifizierbar vorwissenschaftlich unkontrolliert wirrköpfig Meehl, 1954

Experten versus Tests Meehl, 1954 Psychometriker- „Mechaniker“ SelbstbildFremdbild (Klinker) operational kommunizierbar, objektiv verifizierbar präzise, zuverlässig wissenschaftlich mechanisch atomistisch, additiv künstlich fraktioniert, trivial übersimplifiziert pseudowissenschaftlich pedantisch

Experten versus Tests Empirische Befunde Meehl (1986): Alle Studien sprechen für den psychometrischen, nicht für den „verstehenden Ansatz“ der Experten (Experten: zwischen 50% und 65% korrekt, Psychometriker: 75% bis über 90% korrekt) Dawes (1996): Weitere Studien mit gleichem Befund; Rolle insbesondere psychoanalytisch orientierter Therapeuten, medizinische Prognosen, etc Beispiel: Texas Medical School

Experten versus Tests Gründe für Expertenversagen : Situative Faktoren (Müdigkeit, Veränderung der Konzeptualisierung = Reduktion der Zuverlässigkeit) Mangelnde Validität aufgrund mangelnder Rückkopplung, dh es findet kein Lernen statt Konfirmatorischer Bias (widersprechende Informationen werden nicht zur Kenntnis genommen) Sich selbst erfüllende Prophezeiungen: Gewalttäter - Todesstrafe – tobt in der Zelle

Experten versus Tests Gründe für Expertenversagen: Repräsentativität: (Kahnemann & Tversky, 1974) Mann sei scheu, zurückgezogen, Neigung zu Ordnung und Detail: Ist er Bauer, Handelsvertreter, Pilot, Bibliothekar, Arzt? Häufigste Antwort: Bibliothekar.

Experten versus Tests Gründe für Expertenversagen: Verhalten erscheint vorhersagbar, nachdem es eingetreten ist, - aber nicht vorher! Daher subjektive (Pseudo-)Konsistenz der eigenen Urteile, - Erfahrung wird nicht vermehrt! Experten und mangelnde Repräsentativität der Population, aus der Erfahrung gewonnen wird: Jugendliche Delinquenten und „abweichende EEG-Muster“ – also abweichendes EEG-Muster impliziert Neigung zur Delinquenz. Aber: nicht-delinquente Jugendliche haben ebenso häufig abweichene EEG-Muster!

Experten versus Tests Gründe für Expertenversagen: Grundquotentäuschung (base rate fallacy): Grundquoten (base rates)

Experten versus Tests Gründe für Expertenversagen: Verfügbarkeit (Avaliability) Wahrscheinlichkeit, mit der eine Person ein Merkmal hat, wird nach Maßgabe der Personen mit diesem Merkmal, die man im Gedächtnis hat, abgeschätzt. Merkmale mit großer Salienz (Herzinfarkte) werden besser erinnert als Merkmale mit geringer Salienz.

Aufgabentypen 1.Frage 2.Feststellung 3.Bild Antwortformat: 1.Offen 2.Dichotom/polynom 3.Schätz-(Rating-)Skala 4.Multiple choice Ziel: möglichst 1-deutige Rückschlüsse auf Merkmal ermöglichen!

Grundbegriffe der Testtheorie Objektivität : verschiedene Testleiter kommen zur gleichen Bewertung; hohe Korrelation zwischen verschiedenen Testleitern. Reliabilität : Zuverlässigkeit – die Genauigkeit, mit der ein Merkmal gemessen wird. Validität : Gültigkeit – der Test erfasst das Merkmal, das er erfassen soll. Trennschärfe : der Test differenziert zwischen Personen, die sich durch die Merkmalsausprägung unterscheiden.

Grundbegriffe der Testtheorie Schwierigkeit : Ein Test oder Item ist schwierig bzw leicht, wenn die Beantwortung eine hohe oder geringe Merkmalsausprägung voraussetzt. Homogenität/Heterogenität : Die Items eines Tests sind homogen, wenn sie alle nur ein Merkmal erfassen, andernfalls sind sie heterogen.

Psychometrische Tests Testtheorien Klassische Testtheorie Probabilistische Testtheorie Score wahrer Wert Fehler Item- characteristic- function SchwierigkeitFähigkeit

Klassische Testtheorie (Messfehlertheorie) Wahrer Wert Gewichte Fehler

Klassische Testtheorie (KTT) Beispiele:

Klassische Testtheorie (KTT) Schwierigkeit einer Aufgabe: Anteil bzw. Prozentsatz der Probanden, die die Aufgabe lösen bzw. beantworten. Problem: die Schwierigkeit ist abhängig von der Population, bei der der Test administriert wird, d.h. Der Vergleich von Probanden aus verschiedenen Populationen ist schwierig, wenn nicht unmöglich.

Probabilistische Testtheorie (Item-Response-Theorie, IRT) Ziel: Personenparameter und Itemparameter (= Schwierigkeit) sollen unabhängig voneinander bestimmt werden. Die Schwierigkeit ist ein Merkmal eines Items, unabhängig von den getesteten Personen, der Personenparameter ist unabhängig von den im Test verwendeten Items. Die Bezeichnung ‚Probabilistische Testtheorie‘ ist insofern irreführend, als auch die KTT probabilistisch ist, - der Score ist ja mit einem zufälligen Fehler behaftet.

Spezialfall: deterministisches Antwortverhalten (Guttman-Skalen) Allgemeiner Fall: Probabilistisches Anwortverhalten Monotone Itemfunktionen