Klassifikationsmodell psychologischer und pädagogischer Tests

Slides:



Advertisements
Ähnliche Präsentationen
EINFÜHRUNG IN DIE METHODEN DER UMFRAGEFORSCHUNG
Advertisements

Identifizierung und Ausbildung von Führungskräften
Zur Information über und Beurteilung von Tests
Leistungsmotivationstest L-M-T
Patrick Rössler Einführung in die Methoden der empirischen Kommunikationsforschung Vorlesung BA Kommunikationswissenschaft.
Gliederung und Aufbau eines Gutachtens (nach H.-J. Fisseni)
Die Ministerpräsidentin des Landes Schleswig-Holstein Staatskanzlei 1 Erprobung des Common Assessment Framework (CAF) Staatskanzlei Schleswig-Holstein.
Was ist Testtheorie?.
Gliederung der Ausführungen: Einleitung, Hauptteil, Schluss
Empirische Forschung Empirisch = eine wissenschaftliche Vorgehensweise betreffend, die nicht auf theoretischen Begründungen, sondern auf nachvollziehbaren.
Einführung in die Psychologische Diagnostik Prof. Dr
Präsentation bei der PAL
Individuelles Fördern in der Schule durch
Pädagogische Diagnostik
Bewegungswissenschaft
Aufgaben und Ziele der Wissenschaften
Rating-Skalen: Definition
Forschungsprogramm Subjektive Theorien (FST)
Untersuchungsarten im quantitativen Paradigma
Einleitende Thesen: Um die Diagnosekompetenz von Lehrerinnen und Lehrern an deutschen Schulen ist es nicht zum Besten bestellt ist. Lernrückstände werden.
Lautbildungstest für Vorschulkinder
„Wissenschaftliches Arbeiten“ Was soll denn das sein?
Schulleistungstests und Schultests
Philosophische Fakultät 3: Empirische Humanwissenschaften Fachrichtung Erziehungswissenschaft Statistik I Anja Fey, M.A.
Patrick Rössler Methoden der Datenerhebung und -auswertung Vorlesung BA Kommunikationswissenschaft (G21) 1.
Kursleitung: Hier ist Platz für Ihren Namen
Forschungsmethoden und Diagnostik
Modellbildung in der Geoökologie (G5, 103) SS 2004
Schriftliche Prüfung Voraussichtlich zwischen 6.8. und
Qualitative Forschung
Qualitätskriterien zur Beurteilung von Dokumentationen
Inhalte und Maßnahmen eingegeben haben,
Methoden der empirischen Sozialforschung II
Die Bedeutung der Testdiagnostik für den Beratungsprozess
Allgemeiner Schulleistungstest AST (2 - 4), Ingenkamp (Hrsg.)
Forschungsprozess Car
Über den Einsatz normierter diagnostischer Verfahren in der Arbeitstherapie Von der Anwendung bestehender psychometrischer Tests zur Normierung der eigenen.
Entwicklung von Prüfungen und Prüfungssystem
Fritz Gempel Personalmonitoring Sozialwissenschaftliche Methoden zur Unterstützung der Personalentwicklung.
„Wer aufhört besser zu werden, hört auf gut zu sein.“
Entwicklung standardorientierter Aufgaben – am Beispiel naturwissenschaftliche Erkenntnisgewinnung Jürgen Mayer.
Objektivität, Reliabilität, Validität
Neue variable Lernkontrollen mit Diagnose und Förderplanung
Studie Einfluss der Sitzposition in den Vorlesungsräumen auf die studentische Leistung Jochen Jung, Larry Maus und Steffen Brünske.
© Forschungsgruppe Metrik – Damm Deringer & Zinn GbR Streifzug durch die Testtheorie Winfried Zinn.
Ausgangslage Mangelhafte Führungs-kompetenz Schlechtes Betriebsklima
Planung und Ablauf empirischer Untersuchungen
Problemstellung und Hypothesenbildung
STATISIK LV Nr.: 1375 SS März 2005.
Die Struktur von Untersuchungen
Phasen einer empirischen Untersuchung
Kathrin Grummich1, Katrin Jensen2 Christoph M Seiler1 Markus K Diener1
Qualitätsmanagement in kommunalen Verkehrsplanungsprozessen
Studieren Lernen Claudia Lischke-Arzt.
Vergleichsarbeiten in der Grundschule
Analyseprodukte numerischer Modelle
Kompetenzen - Hintergrund
Testgütekriterien Tamara Katschnig.
Werk im Kontext Werk im Kontext
Lernmodelle und Experimentelle Untersuchungen
Empirische Sozialforschung am Beispiel der Limburger Nordstadt
Gegenstand der Psychologie
Methoden der Sozialwissenschaften
Messen und Testen.
Dagmar Much Empirische Erhebung Bildungsträger und Bildungsplaner.
Vergleichsarbeiten (VERA)
Katharina Hafner, Sina Pasutti, Mareike Thiel 1 Beurteilungsverfahren für Beschäftigte.
Die klassischen Methoden der historisch-vergleichenden Forschung Universität Zürich Soziologisches Institut Seminar: Methoden des internationalen Vergleichs.
C3: Strategische Interaktion und Anreize für nachhaltiges ökonomisches Handeln Page 1  Ziel: Untersuchung von Anreizproblemen, die nachhaltige Wertschöpfungsnetze.
Klasse Klassenzufriedenheit Strukturmerkmale (Schultyp, Anteil Knaben, Anteil plagender Kinder) Eltern Einstellungen (Erwartungen,Attribution) Verhalten.
 Präsentation transkript:

Klassifikationsmodell psychologischer und pädagogischer Tests 1. Leistungstests 1.1 Entwicklungstests 1.2 Intelligenztests 1.3 Allgemeine Leistungstests 1.4 Schultests 1.4.1 Einschulungstests 1.4.2 Spezielle Schuleignungstests 1.4.3 Mehrfächertests 1.4.4 Lesetest 1.4.5 Rechtschreibtests 1.4.6 Mathematik- und Rechentests 1.4.7 Sonstige Schultests 1.5 Spezielle Funktionsprüfungs- und Eignungstests 2. Psychometrische Persönlichkeitstests 2.1 Persönlichkeits-Struktur- Tests 2.2 Einstellungs- und Interessentests 2.3 Klinische Tests 2.3.1 Fragebogen 2.3.2 Interviews 2.3.3 Sonstige klinische Verfahren 3. Persönlichkeits-Entfaltungsverfahren 3.1 Formdeuteverfahren 3.2 Verbal-thematische Verfahren 3.3 Zeichnerische- und Gestaltungsverfahren

Genese eines Tests (nach Fisseni 1997): Entwurf Sichtung theoretischer Ansätze, empirischer Befunde, die zum Thema vorliegen Konzeptualisierung und Ausarbeitung der Fragestellung Festlegung der Merkmale, die erfasst werden sollen Befragung von Experten Erprobung Vorlage der Testform bei einer Stichprobe, die der Zielgruppe möglichst ähnlich ist zur Ermittlung missglückter Itemspezifikationen (-formulierungen) zur Analyse der Testaufgabe Auswertung Revision Selektion, Elimination oder Überarbeitung der Items aufgrund der Erprobungsergebnisse ggf. Wiederholung der Erprobung Erstellung eines revidierten Tests Endfassung Ziehung einer angemessenen Stichprobe der Zielgruppe Vorlage und Auswertung des revidierten Test: Bestimmung von Standardisierung (Objektivität), Messgenauigkeit (Reliabilität) und Gültigkeit (Validität) Festlegung genereller und spezieller Normen Interpretation der Ergebnisse u. Berücksichtigung methodischer Beschränkungen Vergleich mit Ergebnissen, die auf ähnlichen Methoden beruhen.

Praxis Erhebung von Ausprägungen relevant erscheinender Merkmale Unselektierte Grundgesamtheit/Referenzstichprobe Verteilung der Merkmale in der Grundgesamtheit Merkmale(kombinationen) die erfolgreich von nicht-erfolgreich trennen Erhebung von Ausprägungen relevant erscheinender Merkmale Praxis Erfolgreich Nicht-erfolgreich

Tests und Skalen „Viele Forschungen schließen den Gebrauch veröffent- lichter Tests bzw. Fragebögen ein. Cronbach (1979, 26) bezeichnet einen psychologischen Test kurz und knapp als ‚eine systematische Prozedur, um das Verhalten von zwei oder mehreren Personen zu vergleichen und es mit Hilfe einer numerischen Skala oder eines Kategoriensystems zu beschreiben.“ Rost 2007, 150

Tests und Skalen Nach Ingenkamp (1962; 1964) ist ein Test ein Unter- suchungsverfahren besonderer Art, „mit dem unter möglichst konstanten Bedingungen interindividuell unterschiedliches Verhalten in bestimmten, genau definierten Bereichen möglichst zuverlässig und möglichst gültig erfasst und einer möglichst objektiven Auswertung und einheitlichen Interpretation zugäng- lich gemacht wird.“ Rost 2007, 150

Kernsatz (KS) „Die Hauptaufgabe der Pädagogischen Diagnostik besteht also darin, für den Lernenden richtige Entscheidungen zu treffen. Die Entscheidungen beziehen sich auf Förderungs-, Platzierungs- und Selektions- maßnahmen.“ Ingenkamp & Lissmann 2005, 14

„Ein Test ist ein wissenschaftliches Routineverfahren zur Untersuchung eines oder mehrerer empirisch abgrenzbarer Persönlichkeitsmerkmalen mit dem Ziel einer möglichst quantitativen Aussage über den relativen Grad der individuellen Merkmalsausprägung.“ (nach Kubinger 2006)

„Ein psychologischer Test erhebt unter standardisierten Bedingungen eine Informationsstichprobe über eine Testperson, wobei die Idee der dem Experiment inhärenten Manipulation insofern Platz greift, als durch systematisch erstellte Fragen/Aufgaben interessierende Verhaltensweisen oder psychische Vorgänge ausgelöst werden.“ (nach Kubinger 2006)

„Psychologische Tests sind unverzichtbare Instrumente für die psychologische Forschung sowie die praktische Anwendung der Psychologie. Ein Test versucht bedeutende Merkmale zu erfassen, indem er eine Person solchen Situationen (Items) aussetzt, die diagnostisch relevantes Verhalten evozieren. Das Verhalten in einzelnen Situationen ist jedoch nicht vollständig von Merkmalen der Person und der Situation determiniert. Verschiedene Verhaltensweisen sind für verschiedene Personen nur unterschiedlich wahrscheinlich. Die beobachteten Unterschiede im Verhalten von Personen sind immer auch in gewissem Ausmaß von Zufall bestimmt, so dass es meist nicht gelingt, Situationen herzustellen, die es erlauben, bereits aus der Beobachtung von einzelnen Verhaltensweisen zuverlässige Aussagen über eine Person zu machen.“ Yousfi, Diagnostica, Heft 1, S. 1, 2005

Diagnostik zur Verbesserung des Lernens Aufgaben Selbst- und Fremdkorrektur falscher Lernergebnisse Erkennen von Lerndefiziten Bestätigung erfolgreicher Lernschritte Planung nachfolgender Lernschritte Motivation durch Hinweise auf Lernerfolg Steuerung des Schwierigkeitsgrades nächster Schritte Verbesserung von Lernbedingungen - Diagnostik zur Erteilung von Qualifikationen

„Im Prinzip bedingen und fördern sich die KS: „Im Prinzip bedingen und fördern sich die Individualisierung und Verfeinerung didaktischer Maßnahmen und die steigenden Anforderungen an die Gütekriterien diagnostischer Instrumente gegenseitig“ (S. 22) Allererste Diagnostik/Tests 1864 scale books 1894 Rice: Rechtsschreibliste 1908 Stone: Arithmetiktest 1914 USA: Befürwortung objektiver Tests Kritik an Diagnostik

Mündliche Prüfungen „Mündliche Prüfungen sind eine Form zielgerichteter Kommunikation zwischen einem oder mehreren Prüfern und Prüflingen, bei der auf die Schriftform verzichtet wird.“ „Die frühen Untersuchungen belegen hinreichend, dass mündliche Prüfungen weder objektiv und zuverlässig, noch gültig sind.“ „Aufgrund der vorliegenden empirischen Befunde lässt sich aber fordern, dass nur solche Leistungen mündlich geprüft werden sollten, die sprachabhängig sind.“

Schriftliche Prüfungsarbeiten „Aus der Zusammenfassung aller Untersuchungen kann nur der Schluss gezogen werden, dass bei traditionellen schriftlichen Arbeiten die Auswertungsobjektivität nicht gewährleistet ist, wenn in der üblichen Art beurteilt wird.“ „Dieses Ergebnis bedeutet, dass es weniger vom tatsächlichen Leistungsniveau, sondern stärker von der zufälligen Zugehörigkeit zu einer bestimmten Schulklasse abhängig ist, welche Zensuren ein Schüler erreicht.“ [so muss man zu dem Ergebnis kommen], dass auch die Reliabilität oder Zuverlässigkeit traditioneller schriftlicher Arbeiten unzureichend ist.“

Bemühungen zur Verbesserung der Messqualität traditioneller schriftlicher Arbeiten Einführung von Kriterienkatalogen Einheitliche Prüfungsanforderungen Mustertexte zu „guten“ und „ausreichenden“ Leistungen Untergliederung in Teilaspekte (gedanklicher Reichtum; Aufbau und Darbietung; Stil und Ausdruck; Grammatik und Zeichensetzung; Vergleich mit Musterarbeit) „Klare Bewertungsrichtlinien, ein geeignetes Vergleichskorpus und eine wohlgeschulte Jury vorausgesetzt, lässt sich sowohl zwischen den Beurteilern als auch über die Zeit hin ein hohes Maß an Übereinstimmungen erzielen.“ (Lehmann 1988) „Eine Verbesserung wird nur zu erreichen sein, [.] wenn für die Praxis geeignete Instrumente oder vorerprobte Bausteine zur Verfügung gestellt werden und wenn [Pädagogen] auch in Beurteilungsfragen mehr als bisher zur Teamarbeit finden.“

„Schulleistungstests werden als objektive Verfahren der Lernerfolgsdiagnostik den subjektiven (traditionellen) Vorgehensweisen gegenübergestellt.“ Ingenkamp & Lissmann, 2005, 155 „Schulleistungstests sind Verfahren der Pädagogischen Diagnostik, mit deren Hilfe Ergebnisse geplanter und an Curricula orientierter Lernvorgänge möglichst objektiv, zuverlässig und gültig gemessen und durch Lehrende [z.T. auch durch Lernende] oder Beratende ausgewertet, interpretiert und für pädagogisches Handeln nutzbar gemacht werden können.“ Ingenkamp & Lissmann, 2005, 156

Diagnostik, Tests und Skalen Beispiel: jemand kommt zum Arzt und klagt über Müdigkeit. Vorgeschichte Auftreten und Art der Symptome Tests Blutdruck Bereiche „normal“, „zu niedrig“, „zu hoch“ Medikamente, um den Blutdruck zu erhöhen, Bewegung, Ernährung Überprüfung der Maßnahmen

Diagnose: Messwerte ermitteln Zusammenhang mit relevanten Größen prüfen Festgestellten Zusammenhang für unterschied- lichste Entscheidungen nutzen resp. als Anlass zu vertiefenden Analysen ► Keine Entscheidungen aufgrund „Bauchgefühl“ sondern aufgrund geprüfter Zusammenhänge! Beispiele:

Technisch-Mechanischer Verständnis-Test

Raven Standard Progressiv Matrices

d2 Aufmerksamkeits-Belastungs-Test Brickenkamp, 1962, 2002 Gruppe: Leistungstests Aspekte: - Tempo resp. Quantität - Qualität - zeitlicher Verlauf