Vorläufige Ergebnisse der Testentwicklung

Slides:

Advertisements

Ähnliche Präsentationen

Der Foliensatz ist unter einer Creative Commons-Lizenz lizenziert:

Advertisements

Problemlösen am Beispiel des Rückwärtsarbeitens

? Stichwortverzeichnis … zum Suchen

Stichwortverzeichnis

Heute Mathe, morgen DLR! Dr. Margrit Klitz

Einführung in Web- und Data-Science Grundlagen der Stochastik

gemeinsam.innovativ.nachhaltig.

Wissenschaftliche Methodik

3. Schafft das Internet neue Transaktionsdesign?

Umweltbezogene Entscheidungen - multidimensionale Bewertungsverfahren -

Michael Artin: Geometric Algebra

R What is this R thing, and is it worth some effort?

3 Elektrochemische Wandler

Elektro-Skateboards Teil I Grundlagen

Stichwortverzeichnis

8 Zündung/Motormanagement

Stichwortverzeichnis

2 Elektrische Maschinen in Kraftfahrzeugen

Herstellung von kristallinen Metalloxiden über die Schmelze mit einem Spiegelofen Gruppe 8: Yuki Meier, Vivien Willems, Andrea Scheidegger, Natascha Gray.

Kapitel 4 Traveling Salesman Problem (TSP)

Markus Lips März 2017 ETH-Vorlesung, 6. Sem. Agrarwissenschaft BSc Agrartechnik II.

Einführung in die Wahrscheinlichkeitsrechnung

Motoremissionen mobiler Anlagen – Stand der Technik

Lieber Leser, liebe Leserin,

Inhaltsverzeichnis In der vorliegenden Präsentation finden Sie unter anderem Antworten auf folgende Fragen… warum ist eine Gesetzesinitiative zum Betriebliches.

Einführung in Web- und Data-Science

Algorithmen und Datenstrukturen

Algorithmen und Datenstrukturen

Industrie 4.0 für die Ausbildung 4.0

Entwicklung epistemologischer Überzeugungen

Das Verdauungssystem Präsentiert von Theresa

MasterBAV© Die neue Generation BAV

Algorithmen und Datenstrukturen

Rehwild die richtige Altersbestimmung

PSG II Neuer Pflegebedürftigkeitsbegriff und dessen Begutachtung (NBA)

Medientechnische Infrastrukturen für virtuelle und lokale Lernräume

Wissensmanagement im Zeitalter von Digitaler Transformation

«Wir bereiten uns auf die Deutschlandreise vor»

Pflege & Finanzierung 01. Juni 2017 Dr. Sonja Unteregger

Das Arbeitgebermodell in Zeiten des

Microsoft® Office PowerPoint® 2007-Schulung

Einführung in Web- und Data-Science

Pensionsrück-stellungen Prof. Dr. Matthias Hendler

Betriebliche Gesundheitsförderung 2

Vorlesung Wasserwirtschaft & Hydrologie I

Liebe BetrachterInnen,

Rosebrock: Geometrische Gruppen

Forschungsmethoden in der Teilchenphysik

Neue Unterrichtsmaterialien zur Teilchenphysik Philipp Lindenau CERN | Herzlich willkommen! Präsentation mit Notizen hinterlegt!

Eröffnungsveranstaltung

Aktuelle Themen aus dem KVJS-Landesjugendamt Referat 44

Roomtour - Podio für Anfänger

175 Jahre UZH Krisenkommunikation

Frauen- Männerriegen KONFERENZ

Schulung für Microsoft® Office SharePoint® 2007

Was ist eigentlich Datenschutz?

Aktuelle Aspekte des Europäischen Zivilprozessrechts

Einführung in die Benutzung des Einkaufportals der Eckelmann AG

Wer wir sind! Ihr S-Campus-Team direkt im Campus Center. Sven Deussing

Non-Standard-Datenbanken

Amand Fäßler 3. Januar 2017; RC Bregenz

Mathematik 11 Analytische Geomerie.

Non-Standard-Datenbanken

Menger-Schwamm Ausgangsfigur in Stufe 0 ist ein Würfel

Sortieren auf Multiprozessorrechnern

Wurzeln und Irrationalität nach U.Wagner, OHG Tuttlingen

Langzeitbelichtung Ein Zugang zur Kinematik in Klassenstufe 7/8

Eine kleine Einführung in das Projekt „Mausefallenauto“

Präsentation transkript:

Vorläufige Ergebnisse der Testentwicklung Die Folien dürfen zu nicht-kommerziellen Zwecken frei verwendet und verändert werden. Diagnose der Lesegenauigkeit, der Lesegeschwindigkeit und des Leseverständnisses mit ELFE II Vorläufige Ergebnisse der Testentwicklung

ELFE II (W. Lenhard, A. Lenhard & W. Schneider, 2017) ELFE 1-6: Weit verbreiteter Test (ca. 300 Zitationen auf Google Scholar zwischen 2006 und 2016) Neukonstruktion ELFE II stellt eine umfassende Überarbeitung der ersten Fassung dar Leseverständnistest auf 3 Ebenen: Wortebene (75 Items) Satzebene (36 Items) Textebene (26 Items) Pilotierung: Erfassung von Speed in ms und Accuracy N = 628; Kinder der Klassen 2 bis 6 (Okt. – Dez. 2014) Revision abgeschlossen: Erhebung einer repräsentativen Norm (N  4 500) 07/2015 und 02/2016 Umfassende Erfahrungen und Rückmeldungen durch Anwender -> Neue in allen Aspekten weiterentwickelt, bei Beibehaltung der Grundstruktur Test ist Standardverfahren in der Leseverständnisdiagnostik z. B. Einsatz in der IGLU-Studie 2015/2016 Itemzahlen des neuen Tests Erfassung des stillen Lesens aber auch der Worterkennungsgeschwindigkeit. Bsp 3. Klasse: Anteil an Kindern

Konstruktionsprinzipien (Textebene) Multiple Choice Aufgaben, 26 Items Modell: Kohärenz lokal global Genre narrativ expositorisch verba- tim Text Basis gist

Was ist neu im Vergleich zu ELFE 1-6? Inhaltliche Überarbeitung Bessere Differenzierung über alle Fähigkeitsbereiche: mehr leichte und schwere Aufgaben, generell mehr Aufgaben Entfernung „technologiesensibler“ Aufgaben Neues Konstruktionsprinzip beim Textverständnistest Neukonstruktion des Untertests zur Worterkennungsgeschwindigkeit Testkonstruktion Neues Testmodell (Conjoint IRT) Analyse der Testfairness Analysen anhand von Strukturgleichungen / Konstruktvalidität Altersspezifische Kurzfassungen 1 bis 3 Klasse (ohne Textverständnistest) 4 bis 7 Klasse (zeitverkürzt)

Was ist neu im Vergleich zu ELFE 1-6? Normen und Auswertung Deutliche Reduktion von Boden- und Deckeneffekten Neuer Normierungsansatz: Exakte Normen für jeden Zeitabschnitt verfügbar (1. Klasse, 9 Monate bis 7. Klasse, 3 Monate) Plausibilitätschecks (Ratewahrscheinlichkeit) Neu entwickelte Diskrepanzanalyse (analog zu Wechsler-Tests und KABC-II) Analyse des Arbeitsstils: Vergleich der Anzahl bearbeiteter und korrekt gelöster Aufgaben Keine nicht-tabellierten Werte mehr Komplette Neuentwicklung des Programms (jetzt auch serverfähig und auf Mac OS X lauffähig)

Punktzahl im Satzverständnistest nach Alter und Leistungsband (PR) Die leistungs-schwächsten 1% erreichen am Beginn der 7. Klasse nicht das Niveau, das die Leistungs-starken (PR 99%) am Ende der 1. Klasse hatten. Leichte Decken- und Bodeneffekte Bei PR1 und PR99 1 Jahr 2 Jahre 3 Jahre 4 Jahre 5 Jahre 6 Jahre

Exemplarisch: Unterschied Entwicklung Wortverständnis bei LRS Mittlerer Unterschied: 10 T-Wert-Punkte

Beispiel Entwicklung der Worterkennungsgeschwindigkeit Anteil an Kindern nach Klassenstufe und Diagnose (kein Befund versus LRS), die die Schwelle der Worterkennung von 200 ms nicht erreichen:

Hintergrund zur Testkonstruktion ELFE II Hintergrund zur Testkonstruktion

Probleme bisheriger Testkonstruktion Zu wenig Varianz in Genauigkeit bei basalen Leseprozessen Notwendigkeit, neben Genauigkeit auch Geschwindigkeit zu berücksichtigen: 𝐿𝑒𝑖𝑠𝑡𝑢𝑛𝑔= 𝐴𝑟𝑏𝑒𝑖𝑡 𝑍𝑒𝑖𝑡 Verfügbare Testtheorien limitierten bisher eine angemessene Abbildung von Leseprozessen: Konstruktion gespeedeter Leistungstests basierend auf KTT unter Verzicht weiterführender Analysemöglichkeiten und mit vielen ungeprüften Modellannahmen Konstruktion IRT-basierter Test unter Ausblendung von Lesegeschwindigkeit und mit Fokus auf hierarchiehohe Prozesse Tests wurden z. T. passend zur Testtheorie entwickelt und nicht passend zum Konstrukt

Nächster Schritt: Conjoint IRT (CIRT; Klein Entink, 2011) 1P-, 2P- or 3P-Modelle für Genauigkeit Zweites Modell für Zeitverbrauch Direkte Modellierung der Zeit durch CDF der logarithmierten Zeiten, z.B. 2*2P-Modell: 𝑃 𝑦 𝑖𝑘 =1  𝑖 , 𝑎 𝑘 , 𝑏 𝑘 =( 𝑎 𝑘  𝑖 − 𝑏 𝑘 ) 𝑃(𝑡 𝑖𝑘 ≤ 𝑡 𝑖𝑘 ′ )= (𝑙𝑜𝑔 (𝑡 𝑖𝑘 ′ )−  𝑘 −  𝑘  𝑖 ) ak, bk: Trennschärfe und Schwierigkeit : Dichtefunktion der kumulativen Normalverteilung 𝑡 𝑖𝑘 ′ >0  𝑘 : Zeitverbrauch  𝑘 : Trennschärfe (Zeit)  𝑖 : Geschwindigkeit Iterative Bestimmung der Parameter via Markov-Chain-Monte-Carlo-Algorithmus (Hierarchischer Bayes-Ansatz) Genauigkeit Geschwindigkeit Gemeinsame Modellierung von Lesegeschwindigkeit / Time Consume und Lesegenauigkeit / Textschwierigkeit möglich Konstruktion gespeedeter Tests als Sonderform adaptiven Testens möglich

Modellierung mit Conjoint IRT (R-Package cirt 2.5; Klein Entink 2013) 2 * 2P-Normal Ogive Modell: Jedes Item bekommt Trenn-schärfe und Schwierigkeits-parameter für Genauigkeit und Zeit Gleichermaßen Fähigkeit und Speed als Personenparameter Modelle können überprüft werden: Anzahl an Parametern Klassische n-PL-Modelle versus 2* n-P Fit Measure: Deviant Information Criterion (DIC; hierarchical bayesion information criterion) DIC: Unterschiede ab 10 sehr bedeutsam

Speed/Accuracy-Trade-Off beim Lesen Principal Component Analysis (PCA) mittels der Personenparameter der Subtests Parameter Faktor 1 Präzision Faktor 2 Geschwin-digkeit Wort .798 .800 Satz .878 .929 Text .883 .680

Konstruktvalidität der gespeedeten Fassung Wort1 2 = 75677.76 df = 36 p = .000 CFI = .995 RMSEA = .057 SRMR = .013 .99 Wort2 Wort .98 Wort3 .99 .91 Satz1 Lese-kompe-tenz .98 Satz 1.0 Satz2 .98 .98 Satz3 .88 Text Sehr kohärentes Modell, sehr gute Passung auf Daten Messfehlerbereinigt ist Satzebene am prädiktivsten .94 Text1 .90 Text2 .93 Text3

ELFE II Das Computerprogramm

Testdurchführung Elfe und Mathis geben die Instruktionen in der Computertestung und sie begleiten die Kinder durch die Testung.

Instruktionsaufgabe des Wortverständnistests

Instruktionsaufgabe des Satzverständnistests

Instruktionsaufgabe des Testverständnistests

Eingabe von Ergebnissen der Papiertestung Sowohl in der Papier- wie in der Computerfassung wird die Anzahl an richtigen und bearbeiteten Aufgaben getrennt voneinander ausgewertet. Die Anzahl richtiger Lösungen dient der Ermittlung des Gesamtergebnisses, der Vergleich zu den Normen der Anzahl an bearbeiteten Aufgaben der Ermittlung der Lesegenauigkeit.

Ergebnisdarstellung

Normwertabfrage Außerhalb von Testungen lassen sich Normwerte auch direkt einzeln mit hoher Genauigkeit abfragen und Listen von Schülern einlesen und automatisiert auswerten.