Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Matura in den Erstsprachen Grundlagen der Testpsychologie: Reliabilität und Validität Wien, 15. Oktober 2010 ao.Univ.Prof. Mag. Dr. Guenther Sigott.

Ähnliche Präsentationen


Präsentation zum Thema: "Matura in den Erstsprachen Grundlagen der Testpsychologie: Reliabilität und Validität Wien, 15. Oktober 2010 ao.Univ.Prof. Mag. Dr. Guenther Sigott."—  Präsentation transkript:

1 Matura in den Erstsprachen Grundlagen der Testpsychologie: Reliabilität und Validität Wien, 15. Oktober ao.Univ.Prof. Mag. Dr. Guenther Sigott Language Testing Centre Alpen-Adria-Universität Klagenfurt

2

3 Fairness / Objektivität
Ist klar, was getestet wird? Konstrukt Testmethode Ist der Zweck der Prüfung klar? Welche Folgen haben die Testergebnisse? Bevorteilt die Prüfung bestimmte Gruppen von Kandidaten? Ethnische Gruppen? Sozioökonomische Gruppen? Geschlecht? Menschen mit Behinderungen? Hängt das Resultat davon ab, wer die Prüfung durchführt? ‘hilfsbereite’ oder weniger ‘hilfsbereite’ Testadministratoren Hängt das Resultat davon ab, wer die Prüfung beurteilt? Beurteilungskriterien Werden die Prüfungsergebnisse richtig interpretiert? Was misst die Prüfung und was wird behauptet, dass sie misst? Gibt es fundierte Prozeduren zum Setzen von cutscores? Bleibt die Schwierigkeit der Prüfung über verschiedene Prüfungstermine hinweg konstant?

4 Fairness / Objektivität resultiert aus Reliabilität und Validität
Reliabilität bedeutet Zuverlässigkeit. Das Ergebnis der Prüfung eines Kandidaten soll nicht vom Zufall abhängen, also nicht davon, wer beurteilt, oder wann und an welchem Ort beurteilt wird. Das Ergebnis soll auch nicht davon abhängen, welche Aufgabe gestellt wurde, sondern soll dasselbe sein auch wenn eine andere – vergleichbare - Aufgabe gestellt würde. Validität setzt Reliabilität voraus. Validität ist gewährleistet, wenn die Prüfung jene Fähigkeiten misst, die gemessen werden sollen. Wie kommen Reliabilität und Validität zustande?

5 beurteilen v.t. Etwas beurteilen – was?
Jemanden beurteilen – im Hinblick auf was? Beurteilung ist unmöglich, wenn wir uns über das WAS nicht im Klaren sind.

6 lehren v.t. Etwas lehren – was? Jemanden etwas lehren – was?
Lehren ist unmöglich, wenn wir uns über das WAS nicht im Klaren sind.

7 Warum sich den Kopf über das WAS zerbrechen?
Es ist wichtig, zu wissen was wir lehren wollen und was unsere Schüler lernen sollen (Lehr- und Lernziele). Es ist wichtig, zu wissen, was wir messen wollen (Testkonstrukte). I’ll be focussing on testing, not teaching and the centrality and importance of construct and method for fair assessment. I’d like to discuss the importance of the WHAT, but also of the HOW, using the example of the Austrian BHS Matura exam.

8 WHAT: curricular objectives / test construct
Fragen 1&2: Ist es klar, was gemessen werden soll und was tatsächlich gemessen wird? WHAT: curricular objectives / test construct Models of language competence Curriculum CEF HOW: test method

9 Origins of the WHAT

10 L.F. Bachman, Fundamental Considerations
in Language Testing, OUP 1990, p. 87.

11 E8 Reading Strategies (extract)
Careful Reading Understanding the Text understanding explicitly stated main idea(s) and / or distinguishing that from supporting details locating, identifying, understanding and comparing facts, opinions, definitions (this includes search reading strategies) understanding the logical organisation of the text, e.g. understanding relationships among ideas in a text (problem – solution, cause – effect, temporal sequence, etc.) understanding cohesive relationships (reference, ellipsis, substitution, conjunction, lexical cohesion) making propositional inferences (deducing information that is not explicitly stated from information that is explicitly stated) Adapted from Urquhart & Weir 1998

12 CEF Overall Written Production
Can write clear, well-structured texts of complex subjects, underlining the relevant salient issues, expanding and supporting points of view at some length with subsidiary points, reasons and relevant examples, and rounding off with an appropriate conclusion. B2 Can write clear, detailed texts on a variety of subjects related to his / her field of interest, synthesising and evaluating information and arguments from a number of sources.

13 Kompetenzmodell schriftliche RP

14 WIE? Was tun wir, um den Schülern Gelegenheit zu geben, ihre Komptenzen zur Schau zu stellen?

15 Item 1 You are asking your friend a lot of questions about him and his family. Choose the right answer for each of the questions (there is only one correct answer per question!) and fill in the empty boxes with the correct number.

16 Item01 Test format: Grammar, Matching activity (2nd grade AHS)
You are asking your friend a lot of questions about him and his family. Choose the right answer for each of the questions (there is only one correct answer per question!) and fill in the empty boxes with the correct number. 1 Can Tom drive a car? Yes, they have. 2 Is your brother good at swimming? No, she isn’t. 3 Are you listening to the radio? Yes, I have. 4 Have you got a cousin? Yes, it is. 5 Can you come to our barbecue? No, he isn’t. 6 Does your sister go to nursery school? No, they can’t. 7 Has your aunt got a husband? Yes, we are. 8 Do your parents often go out in the evenings? No, I don’t. Yes, we do. No, they haven’t. No, we can’t. Yes, he can. No, they don’t. Yes, she can. Yes, she has. No, she doesn’t.

17 Is your brother good at swimming?
Item 1 Tick the answer which is grammatically correct: Is your brother good at swimming? Yes, he can. Yes, you are. Yes, he does. No, he isn’t.

18 Test Method in Writing and Speaking Resist the temptation: keep method distinct from construct
You will have 10 minutes to do this task. Read the instructions carefully and then write your text on the separate sheet. Your short letter or should be 40 to 60 words long. Your American aunt has sent you a birthday present. Write a short letter or an to say thank you. Tell your aunt you really liked your present and why it is useful for you. You can also ask her if you could visit her in your summer vacation. You could start your letter like this: Dear Aunt Lizzy: If you rate the resulting text for Grammar, what is construct, what method?

19 Test Method in Writing and Speaking Resist the temptation: keep method distinct from construct
Du hast für diese Aufgabe 10 Minuten Zeit. Lies die Anleitung gut durch und schreib Deinen Text auf das beiliegende Blatt. Dein kurzer Brief oder Deine soll 40 bis 60 Wörter lang sein. Deine Tante in Amerika hat Dir ein Geburtstagsgeschenk geschickt. Schreib einen kurzen Brief oder eine , um dich zu bedanken. Sag Deiner Tante, dass Dir das Geschenk sehr gut gefällt und warum Du es gut gebrauchen kannst. Du kannst sie auch fragen, ob Du sie in den Sommerferien vielleicht besuchen kannst. Du könntest Deinen Brief so beginnen: Dear Aunt Lizzy: If you rate the resulting text for Grammar, what is construct, what method?

20 Test Method ctd. If you rate the resulting text for Vocabulary, what is construct, what method? If you rate the resulting text for Cohesion and Coherence, what is construct, what method?

21 Test Method in Writing and Speaking Resist the temptation: keep method distinct from construct
Du warst vor ein paar Tagen bei der Geburtstagsparty Deines Freundes/Deiner Freundin. Schreib ihm/ihr ein , um ihm/ihr zu sagen, dass Dir die Party gefallen hat. Sag ihm/ihr, warum Dir die Party gefallen hat. Sag ihm/ihr, was Dir am besten gefallen hat. Frag ihn/sie, wann ihr einander wiedersehen könnt. Mach einen Vorschlag für das kommende Wochenende. If you rate the resulting text for Vocabulary, what is construct, what method? If you rate the resulting text for Cohesion and Coherence, what is construct, what method?

22 Also? Um zu beschreiben, was die Prüfung messen soll, müssen wir zwischen Konstrukt und Methode klar unterscheiden. Wir wollen das Konstrukt messen und nicht die Fähigkeit, mit der Methode zu Rande zu kommen.

23 Fragen 2 - 5: Misst die Prüfung in allen Schulen dasselbe
Fragen 2 - 5: Misst die Prüfung in allen Schulen dasselbe? Gibt es Parallelformen? Wird die Prüfung jedes Jahr dasselbe messen? Sind die Resultate von Jahr zu Jahr vergleichbar? Combining construct and method will lead to an exam. Once we have an exam, we need to ask a few discomforting questions. Wenn wir Klarheit über den Unterschied zwischen Konstrukt und Methode haben, sind wir in der Lage, diese Fragen zu diskutieren. Verwendung derselben Prüfung in allen Schulen? Verwendung derselben Prüfung in allen Jahren? (eine theoretische Möglichkeit) Entwicklung von Parallel-Prüfungen, die dieselben Dinge messen und die gleich schwierig sind.

24 Gütekriterien für jeden Test
Reliabilität (Zuverlässigkeit): Beurteilungen müssen zuverlässig sein. Interrater-Reliabilität: Übereinstimmung zwischen verschiedenen Ratern. Intrarater-Reliabilität: Übereinstimmung desselben Raters mit sich selbst zu verschiedenen Zeiten. Validität: Beurteilungen müssen das widerspiegeln, was beurteilt werden soll. Wenn “Erfüllung der Aufgabe” beurteilt werden soll, dürfen nicht Grammatik und/oder Textaufbau mitbeurteilt werden. > ASSESSORENTRAINING!!!

25 Frage 6: Misst die Prüfung tatsächlich was sie messen soll?
Konstrukt + Methode ergeben eine Prüfung, die vermutlich das misst, was wir messen wollen. Wir sind allerdings verpflichtet, nachzuweisen, dass wirklich das gemessen wird, was gemessen werden soll. Wir müssen Nachweise für die Reliabilität und die Validität erbringen. Reliabilität: Messen wir überhaupt irgendetwas oder weisen wir bloß Schülerperformanzen Zahlen nach Zufallsprinzip zu? Voraussetzungen zur Sicherstellung von Reliabilität: - Beurteilungsskalen - ausgebildete Assessoren, die die Beurteilungsskalen gleichermaßen anwenden - wer die Prüfung durchführt, darf keinen Einfluss auf das Ergebnis haben - wer die Prüfung beurteilt, darf keinen Einfluss auf das Ergebnis haben Validität: Messen wir das, was wir messen wollen? Zielen die Dimensionen der Beurteilungsskala auf jene Aspekte des Kompetenzmodells ab, ie von Interesse sind? Begleitforschung ist gefragt: - Inhaltliche Validierung - Konstruktvalidierung Being clear about construct and method and taking the measures to ensure reliability are good foundations for a valid exam. However, in the long run, we would like to see evidence of validity.

26 Grundlage für Beurteilungsskalen
Dimension 1 …………………………… Dimension 2 ……………………………… Dimension 3 Dimension 4 ………………………………… sehr gut (1) gut (2) befriedigend (3) genügend (4)

27 Dimensionen vs Niveaus
Dimensionen sind die Maßstäbe, mit denen wir die Fähigkeiten in einem Bereich messen, z.B. Erfüllung der Aufgabe, Textaufbau, Wortschatz, Grammatik/Rechtschreibung Niveaus sind die Marken auf dem Maßband. Diese können mit Deskriptoren beschrieben werden.

28 Analytische Skala: Entwurf 01
Beurteilungsbogen Deutsch.doc Beurteilungsbogen Deutsch_01.doc

29 Bezugsnorm Normreferenzierung: Ergebnis wird im Hinblick auf den Mittelwert der Stichprobe interpretiert. Kriteriumsreferenzierung: Ergebnis wird im Hinblick auf ein bestimmtes Niveau (Prüfungsziel – inhaltlich definiert) interpretiert.

30 RP neu ist kriteriumsreferenziert
Berichtsfunktion: was kann der/die KandidatIn? Selektionsfunktion: ist der/die KandidatIn für bestimmte Berufe oder für das Universitätsstudium geeignet?

31 Thank you. Danke. Merci.


Herunterladen ppt "Matura in den Erstsprachen Grundlagen der Testpsychologie: Reliabilität und Validität Wien, 15. Oktober 2010 ao.Univ.Prof. Mag. Dr. Guenther Sigott."

Ähnliche Präsentationen


Google-Anzeigen