Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Wiedenmayer, Dafni Universität Athen Die Bewertung der produktiven Sprachaktivitäten AILA World Congress 2008AILA World Congress 2008, Essen, 28.8.2008.

Ähnliche Präsentationen


Präsentation zum Thema: "Wiedenmayer, Dafni Universität Athen Die Bewertung der produktiven Sprachaktivitäten AILA World Congress 2008AILA World Congress 2008, Essen, 28.8.2008."—  Präsentation transkript:

1 Wiedenmayer, Dafni Universität Athen Die Bewertung der produktiven Sprachaktivitäten AILA World Congress 2008AILA World Congress 2008, Essen,

2 bei den geschlossenen als auch bei den halboffenen Aufgaben ist der Ablauf der Testbewertung schnell, einfach und objektiv Bei den offenen Aufgaben erschwert sich dieser Prozess Die Bewertung eines Sprachtests kann sehr unterschiedlich ausfallen, und dies hängt von verschiedenen Faktoren ab

3 Solche Faktoren sind: die R ü ckwirkung des Tests das Profil der Bewerter das Bewertungssystem (bzw. Skalen, Raster und Kriterien)

4 Washback Effekt Die Rückwirkung von Tests auf die Mikro- und die Makroebene ist von großer Bedeutung, denn nur wenn ein Test eine positive Rückwirkung hat, kann er auch nützlich sein. Die sprachliche Norm, die die Forscher in ihrem Kopf haben, und im Rahmen derer die Tests stattfinden, beeinflusst die Ergebnisse (Fragoudaki 1985, Wiedenmayer 2006)

5 Die Ergebnisse des Tests beeinflussen im Voraus die Performanz der Kandidaten, d.h. auch die Augenscheinvalidität des Tests. 1. Frage Bestimmung der sprachlichen Norm

6 Das Profil der Bewerter Die Bewerter haben die schwere Aufgabe, die Entscheidung über die Qualität des Geschriebenen, bzw. des Gesprochenen zu treffen Bei geschlossenen Aufgaben, wie z.B. bei einer Multiple - Choice Aufgabe, ist es besonders leicht zu bewerten, oft auch ohne menschliche Einmischung. Problematisch erweist sich trotzdem die Bewertung der Produktion mündlichen und schriftlichen Ausdrucks. Altmeyer und Domisch (1998:6) Macaire (1998:10)

7 Wenn verschiedene Bewerter unterschiedliche Noten für die gleiche Arbeit geben, geht es um fehlende interpersonale Konstanz. Falls die Bewertungen eines Bewerters, die zu verschiedenen Zeitpunkten durchgeführt werden, nicht übereinstimmen, handelt es sich um mangelnde intrapersonale Konstanz (Glaboniat b, 1998)

8 Tschirner (2001) erwähnt einige Gründe zur Erklärung dieser mangelnden Inter- und Intrakonsistenz: Die Bewerter sind von ihren eigenen kulturellen Erfahrungen, von ihrem Fachgebiet, sowie von ihren früheren Erfahrungen in Bewertungen von Texten beeinflusst worden Auch eine Ablehnung oder Zustimmung mit dem Inhalt des Textes kann durch einen emotionalen und auch unbewussten Einfluss des Bewerters das Ergebnis ändern Die Konzentration besonders unerfahrener Bewerter auf Grammatik, Rechtschreibung und Interpunktion ändert das Ergebnis

9 Diese Defizite können durch eine gute Schulung der Bewerter beseitigt werden. Neben der Schulung ist auch die mehrfache Bewertung einzusetzen, damit die Subjektivität begrenzt und die Zuverlässigkeit des Tests erhöht wird. 2. Frage gute Schulung mehrfache Bewertung

10 Vorschläge zu 1. und 2. Bestimmung der sprachlichen Norm (Testentwickler) Mehrfache Bewertung (Testentwickler) Gute Schulung der Bewerter (Testdurchführung - Adressatengruppe)

11 Es werden, anhand einer empirischen Forschung, Unterschiede zwischen 36 Bewertern bei der Bewertung eines Aufsatzes gezeigt. Die empirische Forschung

12 Das Thema der Prüfung Sie leben mit einer oder mehreren Personen in einer Wohnung. Plötzlich merken Sie, dass Sie etwas brauchen und gehen dies kaufen. Hinterlassen Sie Ihrem Partner/ Ihrer Partnerin bzw. Ihren Mitbewohnern eine kurze Notiz von höchstens 50 Wörtern. Diese Notiz sollte Informationen zu folgenden Punkten beinhalten: Was wollen Sie kaufen? Warum brauchen Sie dies unbedingt? Wann kommen Sie zurück? Bitten Sie Ihre Mitbewohner, etwas für Sie zu erledigen, da Sie keine Zeit mehr dazu hatten! Unterschreiben Sie als Alexis oder Alexia! Planen Sie für diese Aufgabe ungefähr 15 Minuten ein!

13 Die sprachliche Norm Kommunikationssituation Alltägliche Kommunikationssprache Textsorte und -länge Punkte als Plan Bekannte Aufgabenstellung (griechisches Staatszertifikat KPg)

14 Die Kandidaten SA Prüfung im Rahmen der Staatszertifikat-Prüfung (KPg) im November Probanden auf dem B2 Niveau 3 Schüler (S) an privaten Sprachinstitute 3 Germanistikstudenten (St) der Universität Athen

15 Das Profil der Bewerter 36 (35+1) Germanistikstudium (Diplom) Master (Richtung: Leistungsmessung- Leistungsbeurteilung) Schulung (für diese Prüfung)

16 Das Bewertungssystem Gemischtes (holistisch – analytisch) Bewertungssystem Das Bewertungssystem, anhand dessen, das Raster und die Bewertungskriterien (gilt auch für das griechische Staatszertifikat KPg entwickelt wurden, könnte gemischtes Bewertungssystem genannt werden, da es Elemente sowohl vom holistischen als auch vom analytischen System beinhaltet (s. auch Τsopanoglou 2000). Genauso funktioniert auch das Bewertungsverfahren bei TestDaF (www.testdaf.de).

17 Τσοπάνογλου (2000:116), übersetzt von Giakumelu (2005): Wichtigeres und allgemeines Kriterium: z.B. Kommunikative Fähigkeit Erstes Nebenkriterium: z.B. Morphosyntaktische Korrektheit Zweites Nebenkriterium: z.B. Textsortenangemessenheit Besonders befriedigend I20 19 II18 17 III16 15 Befriedigend IV14 13 V12 11 VI10 9 Ungenügend VII8 7 VIII6 5 IX4 3 X2 1

18 Anhand dieser Skala werden drei Kriterien vorbestimmt, aber die Punkte für jedes einzelne Kriterium werden nicht addiert. Zunächst geht es um eine erste, globale Bewertung auf Grund eines vorbestimmten Hauptkriteriums, dann kommt eine zweite auf Grund des zweiten Kriteriums und danach eine dritte anhand des dritten Kriteriums. Die erste Bewertung bestimmt den Rahmen, in dem die zwei weiteren Kriterien bewertet werden können.

19 Wenn z. B. ein Text auf Grund des ersten Kriteriums als Besonders Befriedigend bewertet wird, kann dieser Text mit einer Punktzahl nur zwischen 15 und 20 bewertet werden. Auch wenn die zwei anderen Kriterien als ungenügend betrachtet werden, können den Endpunkt nicht unter 15 gestalten. Im Gegensatz dazu kann ein Text, der bezüglich des zweiten und des dritten Kriteriums als befriedigend betrachtet, der aber im Hinblick auf das erste Kriterium als ungenügend bewertet wurde, nicht mehr als 8 Punkte (maximale Punktzahl: 20) erreichen. Daraus lässt sich schlussfolgern, dass das erste Kriterium die oberen und die unteren Grenzen bestimmt, innerhalb deren sich die zwei anderen Kriterien bewegen können. Auch das zweite Kriterium bestimmt erneut die Grenzen, innerhalb deren sich das dritte Kriterium bewegen kann.

20 1.Stadium: Holistische Bewertung zur Messung des ersten Hauptkriteriums 2.Stadium: Analytische Bewertung wegen der Berücksichtigung der zwei weiteren Kriterien 3.Stadium: Holistische Bewertung jedes einzelnen Kriteriums anhand eines positiven oder negativen Eindrucks. Dieses alternative System gilt als ein gemischtes Bewertungssystem, das sich darum bemüht, die positiven Eigenschaften beider Systeme zu kombinieren (www.testdaf.de, Tsopanoglou 2000, Giakumelu 2005, Wiedenmayer 2006)www.testdaf.dewww.ypepth.gr

21 BEWÄLTIGUNG DER KOMMUNIKATIVEN AUFGABE TEXTAUFBAU UND LEXIKALISCHE KOMPETENZ GRAMMATISCHE/ ORTHOGRAPHISCHE KORREKTHEIT ITEM 1 ITEM 2 ITEM 3 Umfassend bewältigt Befriedigend 6159 Nicht befriedigend5,5148 Nicht befriedigendBefriedigend5137,5 Nicht befriedigend4,5127 Mit Mängeln, aber befriedigend bewältigt Befriedigend 4106 Nicht befriedigend3,595 Nicht befriedigendBefriedigend384,5 Nicht befriedigend2,574 Nicht befriedigend bewältigt Befriedigend 253 Nicht befriedigend1,542 Nicht befriedigendBefriedigend131,5 Nicht befriedigend0,521 Entspricht nicht der Aufgabenstellung, keine Antwort ΚPg – Phase II – B2

22 Bewertungskriterien - B2 Niveau Α. Bewältigung der Aufgabe Ausführliche, zusammenhängende und differenzierte Beschreibung oder Bericht und dabei auch Verbindung aller Themenpunkte miteinander; Ausführen einzelner Aspekte und geeignete Schlussfolgerung. Ausführliche Darstellung der Standpunkte und Stutz von geeigneten Beispielen oder Begründungen durch Unterpunkte. Sprachliche Mängel beeinträchtigen das Textverständnis nicht. B. Textaufbau und lexikalische Kompetenz Gut strukturierter Text und angemessene Verwendung von verschiedenen Mitteln zur Textverknüpfung. Auswahl von umfangreichen Formulierungen ohne Einschränkungen. Beherrschung eines großen Wortschatzes und problemloses Gebrauchen von Umschreibungen. Offensichtliches Suchen nach Worten oder der Rückgriff auf Vermeidungsstrategien sind selten. Gelegentliche kleinere Schnitzer, aber keine größeren Fehler im Wortgebrauch. C. Grammatische und orthographische Korrektheit Beständiges Beibehalten eines hohen Maßes an grammatischer Korrektheit; Fehler sind selten und fallen kaum auf. Die Gestaltung, die Gliederung in Absätze und die Zeichensetzung sind konsistent und hilfreich. Die Rechtschreibung ist, abgesehen von gelegentlichem Verschreiben, richtig. Nach: Gemeinsamer Europäischer Referenzrahmen für Sprachen (2001)

23 Die Ergebnisse der empirischen Forschung Texte – Gruppe A – (S) Lieber Andreas! Ich möchte Heute Abend einen Besuch machen. Da die Strümpfe schmutzig sind muss ich ein paar Neue kaufen. Ich bin jetzt in einem Geschäft das in der Stadtmitte liegt. Ich werde um 9 Uhr nach Hause zurück gehen. Ich Bitte dich die Heizung offnen. Ghüss bis bald, Alexis Mein Satz! Ich möchte Schokoladenkuchen backen und ich gehe Zucker kaufen! Schokoladenkuchen ohne Zucker gibt es nicht! Ich komme um 2 zurück! Spüll bitte die Tella! Alexia Liebe Maria, ich gehe Milch, Zucker, Essig, Mehl und eine Hose kaufen. Meine alte Hose ist kaputt und ich brauche eine neue! Kannst du bitte die Katze fressen? Ich komme am Nachmittag zurück! Alexis

24 Die Ergebnisse der empirischen Forschung Texte – Gruppe B – (St) Schatz, bin kurz bis zum Supermarkt gefahren, da im Kühlschrank keine süße Sahne mehr gab und ich heute Lust auf Carbonara habe. Falls du noch was willst, ruf mich auf den Handy an. Bin höchstens in 20 min. zurück. Wärst du so lieb schon mal die Nudeln zu kochen, bis ich wieder da bin. Danke, Alexia Hallo Eleni! Wie geht΄s? Mir nicht so gut. Mein Kopf tut weh und ich brauche unbedingt Medikament. Ich gehe zur Apotheke. Ich komme in circa 30 Minuten zurück. Könntest du bitte Maria meine Bücher geben? Sie wird vorbeikommen und sie braucht sie für eine Hausarbeit. Meine Bücher sind im Buchregal. Bis bald also, Alexia Fahre kurz in die Stadt, zum Supermarkt. Ich muss dringend Bier u. tiefgefrorene Pizza kaufen. Am Abend kommen die Jungs vorbei u. den Film angucken. Komme in einer Stunde zurück. Würdest du inzwischen die Waschmaschine anstellen, da ich keine Zeit habe? Das wäre super von dir

25 Die Benotung der sechs Texte von 11 Bewertern ΚPg Raster (Staatszertifikat ) 6 Max.Punktzahl BEWERTER S 1,55,5 4,55,54,55,5 4,53,5 2 S 3,55,56 4,53,54,55,53,55,53,5 3 S 3,55,56 4,5 5,54,5 2 4 St 465, St 45, St 65,

26 Nur im 6. Text (perfekten Text) einig! Bei den anderen die Beschreibung der Kriterien anders verstanden! Die Beschreibung erneut formulieren Gemeinsamer Europäischer Referenzrahmen für Sprachen Kannbeschreibung soll jedesmal nach dem Prüfungsziel geeignet beschrieben werden Normsprache für die innere Kommunikation (Testentwickler – Bewerter)

27 ΚPg Raster (Staatszertifikat )6 Max. Punk tzahl BEWERT ER S1S 1,55,5 4,55,54,55,5 4,53,5 2S2S 5,56 4,53,54,55,53,55,53,5 3S3S 5,56 4,5 5,54,5 2 4 St 465, St 45, Die Benotung der sechs Texte von 11 Bewertern BEWÄLTIG UNG DER KOMMUNIK ATIVEN AUFGABE TEXTAUFBAU UND LEXIKALISCH E KOMPETENZ GRAMMATIS CHE/ ORTHOGRAP HISCHE KORREKTHE IT ITEM 1 Umfassend bewältigt Befriedigend 6 Nicht befriedigend 5,5 Nicht befriedigend Befriedigend 5 Nicht befriedigend 4,5 Mit Mängeln, aber befriedigen d bewältigt Befriedigend 4 Nicht befriedigend 3,5 Nicht befriedigend Befriedigend 3 Nicht befriedigend 2,5 Nicht befriedigen d bewältigt Befriedigend 2 Nicht befriedigend 1,5 Nicht befriedigend Befriedigend 1 Nicht befriedigend 0,5 Entspricht nicht der Aufgabenstellung, keine Antwort

28 Der Test hat Augenscheinvalidität Der Test ist valid Der Test ist nützlich Positive Rückwirkung

29 Das Profil der Bewerter 36 (35+1) Germanistikstudium (Diplom) Master (Richtung: Leistungsmessung- Leistungsbeurteilung) Schulung (für diese Prüfung)

30 Die Normsprache und das Bewertungssystem Die Normsprache als innere Kommunikationssprache zwischen Testentwickler und Bewerter soll bestimmt werden Kode finden

31 Diese innere kodierte Kommunikationssprache soll auch für die Beschreibung der Bewertungskriterien gelten Die Normsprache und das Bewertungssystem

32 so… Danke Dafni Wiedenmayer, Essen AILA 2008


Herunterladen ppt "Wiedenmayer, Dafni Universität Athen Die Bewertung der produktiven Sprachaktivitäten AILA World Congress 2008AILA World Congress 2008, Essen, 28.8.2008."

Ähnliche Präsentationen


Google-Anzeigen