Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Dieses Vorhaben wird aus Mitteln des Bundesministeriums für Bildung und Forschung unter dem Förderkennzeichen 01PL12033 gefördert. Die Verantwortung für.

Ähnliche Präsentationen


Präsentation zum Thema: "Dieses Vorhaben wird aus Mitteln des Bundesministeriums für Bildung und Forschung unter dem Förderkennzeichen 01PL12033 gefördert. Die Verantwortung für."—  Präsentation transkript:

1 Dieses Vorhaben wird aus Mitteln des Bundesministeriums für Bildung und Forschung unter dem Förderkennzeichen 01PL12033 gefördert. Die Verantwortung für den Inhalt dieser Veröffentlichung liegt bei den Autorinnen. Dagmar Knorr Universitätskolleg M. Andresen, D. Knorr Universitätskolleg Schreibwerkstatt Mehrsprachigkeit Von einer Datensammlung zum Korpus die Datenlage der Schreibwerkstatt Mehrsprachigkeit Melanie Andresen und Dagmar Knorr

2 Universitätskolleg M. Andresen, D. Knorr Universitätskolleg Schreibwerkstatt Mehrsprachigkeit Überblick Woher stammen die Daten? Welche Daten werden gesammelt? Wie möchten wir die Daten nutzen – Beispiel einer Suchanfrage Auf dem Weg zu einem Korpus

3 Dagmar Knorr Universitätskolleg M. Andresen, D. Knorr Universitätskolleg Schreibwerkstatt Mehrsprachigkeit Peer Tutoren Schreibberatung Aufgabe der Peer Tutoren Schreibberatung = durch Textkommentierungen und Gespräche ratsuchende Studierende unterstützen, Schreib- und Textkompetenz aufzubauen

4 Dagmar Knorr Universitätskolleg M. Andresen, D. Knorr Universitätskolleg Schreibwerkstatt Mehrsprachigkeit Datensammlung – Überblick DokumenttypDatei-Formate Datensätze Metadaten zu den Ratsuchenden.fm4 180 Texte von Ratsuchenden.doc(x),.pdf ca. 350 Texte von Ratsuchenden mit Kommentierungen von PT.doc(x) ca. 200 Texte von Ratsuchenden mit Kommentierungen von Lehrenden.pdf ca. 10 Beratungsprotokolle.fm4 213 Beratungsgespräche.mp3,.mp4,.wav,.wma ca. 35 Inhaltsübersichten zu den Beratungsgesprächen.xls 31 Transkriptionen der Beratungsgespräche.exb 2

5 Dagmar Knorr Universitätskolleg M. Andresen, D. Knorr Universitätskolleg Schreibwerkstatt Mehrsprachigkeit Beispiel – Datensatz Metadaten

6 Dagmar Knorr Universitätskolleg M. Andresen, D. Knorr Universitätskolleg Schreibwerkstatt Mehrsprachigkeit Beispiel – Datensatz Beratungsprotokoll

7 Dagmar Knorr Universitätskolleg M. Andresen, D. Knorr Universitätskolleg Schreibwerkstatt Mehrsprachigkeit Beispiel – Datenablage

8 Dagmar Knorr Universitätskolleg M. Andresen, D. Knorr Universitätskolleg Schreibwerkstatt Mehrsprachigkeit

9 Dagmar Knorr Universitätskolleg M. Andresen, D. Knorr Universitätskolleg Schreibwerkstatt Mehrsprachigkeit

10 Dagmar Knorr Universitätskolleg M. Andresen, D. Knorr Universitätskolleg Schreibwerkstatt Mehrsprachigkeit Suchanfrage stellen Suche Texte von Studierenden –mit Migrationshintergrund –angestrebter Abschluss: LA

11 Dagmar Knorr Universitätskolleg M. Andresen, D. Knorr Universitätskolleg Schreibwerkstatt Mehrsprachigkeit Suchanfrage stellen Suche Texte von Studierenden –mit Migrationshintergrund –angestrebter Abschluss: LA –Leserführung

12 Dagmar Knorr Universitätskolleg M. Andresen, D. Knorr Universitätskolleg Schreibwerkstatt Mehrsprachigkeit Dokumentauswahl als Ergebnis

13 Dagmar Knorr Universitätskolleg M. Andresen, D. Knorr Universitätskolleg Schreibwerkstatt Mehrsprachigkeit Frage Welche Software-Lösungen existieren, um solche Suchabfragen zu ermöglichen? Wie können die Metadaten sinnvoll mit den Dokumenten verbunden werden?

14 Dagmar Knorr Universitätskolleg M. Andresen, D. Knorr Universitätskolleg Schreibwerkstatt Mehrsprachigkeit + allgemeine Kommentare direkt im Text Aufbereiten der Texte

15 Dagmar Knorr Universitätskolleg M. Andresen, D. Knorr Universitätskolleg Schreibwerkstatt Mehrsprachigkeit Mögliche Fragestellungen qualitative Fragen An welchen Stellen werden Textkommentare angebracht? Wie entwickeln sich Texte durch Kommentierungen? quantitative Fragen Vorkommen von Sprechhandlungsverben Vorkommen von Funktionsverbgefügen

16 Dagmar Knorr Universitätskolleg M. Andresen, D. Knorr Universitätskolleg Schreibwerkstatt Mehrsprachigkeit Annotation (halb)automatische Annotation (Tokenisierung, Lemmatisierung, Part-of-Speech Tagging, Syntax?) manuelle Annotation –Mikroebene (z. B. Kontaminationen/Verschränkungen) –Mesoebene (z. B. Portmanns (i. Dr.) Unterscheidung von Referat, Elaboration, Deklaration) –Makroebene (z. B. Textstruktur)

17 Dagmar Knorr Universitätskolleg M. Andresen, D. Knorr Universitätskolleg Schreibwerkstatt Mehrsprachigkeit Veröffentlichung des Korpus Was muss bei der Korpuserstellung mit Blick auf eine Veröffentlichung beachtet werden? Welche der Daten sollen veröffentlicht werden? Wo kann das Korpus veröffentlicht werden?

18 Dagmar Knorr Universitätskolleg M. Andresen, D. Knorr Universitätskolleg Schreibwerkstatt Mehrsprachigkeit Fragen und Antworten?


Herunterladen ppt "Dieses Vorhaben wird aus Mitteln des Bundesministeriums für Bildung und Forschung unter dem Förderkennzeichen 01PL12033 gefördert. Die Verantwortung für."

Ähnliche Präsentationen


Google-Anzeigen