Das Korpus romanischer Zeitungssprachen

Slides:



Advertisements
Ähnliche Präsentationen
Erstellen von Raumgrundrissen mit Vorlagen
Advertisements

Fast Fourier Transformation
W- Seminar „Kanada“ Schuljahr 2010/11.
Die Schulkonsole für Lehrerinnen und Lehrer
Das Tempussystem im Französischen
Aspektuelle Verbalperiphrasen
1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.
Softwareverteilung.
IT – Struktur an Schulen
Fortbildungsprogramm für höhere Bedienstete aus der Europäischen Union und höhere Ministerialbeamte aus neuen EU-Mitgliedsstaaten sowie für hohe Beamte.
Perfekt, Possessivpronomen und Imperative Winterurlaub.
Der Einstieg in das Programmieren
Algorithmentheorie 04 –Hashing
© Karin Haenelt 2006, Operationen auf Akzeptoren und Transduktoren, ( ) 1 Operationen auf endlichen Akzeptoren und Transduktoren.
Internet facts 2006-III Graphiken zum Berichtsband AGOF e.V. März 2007.
Betreuerin: Kathleen Jerchel
Inhalte und Maßnahmen eingegeben haben,
Immerwährender Geburtstagskalender Comedison Inhalt Präsentation Folie erstellen/einrichten Meister aller Folien 16.
Ergebnisse der Makrozoobenthos-Beprobung März 2007 Vergleich detaillierter Nachweisverfahren nach BWK-Merkblatt 3 für das Morsbacheinzugsgebiet Wuppertal,
Grundschutztools
Ralf KüstersDagstuhl 2008/11/30 2 Ralf KüstersDagstuhl 2008/11/30 3.
Bild 1.1 Copyright © Alfred Mertins | Signaltheorie, 2. Auflage Vieweg+Teubner PLUS Zusatzmaterialien Vieweg+Teubner Verlag | Wiesbaden.
Automatische Übersetzungen mit Google
20:00.
Schwimmen Sie sich fit. Auch an den Feiertagen. Die Hallenbäder Loreto und Herti sind am Bettag, 18. September, für Sie offen. Von 9 bis 17 Uhr.
Selbsttest zum Modul 2 Informationstechnik
PowerPoint.
SK / , , in Hochkössen und der Wildschönau flow Ski- und Snowboardschule Intersport Menzel.
...ich seh´es kommen !.
Präsentation läuft auch vollautomatisch ab … wie du möchtest
Auslegung eines Vorschubantriebes
Analyse von Ablaufdiagrammen
Ganzheitliches Projekt-, Ressourcen- und Qualitätsmanagement 1 Reports und AddOns Auf den folgenden Seiten wird Ihnen die Funktionsweise der Reports und.
Kultureller Bildungsbetrieb Erzgebirgskreis
Neubau Feuerwehrmagazin Riedenberg Dokumentation der einzelnen Bauabschnitte –
Symmetrische Blockchiffren DES – der Data Encryption Standard
Die Kinder kommen mit Fremdsprachen in Berührung.
Agenda Rückblick 2. Aufbau der Software Benutzeroberfläche 4. Ausblick
SK / – in Hochkössen, St. Johann i.Tirol und Hochfügen flow Ski- und Snowboardschule Intersport Menzel.
PARTENARIAT ÉDUCATIF GRUNDTVIG PARTENARIAT ÉDUCATIF GRUNDTVIG REPERES KULTURELLER ZUSAMMENHALT UND AUSDEHNUNG DER IDEEN AUF EUROPÄISCHEM.
Terminübersicht für Klasse – Fachinterne Überprüfung in Frz./MuM/Te – Eurokom Englisch – FKP-
1 (C)2006, Hermann Knoll, HTW Chur, FHO Quadratische Reste Definitionen: Quadratischer Rest Quadratwurzel Anwendungen.
Analyseprodukte numerischer Modelle
2014 Januar 2014 So Mo Di Mi Do Fr Sa So
Das Verb (Zeitwort) Verben bezeichnen:
FRÜHLING.
Die Sternenuhr Wir entdecken die Wissenschaften LTAM Steffen M. 2003/04 Kneip R.
Schutzvermerk nach DIN 34 beachten 20/05/14 Seite 1 Grundlagen XSoft Lösung :Logische Grundschaltung IEC-Grundlagen und logische Verknüpfungen.
Zusammengestellt von OE3DSB
Vortrag von Rechtsanwältin Verena Nedden, Fachanwältin für Steuerrecht zur Veranstaltung Wege zum bedingungslosen Grundeinkommen der Piratenpartei Rhein-Hessen.
Der Windows-Desktop Beispiel für den Windows-Desktop.
Fakultät Informatik Institut für Angewandte Informatik, Professur Modellierung und Simulation Arbeitsgruppe Qualitätskriterien. Berlin,
Ertragsteuern, 5. Auflage Christiana Djanani, Gernot Brähler, Christian Lösel, Andreas Krenzin © UVK Verlagsgesellschaft mbH, Konstanz und München 2012.
Der Erotik Kalender 2005.
Sport4final.de. sport4final.de Leben in der Gemeinde Apostelgeschichte 4, Der Grund (Vers 32a) 2. Die Auswirkungen (Verse 32b-33) 3. Die Gemeinschaft.
Familie Beutner, Konrad-Voelckerstrasse, Edenkoben/Pfalz, Tel:
Die Qualifikationsphase in Niedersachsen
Grammatikalische Begriffe im Unterricht
1 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt Wie.
SAP Seminar 2007 Organisationsobjekte anlegen
Monatsbericht Ausgleichsenergiemarkt Gas – Oktober
Sommersemester 2015 Dr. Ileana-Maria RATCU
Kurs: Leseverstehen Kursleiter: Dr
Lexikalische Semantik
Vertretungen der Öffentlichen Bibliotheken Schulungsunterlagen der AG RDA.
er/sie/es werde fahren
FrItz Das Korpus französischer und italienischer Zeitungssprachen
Das Korpus romanischer Zeitungssprachen
 Präsentation transkript:

Das Korpus romanischer Zeitungssprachen Elisabeth Burr WiSe 2006/07

Das Korpus geschaffen als Forschungsgrundlage heterogen Ausgaben wurden so aufgenommen, wie sie erschienen Texte als ganze fremdsprachliche, dialektale und diachronische Elemente wurden nicht aussortiert Porträt der tatsächlichen Kombination von stilistischen und sozio-kulturellen Varietäten repräsentieren das vom Publikum erwartete komplexe sprachliche Wissen

Korpuserstellung http://www.uni-leipzig.de/~burr/CorpusLing/htm/Korpuserstellung/Vortrag.htm

Korpora & Subkorpora Italienische Zeitungen - Deutsche Einigung 1989 Corriere della Sera (Zeitung) 19., 20., 21.10.1989 Il Mattino (Zeitung) 20., 21.10.1989 La Repubblica (Zeitung) 20., 21.10.1989 La Stampa (Zeitung) 20., 21.10.1989 Französische, italienische und spanische Zeitungen - Europawahlen 1994 Le Monde (CD-ROM) 12./13., 14., 15.06.1994 Corriere della Sera (CD-ROM) 13., 14., 15.06.1994 La Vanguardia (Magnetband) 13., 14., 15.06.1994

Größe der Subkorpora Corriere della Sera 258.287 Wortformen Il Mattino 171.501 Wortformen La Repubblica 174.958 Wortformen La Stampa 119.771 Wortformen Le Monde 236.236 Wortformen Corriere della Sera 303.641 Wortformen La Vanguardia 261.133 Wortformen

Das Markup COCOA <S Politica> ist so lange gültig bis z. B. <S Interno> erscheint <T Occhiello> ist so lange gültig bis z. B. <T Titolo> erscheint

Bibliographische Informationen Reference Variable Beispiel Zeitung <Z> <Z La Vanguardia> Ausgabe <E> <E 130694> Ausgeweisenheit <A> signiert <A firmato> anonym <A non firmato> Autor/Autorin <N> <N Tapia Juan> Seite <C> <C 01> Sprache <L> <L Inglese>

Sparten <S> Sparte <S> <S Politica>

Textart <T> Vorzeile <T Occhiello> Schlagzeile <T Titolo> Untertitel <T Sottotitolo> Zusammenfassung <T Sommario> Zwischenüberschrift <T Catenaccio> Ankündigung <T Civetta> Artikel <T Articolo> 'Aufmacher' <T Spalla> Fernseh-, Kinoprogramm <T Programma> Filminhalt <T Film> Glosse <T Corsivo>

Textart <T> cont. Interview <T Intervista> Kolumne <T Rubrica> Kritik <T Critica> Kurzmeldung <T Flash> Kurznachricht <T Breve> Leitartikel <T Fondo> Leserbrief <T Lettera> Liste <T Elenco> Nachricht <T Notizia> Wetterbericht <T Tempo> Buch-, Film-, Liedtitel, etc. <T Nome> Bildunterschrift <T Foto>

Art des Sprechens <P> fortlaufender Text <P Prosa> Zitat von schriftlichen Quellen <P Citazione> mündliches Sprechen <P Discorso> Frage im Interview <P Domanda> Antwort im Interview <P Risposta>

Wiederholte Rede <r> Redewendung, Sprichwort, etc. <r id> restlicher Text <r nonid>

Italienisches Korpus 1989

Kodierung finiter Verbformen alle finiten Verbformen wurden kodiert $ Zahlencode statt COCOA direkt und ohne blank vor dem das Paradigma bildenden Verb eingefügt je $I110a003chante periphrastische Formen als Einheit gezählt (#) j’ai#$I111a001chanté

Zahlencode – Modi & Ebene entsprechend Kategorien des romanischen Verbalsystems aufge­baut setzt sich aus verschiedenen Ebenen zusammen zusätzlich noch die Diathese (Aktiv / Passiv) berücksichtigt differenziert sich zunächst in: C Konjunktiv <______ I Indikativ ______> B Imperativ innerhalb der Modi Unterscheidung zwischen aktueller und inaktueller Ebene: aktuelle Ebene: 1 inaktuelle Ebene: 2

Primäre Perspektive durch primäre Perspektive auf jeder Ebene abgegrenzte Zeiträume werden durch 1, 2 und 3 vertreten: Gegenwart bzw. parallele Perspektive 1 Vergangenheit bzw. retrospektive Perspektive 2 Zukunft bzw. prospektive Perspektive 3

Sekundäre Perspektive durch sekundäre Perspektive innerhalb der drei durch die primäre Perspektive abgegrenzten Zeiträume bestimmte Zeitpunkte werden durch die Zahlen 0, 1 und 2 repräsentiert Kodierung drückt somit zugleich funktionelle Relationen aus, die zwischen den einfachen und den periphrastischen Tempora innerhalb ihres gemeinsamen Zeitraums und auf der gleichen Ebene bestehen: Relation zwischen Präsens und passé composé Relation zwischen Imperfekt und Plusquamperfekt

Sekundäre Perspektive parallel 0 retrospektiv 1 prospektiv 2

Indikativ

Indikativ aktuelle Ebene inaktuelle Ebene einfache Tempora je chante I110 je chantais I210 je chantai I120 je chanterai I130 je chanterais I230 periphrastische Tempora j’ai chanté I111 j’avais chanté I211 je vais chanter I112 j’allais chanter I212 j’eus chanté I121 j’aurai chanté I131 j’aurais chanté I231

Konjunktiv

parallel chante aie chanté aktuelle Ebene chantasse eusse inaktuelle Ebene retrospektiv prospektiv

Konjunktiv aktuelle Ebene inaktuelle Ebene einfache Tempora je chante C110 je chantasse C210 periphrastische Tempora j’aie chanté C111 j’eusse chanté C211

Imperativ aktuelle Ebene inaktuelle Ebene einfache Tempora chante B110

Aktiv – Passiv – 4. Stelle Aktiv a Passiv p

Verbalperiphrasen 00 temporalen Formen 01 être en train de (Winkelschau) 02 je viens faisant (retrospektive Schau) 03 je vais (en) faisant (prospektive bzw. komitative Schau / progressive Phase) 04 je continue à faire (kontinuative Schau / Phase) 05 être sur le point de (imminentielle / ingressive Phase) 06 se mettre à (inzeptive Phase) 07 je finis de faire (regressive Phase) 08 je viens de (egressive Phase)

Person keine Unterscheidung zwischen Singular und Plural 1. Person 1

Beispiele je $I110a001chante je suis en train de $I110a011chanter j’ai $I111a001chanté Auszug aus dem Korpus beim Kodieren periphrastische Formen nicht durch # zu Einheit verbinden Zahlenkode vor Paradigma-bildendes Verb j‘ai $I111a001chanté et $I111a001mangé

Header

Texte für die Bearbeitung http://www.uni-leipzig.de/~burr/Verb/French/2006_2007/Korpus.htm

Vorgehen Teilkorpus wählen Le Monde 13.06.1994 zumindest 2 Sparten als Textdatei (!) auf Festplatte speichern (eigenen Ordner „Korpus“ einrichten) WordPad verwenden WordPad aktivieren Datei – öffnen – Dateityp Textdokumente – MS-DOS-Format (*.txt) Sparte anklicken geöffnete Sparte speichern unter an bisherigen Namen z.B. _PC für Passato composé anhängen: M130694_Sport_PC) aufpassen, dass Dateityp Textdokumente – MS-DOS-Format (*.txt) Datei immer in WordPad öffnen jedes Mal darauf achten, dass Dateityp Textdokumente – MS-DOS-Format (*.txt) vorhandenes Markup nicht verändern Zahlencode direkt vor die Formen der zu untersuchenden Verbalkategorie anfügen

im Moment nur ausprobieren werde ein Teilkorpus ganz auseinander nehmen

Hilfreiches zum Ausdrucken ausführlichere Beschreibung des Markup des Korpus von 1994