Dr. Helmuth Sagawe WS 2010/11 Universität Heidelberg Erschließung von qualitativem Wissen aufgrund einer Fragestellung aus einem Textkorpus Dr. Helmuth Sagawe WS 2010/11 Universität Heidelberg
Textkorpora Korpora geschriebener Gegenwartssprache des IDS http://www.ids-mannheim.de/kt/projekte/korpora/ Bestand: über 2 Milliarden Token DWDS-Korpus http://www.dwds.de/ Bestand: 1.2 Milliarden Token (intern), 100 Millionen Token (öffentlich) Schweizer Textkorpus http://www.schweizer-textkorpus.ch/ Im Testbetrieb besteht das Korpus nun aus etwa 10 Mio. Token. Im Endausbau sind 20 Mio. Token geplant. Dortmunder Chatkorpus http://www.chatkorpus.uni-dortmund.de/ Bestand: 1.1 Mio. Token aus 150'000 Chat-Beiträgen. British National Corpus (BNC) http://www.natcorp.ox.ac.uk/ Bestand: über 100 Millionen Token
Der Weg über die quantitative Analyse von Textmengen zur qualitativen Aussage
- Fragestellung erarbeiten - geeignete Textkorpora zusammenstellen oder - vorhandene (im Internet zugängliche) Korpora auf die Operationalisierung der Fragestellung hin überprüfen - geeignete Analyseprogramme finden
Textanalyseprogramme TACT OCP Tustap Monoconc Opentext Saga lexa
Analysemöglichkeiten 1. Wordliste erstellen /Häufigkeitsverteilung 2. Type/ Token Verhältnis prüfen / bewerten 3. Konkordanz zu bestimmten Begrifflichkeiten erstellen 4. Semantisches Umfeld der untersuchten Begrifflichkeit prüfen
Aufgabe: Bitte versuchen Sie zu analysieren, in welchen Kontexten und Begrifflichkeiten das Wort „Terror“ in der heutigen aktuellen Diskussion vorkommt. Erstellen Sie mit Texten aus dem Internet ein Textkorpus in WORD, Speichern Sie dieses als TXT-Datei ab Führen Sie eine kurze (Wordliste/ Konkordanz) Analyse mit MONOCONC durch 4. Verbalisieren Sie die Ergebnisse in einer Mail an mich (sagawe@t-online.de) auf ca. einer halben Seite. Bitte alle Namen der Gruppenarbeit mit aufführen.