Dr. Helmuth Sagawe WS 2010/11 Universität Heidelberg

Slides:

Advertisements

Ähnliche Präsentationen

Zusammenfassungen der EU-Gesetzgebung: eine Einführung 2008

Advertisements

Charlotte Schubert, Gerhard Heyer Universität Leipzig

Wir wünschen viel Erfolg

Dr. Christian Hänger, Magnus Pfeffer

Sprachen lernen mit Neuen Medien

Korpusanalyse und Forschungsfrage Korpusbasierte Wissenserschließung (Übung) im WS 2010/11 von Dr. phil. Helmuth Sagawe M.A.

1 Sprachressourcen-Gipfel IDS Mannheim Mai 2009 Bayerisches Archiv für Sprachsignale Florian Schiel & Christoph Draxler schiel |

eine Plattform für annotierte Korpora in XML

Antrag und Programmablauf Barbara Burr, RUS. Barbara Burr, Rechenzentrum Universität Stuttgart, Einige Fakten Self-study online läuft insgesamt.

Universität Stuttgart Institut für Kernenergetik und Energiesysteme RUP in der Praxis Zum RUP existiert eine online Version. Mit dieser Version können.

Der Umgang mit qualitativ erhobenen Daten: Strategien der Datenanalyse

1 Automatische Klassifikation von Nomen nach Begriffstyp Christof Rumpf Heinrich-Heine-Universität

EINI-I Einführung in die Informatik für Naturwissenschaftler und Ingenieure I Vorlesung 2 SWS WS 99/00 Gisbert Dittrich FBI Unido

ExKurs Export 1/8 Dr. Barbara Hoffmann LiteraturKompetenz Daten Exportieren Die Option Exportieren ermöglicht Ihnen, mit den thematisch in Projekten.

Qualitätskriterien zur Beurteilung von Dokumentationen

Peter Schmidt, Hochschule Bremen1 Herzlich Willkommen !! zur VOLKSWIRTSCHAFTslehre 1.) Mikroökonomie Peter Schmidt schmidt-bremen.de -> VWL 1 DSBW.

Recherche im Ein einführendes Tutorial Informationssystem Medienpädagogik

Wortschatz in der Oberstufe

Forschungs-Verbundprojekt des Landes Baden-Württemberg "Vom Markt zum Produkt". Projekt-Koordination: wbk Projekt-Partner: ETU, mkl, RPK, wbk, WOP Informationen.

Allgemeine Informationen

Allgemeine Informationen

Entitäten Extraktion Wichtige Schritte Petra Maier WS 05/06.

Titel des Vortrags Name des Vortragenden Seminar

Simulation komplexer technischer Anlagen

Entwicklung standardorientierter Aufgaben – am Beispiel naturwissenschaftliche Erkenntnisgewinnung Jürgen Mayer.

Seniorkom.at vernetzt Jung & Alt Das Internet ist reif

NEVP Noteneingabe- und Notenverwaltungsprogramm © Erklärungen zu Funktionen und Anwendungen, erstellt am 24. August 2007.

Deutsche einsprachige Korpora немецкие одноязычные корпуса Institut für Slawistik Seminar: Slawische Korpuslinguistik SS 2006 O. Prof. Dr. Branko Tošović

Hellmut Riediger Recherchieren: Grundsätze und Grundbegriffe

Fressen Tiger Menschenkinder? Eine Einführung ins Internet als Quelle MATA -Workshop 2010.

...na, schon ausgelernt?. Pharm x plorer Focus Pharm x plorer Focus ist eine anerkannte Fortbildung der österreichischen Apothekerkammer in Zusammenarbeit.

Gefördert durch: Geschäftsführungskonferenz der BAG SELBSTHILFE e.V. am 29. April 2011 in Königswinter.

„Suchen im Internet“ - Aufgaben -

Analyse eines Gemäldes und Internet-Recherche

Anglo-Amerikanische Korpuslinguistik Anglo-American Corpus Linguistics Erstellt von Gudrun Krenn Slawische Korpuslinguistik SE SS 2006 Dr. Branko Tošović

Kooperation mit Hochschulen: Vorteile für KMU. Überblick Vorteile Zugriff auf Wissen Problem- lösung Forschung Spezialwerk- zeuge Höhere Glaub- würdigkeit.

Google Text, Tabellen, Präsentation, Zeichnungen Computeria Wallisellen Joachim Vetter.

Erstellt von: Manuela, Marc und Midhat im Rahmen des MMF_3 Kurses.

Köln, 5. März 2004Dr. Thomas Wolf, UB Heidelberg Vom Projekt zum Regelbetrieb: Digitalisierung an der UB Heidelberg.

Vorlesung Computerphilologie Kormann Wintersemester 05/06 1 Analysieren/Hypertext Kormann.

Seminar: Berufspraktischer Kontext

Hacker-Angriff 1. Lückentext

Erstellt von: Manuela, Marc und Midhat im Rahmen des MMF_3 Kurses.

Metropole Ruhr | Wissenschaftslandschaft

ANTOLIN So funktioniert‘s….

Liebe KollegInnen, Anbei finden Sie eine PowerPoint-Vorlage zur Erarbeitung eines kurzen Zwischenberichts Ihrer Gruppe für das nächste Treffen. Bitte befüllen.

Alles wahr? - Wahrheit - Lüge Ist alles wahr im Internet ?

Einführung in das didaktische Konzept „WebQuest“

BLOGGING Braucht der Deutschlehrer/ die Deutschlehrerin einen Blog zu betreiben?

ERKENNTNIS THEORETISCHE DARSTELLUNG

Linguistische Annotationen

Stadt- und Regionalsoziologie (S) : Einführung

Dr. Petra Bendel Der Vergleich in der Politikwissenschaft für: Seminar „Migrationspolitiken in Europa“

VARIANTEN der FRAGESTELLUNG bei einer Matura-NEU Seminar PH-Linz Christian SITTE

GATE/Annie Zara Kanaeva, November 2002, Information Extraction.

Das Schreiblabor an der Universität Bielefeld

Diese weltweit größte Sammlung von deutschsprachigen Textkorpora für die linguistische Forschung - online recherchierbar über COSMAS I - umfasst zur Zeit.

Tutorial Holdings Management Erstellen, Bearbeiten und Zuweisen von Links für Full Text Finder support.ebsco.com.

MS Word 2010 Word Texte eingeben und bearbeiten automatische und manuelle Korrekturen Text bearbeiten Word Texte eingeben und bearbeiten automatische und.

MS Word 2010 Word Zusätzliche Elemente in den Text einfügen  Symbole, Sonderzeichen  Schnellbausteine Word Zusätzliche Elemente in den Text einfügen.

Werkzeuge und Unterrichtsbeispiele Uwe Matthias Richter Universität Klagenfurt 30. Mai 2006.

Arbeiten mit WordSmith 4. Inhalt 1. Arbeiten mit der Funktion Wortliste (im getaggten Korpus) 1. Arbeiten mit der Funktion Wortliste (im getaggten Korpus)

-Projekt „Muerte en Valencia“

Lern- und Forschungswerkstatt I - LF I (1) 1. Semester Soziale Arbeit, B. A. Gruppe A: Mi., Uhr bis Uhr, Raum 212 Dozentin: Prof. Dr. phil.

Das Vorhaben wird bearbeitet von Koordiniert vom Gefördert durch Wissenschaftlich begleitet vom FKZ-Nr.: Kurztitel Laufzeit: XX.XX.2010-XX.XX.2012 Präsentation.

Titel des Projekt Beteiligte Personen und Fächer: Ausgangslage:

Wortschatzarbeit mit digitalen Korpora

Titel des Projektes (max. 2 Zeilen) Beteiligte Personen und Fächer:

Präsentation transkript:

Dr. Helmuth Sagawe WS 2010/11 Universität Heidelberg Erschließung von qualitativem Wissen aufgrund einer Fragestellung aus einem Textkorpus Dr. Helmuth Sagawe WS 2010/11 Universität Heidelberg

Textkorpora Korpora geschriebener Gegenwartssprache des IDS http://www.ids-mannheim.de/kt/projekte/korpora/ Bestand: über 2 Milliarden Token DWDS-Korpus http://www.dwds.de/ Bestand: 1.2 Milliarden Token (intern), 100 Millionen Token (öffentlich) Schweizer Textkorpus http://www.schweizer-textkorpus.ch/ Im Testbetrieb besteht das Korpus nun aus etwa 10 Mio. Token. Im Endausbau sind 20 Mio. Token geplant. Dortmunder Chatkorpus http://www.chatkorpus.uni-dortmund.de/ Bestand: 1.1 Mio. Token aus 150'000 Chat-Beiträgen. British National Corpus (BNC) http://www.natcorp.ox.ac.uk/ Bestand: über 100 Millionen Token

Der Weg über die quantitative Analyse von Textmengen zur qualitativen Aussage

- Fragestellung erarbeiten - geeignete Textkorpora zusammenstellen oder - vorhandene (im Internet zugängliche) Korpora auf die Operationalisierung der Fragestellung hin überprüfen - geeignete Analyseprogramme finden

Textanalyseprogramme TACT OCP Tustap Monoconc Opentext Saga lexa

Analysemöglichkeiten 1. Wordliste erstellen /Häufigkeitsverteilung 2. Type/ Token Verhältnis prüfen / bewerten 3. Konkordanz zu bestimmten Begrifflichkeiten erstellen 4. Semantisches Umfeld der untersuchten Begrifflichkeit prüfen

Aufgabe: Bitte versuchen Sie zu analysieren, in welchen Kontexten und Begrifflichkeiten das Wort „Terror“ in der heutigen aktuellen Diskussion vorkommt. Erstellen Sie mit Texten aus dem Internet ein Textkorpus in WORD, Speichern Sie dieses als TXT-Datei ab Führen Sie eine kurze (Wordliste/ Konkordanz) Analyse mit MONOCONC durch 4. Verbalisieren Sie die Ergebnisse in einer Mail an mich (sagawe@t-online.de) auf ca. einer halben Seite. Bitte alle Namen der Gruppenarbeit mit aufführen.