Peter Grzybek ( Graz ) Das Grazer Projekt »Wortlängen(häufigkeiten) in Texten slawischer Sprachen« FWF #15485 (2002-2005)

Slides:



Advertisements
Ähnliche Präsentationen
DIENSTLEISTUNGEN Normung, Zertifizierung, QM
Advertisements

Asymptotische Notation
Berg-Schlosser : VL : Vergleichende Politikwissenschaft Vergleichende Methoden Ausgangsbasis : Fälle: begrenzte Auswahl auf der Makro-Ebene, abhängig.
Seminar Textmining WS 06/07 Themen Übung 11 unsupervised vs. supervised Symbolfolgen, Kunstsprachen Page Rank.
Wörterbuchtypen Universität zu Köln Romanisches Seminar
Digitalisierung und Aufbereitung von Sprachdaten
Konzeption und prototypische Implementierung eines zentralen Informationssystems für Systemmanagement Motivation Oft wird es schwierig, die benötigten.
Online-Evaluationssystems
Nicht-Lineare Regression
Der Umgang mit qualitativ erhobenen Daten: Strategien der Datenanalyse
Patrick Rössler Einführung in die Methoden der empirischen Kommunikationsforschung Vorlesung BA Kommunikationswissenschaft (123) Grundlagen-LVG.
Patrick Rössler Methoden der Datenerhebung und -auswertung Vorlesung BA Kommunikationswissenschaft (G21) 1.
Patrick Rössler Methoden der Datenerhebung und -auswertung Vorlesung BA Kommunikationswissenschaft (G21) 1.
Martin Baethge / Frank Achtenhagen
1 Automatische Klassifikation von Nomen nach Begriffstyp Christof Rumpf Heinrich-Heine-Universität
Anwendungen. © Prof. T. Kudraß, HTWK Leipzig Historie des WWW Grundlage Internet – Entwickelt Ende der 60er Jahre vom US-Militär (ARPA-Net) – Technische.
PGP II/08 Projekte im Informatikunterricht Ernst-Reuter-Schule 1 Oberstufengymnasium Peter G. Poloczek.
Herzlich willkommen beim 1. Workshop der AG Methodik
4 Philologische Methoden Vorlesung 1
Access 2000 Datenbanken.
Aufgabe Der Zusammenhang zwischen einem traumatischen Erlebnis und der Entstehung einer PTBS wird von mehreren Variablen …………….: Copingstrategien, Kontrollüberzeigung,
Meta-Analyse Forschungsmethoden und Evaluation
UML Begleitdokumentation des Projekts
Allgemeine Informationen
Allgemeine Informationen
Quantitative Spektroskopie des Überriesen Deneb
Entitäten Extraktion Einführung
Entitäten Extraktion Wichtige Schritte Petra Maier WS 05/06.
Spezifikation von Anforderungen
RECHTSCHREIBEN.
Projektphasen Phase 1: Vorbereitung Phase 2: Ist-Analyse
AK Tools/Expertengruppe HiL Workshop Standardisierung HiL Status der Expertengruppe zum Thema Standardisierung Dr. Peter Rißling, BMW AG Version: 1.00.
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
INFORMATIONSSYSTEM ZUR STUDIERENDENVERWALTUNG OPUS-College.
Texttyp - Textsorte - Vertextungsmuster
Institut für Theoretische Informatik
Peter Grzybek Projekt # (FWF) Projekt # 43s9 (OEAD/SAIA) Graphem-Häufigkeiten.
Wortlängen(häufigkeiten) in Texten slawischer Sprachen
Multivariate Verfahren der Statistik bei der quantitativen Textanalyse
Phasen einer empirischen Untersuchung
Allgemeines zu Datenbanken
Stilistik: Peter Grzybek Qualitativ - Quantitativ
Emmerich Kelih & Gordana Antić Klassifikation von Autor und/oder Text?
Schwerpunkt: Quantitative Linguistik (QL)
Institut für Slawistik der Karl-Franzens Universität Graz Graz, 25. November 2010 Evaluierung der Grazer Sprachwissenschaft von 2005 bis 2009 Perspektive.
Peter Grzybek ( Graz ) Wortlängen(häufigkeiten) in Texten slawischer Sprachen FWF-Projekt #15485 ( )
Peter Grzybek Austrian Research Fund Project #15485 Von der Ökonomie der Sprache zur Selbst- Regulation kultureller.
Peter Grzybek Warum messen wir Wortlängen nicht in der Anzahl
Kelih, Emmerich (Graz) Wortdefinition und Wortlänge Göttingen, 2003.
Kompetenz -, Lern - und Prüfungsbereiche Anforderungsbereiche
Zentralabitur 2006 im Fach Mathematik.
Multivariate Statistische Verfahren
Vorschlag zur Abfassung einer PPT-Präsentation des Planungsreferats
MÜSC Münsteraner Screening zur Früherkennung von Lese-Rechtschreibschwierigkeiten Von Gerd Mannhaupt.
Kontrastive Untersuchung von Präpositionen (D-Fr)
Georg Spitaler PS Interpretative Zugänge zu Popularkultur WS 2004/05.
Teilcurriculum Methodenlehre im Grundstudium
Inhalt Einordnung und Funktion der lexikalische Analyse Grundlagen
2 Grundlagen In diesem Abschnitt werden die Grundbegriffe und Methoden der Theorie der formalen Sprachen und der Automaten wiederholt, soweit diese ben.
Datenmatrix HKI Proseminar Philipp Cielen.
K3.1 Phonetik und Phonologie II 8. Sitzung Lautstatistik und Typologie.
Statistik II Statistik II Maße der zentralen Tendenz (Mittelwerte)
Die klassischen Methoden der historisch-vergleichenden Forschung Universität Zürich Soziologisches Institut Seminar: Methoden des internationalen Vergleichs.
{ Das Binärsystem 0,1 }.  Als Binärsystem wird das System bezeichnet,welches nur aus 0-en und 1-en besteht. Dieses System wurde geschaffen, damit Nerds.
Touchability of Touchscreens
Fachbereich: FB Germanistik
THEORETISCHE PHONETIK DER DEUTSCHEN SPRACHE
Branko Tošović (Univerzitet Graz, Austrija) 1
 Präsentation transkript:

Peter Grzybek ( Graz ) Das Grazer Projekt »Wortlängen(häufigkeiten) in Texten slawischer Sprachen« FWF #15485 ( )

Korpus-Analyse vs. Text-Analyse Text-Mischung Vermeintliche (Re-)Konstruktion einer Norm eines StandardsTextals homogene Einheit Text-Ausschnitt vs. Vollständiger Text (Quasi-Text) Selbstregulierendes System

Ein Modell für alle (silbenbildenden) Sprachen ?? alle Texte einer gegebenen Sprache (Sprachengruppe?) ?? alle Texte eines Autors einer gegebenen Sprache ?? alle Texte eines bestimmten Typs einer gegebenen Sprache ?? etc. Einflussfaktoren Autorenschaft ? Texttyp ? Sprache ? Entstehungszeit ? u.a.m. ? Einheitliche Modelle oder Modifikation(en)?

PHASE I Anlage einer Text-Datenbank Texte in 3 slawischen Sprachen Meta-Daten (Sprache, Autor, Texttyp etc.) Verschiedene Formate: Speicherformate (Zeichenkodierung) Textformate DREI TECHNISCHE PHASEN

SpracheAnzahl von Texten Kroatisch1050 Russisch1303 Slowenisch1290 Gesamt3643

Act locally, think globally Korpus-Schnittstelle Analyse-Programme ZIEL Analysetext (ohne Abkürzungen, Zahlen, Fremdwörter, etc.) (PHASE II)

Quantitative und qualitative Auswertungen Prüfung von Verteilungsmodellen Faktorenanalysen (incl. Diskriminanz- und Clusteranalysen) PHASE 3 Text-Typologie Text-Klassifikation Text-Diskrimination

THEORETISCHE GRUNDLAGENARBEITEN Wortlängenforschungen im Kontext der Geschichte der QL Wortlängenforschungen – Fragen der Wort-Definitionen graphematisch, graphematisch-phonologisch, phonologisch Fragen der konstituierenden Elemente des Wortes Häufigkeiten, Interrelation von Maß-Einheiten (Graphem/Phonem, Silbe, Morphem) Untersuchungen zur Daten-Homogenität Untersuchungen zur Text-Typologie Prüfung geeigneter statistischer Verfahren (multivariate Varianzanalysen, Prüfung von Verteilungsmodellen)