Peter Grzybek ( Graz ) Wortlängen(häufigkeiten) in Texten slawischer Sprachen FWF-Projekt #15485 (2002-2005)

Slides:



Advertisements
Ähnliche Präsentationen
Quanti Tutorium
Advertisements

Beispiel: Grundbegriffe Statistik/Stochastik
Univariate Statistik M. Kresken.
Der F - Test Man prüft, ob sich 2 Varianzen unterscheiden, mit dem F-Quotienten: Geprüft werden stets die Schätzungen der Populationsvarianzen aufgrund.
Grundlagen der Wahrscheinlichkeitsrechnung - Verteilungen -
 Fachhochschule Köln Globalhaushalt.
= = = = 47 = 47 = 48 = =
Gliederung Definition des Wahrscheinlichkeitsbegriffes
Gliederung Der Begriff der Stichprobe, Stichprobenfehler
Gliederung Tabellarische und grafische Darstellung von Rohwerten mittels Histogramme und Polygone Statistische Kennwertbeschreibung mittels Tendenz- und.
Quantitative Methoden I
= 4x x nach links, Zahl nach rechts! -2x 4x -2x + 52x – 2x x -2x = 2x – 2x x Zahl 2x= = 2x -15 x = - 10 = 4x + 52x -15 Beispiel.
Prof. Dr. Bernhard Wasmayr
Häufigkeiten Gegeben ist eine Datenliste (Urliste) (hier z. B. die Klausur-Noten von 50 Studenten)
Streuungsparameter für Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Verteilungsfunktion der Normalverteilung I. Verteilungsfunktion der Normalverteilung II.
Univariate Statistik M. Kresken.
Prof. Dr. Bernhard Wasmayr VWL 2. Semester
AWA 2007 Natur und Umwelt Natürlich Leben
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Vorlesung: Biometrie für Studierende der Veterinärmedizin Helmut Küchenhoff 1 Zusammenfassung zur Vorlesung Begriff der biologischen Variabilität.
Wiederholung und Beispiele
Vorlesung Biometrie für Studierende der Veterinärmedizin Begriff der Zufallsgröße Ergebnisse von Zufallsexperimenten werden als Zahlen dargestellt:
Binomialverteilung: Beispiel
Einfache Regressionsgleichung
Investitionen in Projekt B nach Gruppe (Gelb=25%, Weiß=10%)
20:00.
Vergleich der 3 Arten des t-Tests Testergebnisse berichten
Eine Einführung in die CD-ROM
Unser Beitrag zum Comenius-projekt Umfrage zum Thema Fliegen.
Vorbereitung zur Reife- und Diplomprüfung Statistik
Aufgabenzettel V Statistik I
Forschungsmethoden Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften, Universität Fribourg.
Einführung in SPSS/PASW. Inhaltsübersicht 1. Intro ( ) 2. Deskriptive Statistik ( ) 3. Ausgaben ( ) Wiederholung Tabellen,
Einführung in SPSS/PASW. Inhaltsübersicht 1. Intro ( ) 2. Deskriptive Statistik ( ) (In Buch 1 Seite 85ff.) Kennwerte (Erwartungswert,
Peter Grzybek Projekt # (FWF) Projekt # 43s9 (OEAD/SAIA) Graphem-Häufigkeiten.
Wortlängen(häufigkeiten) in Texten slawischer Sprachen
Peter Grzybek ( Graz ) Das Grazer Projekt »Wortlängen(häufigkeiten) in Texten slawischer Sprachen« FWF #15485 ( )
Multivariate Verfahren der Statistik bei der quantitativen Textanalyse
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 0021 WS 2005/ Oktober 2005.
STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005.
STATISIK LV Nr.: 0021 WS 2005/ November 2005.
Grundlagen der Messtechnik
Stilistik: Peter Grzybek Qualitativ - Quantitativ
Emmerich Kelih & Gordana Antić Klassifikation von Autor und/oder Text?
Peter Grzybek Austrian Research Fund Project #15485 Von der Ökonomie der Sprache zur Selbst- Regulation kultureller.
Peter Grzybek Warum messen wir Wortlängen nicht in der Anzahl
PROCAM Score Alter (Jahre)
Referat über das Thema STOCHASTIK.
Ertragsteuern, 5. Auflage Christiana Djanani, Gernot Brähler, Christian Lösel, Andreas Krenzin © UVK Verlagsgesellschaft mbH, Konstanz und München 2012.
MINDREADER Ein magisch - interaktives Erlebnis mit ENZO PAOLO
1 (C) 2002, Hermann Knoll, HTW Chur, Fachhochschule Ostschweiz Wahrscheinlichkeitsverteilung Lernziele: Wahrscheinlichkeitsverteilung und der Wahrscheinlichkeitsdichte.
Der Zentralwert.
Folie Beispiel für eine Einzelauswertung der Gemeindedaten (fiktive Daten)
Forschungsmethodik II, SS 2010 Vesna Pavlovski & Julia Pichlhöfer
Projekt Messendorferstraße Graz TOP 1-33 /EG Wohnhaus 1 Grundstück 2 Schlafen10,28 m² Wohnen /Kochen 15,35 m² Diele 2,50 m² Bad mit WC 4,40m² Terrasse.
Folie Einzelauswertung der Gemeindedaten
Statistik – Regression - Korrelation
Veranstaltung 4.
Deskriptive Statistik, Korrelationen, Mittelwertvergleiche, Graphiken
K. Desch - Statistik und Datenanalyse SS05 1 Zusammenfassung 2. Vorlesung (22.4.) Schiefe (Skewness): Maß für die Asymmetrie der Verteilung um den Mittelwert.
K. Desch - Statistik und Datenanalyse SS05
Verteilungen, Varianz Tamara Katschnig.
Corinna Schnedhuber Slowenische Papallelkorpera Slovenski paralelni korpera Slawische Korpuslinguistik Prof. TosovicSS 2006.
Deskriptive Statistik, Korrelationen, Mittelwertvergleiche, Graphiken
Statistik II Statistik II Maße der zentralen Tendenz (Mittelwerte)
Statistik III Statistik III 2. Streuungsmaße (Dispersionsmaße)
Independent Component Analysis: Analyse natürlicher Bilder Friedrich Rau.
Statistik II Statistik II Maße der zentralen Tendenz (Mittelwerte)
 Präsentation transkript:

Peter Grzybek ( Graz ) Wortlängen(häufigkeiten) in Texten slawischer Sprachen FWF-Projekt #15485 ( )

Satzlänge im Tschechischen (in Worten) [nach Doležel 1965] insgesamt: x = 16.03

Korpus-Analyse vs. Text-Analyse Text-Mischung Vermeintliche (Re-)Konstruktion einer Norm eines StandardsTextals homogene Einheit Text-Ausschnitt vs. Vollständiger Text (Quasi-Text) Selbstregulierendes System

Mittelwerte als Maß der zentralen Tendenz

Das arithmetische Mittel (x ) :

Mittelwert als Maß der zentralen Tendenz Varianz als Maß der Streuung um den Mittelwert

Mittelwert:x 1 = 2.10x 2 = 2.12 Streuung (Varianz):s² = 1.29s² = 1.52

Mittelwerte als Maß der zentralen Tendenz Varianzen als Maß der Streuung um den Mittelwert Modelle von Häufigkeitsverteilungen mit variablen Parametern Weitere Kenngrößen von Häufigkeitsverteilungen: Schiefe, Kurtosis, Entropie, usw.

Normalverteilung nach C.F. Gauss

PxPx = g(x)P x-1

Εrweiterte positive Binomialverteilung n = 4 p = 0.37 α = 0.97 n = 14 p = 0.13 α = 0.96 n = 6 p = 0.25 α = 0.98

m 1 ( x ) m 2 (s 2 )m3m3 Arme Liza 2,101,290,88 Vystrel2,121,521,17

Die Lokalisierung im xy-Koordinatensystem y-Achse x-Achse Mittelwert 2. Zentralmoment 3.Zentralmoment

Bednaja Liza M 1 = 2.10 M 2 = 1.29 M 3 = 0.88 Vystrel

Pilotstudie zum Slowenischen Korpus: N = 153 Prosa n 1 = 102 Poesie n 2 = 51 n 1.2. = 50 Journalistik n 1.1. = 52 liter. Prosa

Scatterplot der Diskriminanzvariablen