Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Peter Grzybek ( Graz ) Wortlängen(häufigkeiten) in Texten slawischer Sprachen FWF-Projekt #15485 (2002-2005)

Ähnliche Präsentationen


Präsentation zum Thema: "Peter Grzybek ( Graz ) Wortlängen(häufigkeiten) in Texten slawischer Sprachen FWF-Projekt #15485 (2002-2005)"—  Präsentation transkript:

1

2 Peter Grzybek ( Graz ) Wortlängen(häufigkeiten) in Texten slawischer Sprachen FWF-Projekt #15485 ( )

3 Korpus-Analyse vs. Text-Analyse Text-Mischung Vermeintliche (Re-)Konstruktion einer Norm eines StandardsTextals homogene Einheit Text-Ausschnitt vs. Vollständiger Text (Quasi-Text) Selbstregulierendes System

4 Aus der Geschichte der Wortlängen- Forschung (Anfänge)

5 Augustus de Morgan ( ) Professor für Mathematik am University College (London) 1851: Erwägt die Möglichkeit, den Autor eines Buches oder eines Textes aufgrund der mittleren Wortlänge zu identifizieren

6 Mittelwert als Maß der zentralen Tendenz

7 Das arithmetische Mittel (x ) :

8

9 Mittelwert:x 1 = 2.10x 2 = 2.12 Streuung (Varianz):s² = 1.29s² = 1.52

10 Mittelwert als Maß der zentralen Tendenz Varianz als Maß der Streuung um den Mittelwert

11 Ivan Cankar: Hiša Marije Pomočnice Mittlere Wortlänge: Einzelkapitel vs. Gesamtext

12 Thomas Corwin Mendenhall ( ) Professor für Physik (Ohio, Tokio) Fortführen der Ideen von de Morgan Mittelwert, Häufigkeitsverteilung (= graphische Repräsentation, mathematische Interpretation) 1887/1901: […] it is proposed to analyze a composition by forming what may be called a 'word spectrum' or 'characteristic curve, which shall be a graphic representation of the arrangement of words according to their length and to the relative frequency of their occurrence. the normal curve of a writer

13

14

15 Sergej Grigor'evič Čebanov ( ) Russischer Armee-Arzt aus Petersburg Mathematische Interpretation der Häufigkeitsverteilung ("Čebanov-Fucks-Verteilung") Wilhelm Fucks (*1902) Professor für Physik (TH Aachen) Fucks (1955): [...] allgemeines Gesetz der Bildung von Wörtern aus Silben

16

17

18 Normalverteilung nach C.F. Gauss

19 Gustav Herdan The Advanced Theory of Language as Choice and Chance (1966) Lognormal-Verteilung als optimales Modell der Wortlängenhäufigkeit

20 PxPx = g(x)P x-1 Conway-Maxwell-Poisson-Verteilung Poisson- Verteilung Pos. Binomial- Verteilung Neg. Binomial- Verteilung

21 Wortlängenhäufigkeiten in Durch die Wüste von Karl May Theoretisches Modell: Neg. Binomial-Verteilung (C = 0.002)

22 Εrweiterte positive Binomialverteilung n = 4 p = 0.37 α = 0.97 n = 14 p = 0.13 α = 0.96 n = 6 p = 0.25 α = 0.98

23 m 1 ( x ) m 2 (s 2 )m3m3 Arme Liza 2,101,290,88 Vystrel2,121,521,17

24 Die Lokalisierung im xy-Koordinatensystem y-Achse x-Achse Mittelwert 2. Zentralmoment 3.Zentralmoment

25 Bednaja Liza M 1 = 2.10 M 2 = 1.29 M 3 = 0.88 Vystrel

26

27

28

29 Pilotstudie zum Slowenischen Korpus: N = 153 Prosa n 1 = 102 Poesie n 2 = 51 n 1.2. = 50 Journalistik n 1.1. = 52 liter. Prosa

30

31

32 Scatterplot der Diskriminanzvariablen

33 TEXTSORTE ProsajournalistischZeitung 1Rubrik 1Autor 130 Autor 230 Rubrik 2Autor 130 Autor 230 Zeitung 2Rubrik 1Autor 130 Autor 230 Rubrik 2Autor 130 Autor literarischErzählungen19. Jhd.Autor 130 Autor 230 Autor Jhd.Autor 130 Autor 230 Autor 330 Romane19. Jhd.Autor 130 Autor 230 Autor Jhd.Autor 130 Autor 230 Autor wissenschaftl.geisteswiss.-philos. 30 naturwiss Brief19. Jhd.Autor 130 Autor Jhd.Autor 130 Autor Poesieversgebunden 19. Jhd.Autor 130 Autor 230 Autor Jhd.Autor 130 Autor 230 Autor freier Vers20. Jhd.Autor 130 Autor gesamt 1020

34 Mittelwerte als Maß der zentralen Tendenz Varianzen als Maß der Streuung um den Mittelwert Modelle von Häufigkeitsverteilungen mit variablen Parametern Weitere Kenngrößen von Häufigkeitsverteilungen: Schiefe, Kurtosis, Entropie, usw.

35


Herunterladen ppt "Peter Grzybek ( Graz ) Wortlängen(häufigkeiten) in Texten slawischer Sprachen FWF-Projekt #15485 (2002-2005)"

Ähnliche Präsentationen


Google-Anzeigen