Peter Grzybek Austrian Research Fund Project #15485 Von der Ökonomie der Sprache zur Selbst- Regulation kultureller Systeme Korpuslinguistik vs. Textanalyse Exakte Literaturwissenschaft: Zur Prosa Karel Čapeks Was tun die Wörter im Vers miteinander? Zur Poesie A.S. Puškins
Peter Grzybek Austrian Research Fund Project #15485 Exakte Literaturwissenschaft: Zur Prosa Karel Čapeks
( ) ( ) ( ) ( )
Satzlänge im Tschechischen (in Worten) [nach Doležel 1965] insgesamt: x = 16.03
Mittelwert:x 1 = 2.09x 2 = 2.10 Streuung (Varianz):s² = 1.26s² = 1.48 Standardabweichung: s = 1.12 s = 1.22
Wortlängenhäufigkeit im Tschechischen nach Ludvíková (1972)
PxPx = g(x)P x-1 Poisson-Verteilung Hyperbinomial-Verteilung Hyperpoisson-Verteilung Binomial-Verteilung
Binomialverteilung n = 3 p = 0.25 C=0.008 n = 5 p = 0.17 C=0.009
Binomialverteilung n = 6 p = 0.18 C=0.035 n = 100 p = 0.01 C=0.059 n = 1000 p = C=0.054
Poisson-Verteilung (C=0.0054)
Hyperpoisson-Verteilung (C=0.0043)
Hyperpoisson-Verteilung (C=0.0024)
Hyperpoisson-Verteilung (C=0.0119) ( Binomial-Verteilung: C=0.0019)
Was beeinflusst die Wortlänge und die Verteilung ihrer Häufigkeit? Faktoren: Zeit, Autor, Gattung, usw. Zwei Optionen verschiedene Modelle Ein Modell – Variabilität der Parameter ab Lilie Rekord Noviny
Die drei Zentralmomente y-Achse x-Achse Mittelwert Streuung Schiefe
Čas (1909) M 1 = M 2 = M 3 = Aristokracie (1909)
Durchschnittliche Wortlänge (in Silben): Poesie, Prosa, Journalistik
Erweiterung der Datenbasis: Karel und/oder Josef Čapek
Unterschiedliche Wortlänge in verschiedenen Text-Untergruppen
F I N I S
(Conway-Maxwell-Poisson) (Hyperpoisson) (Hyperpascal) Poesie Journalistik liter. Prosa Verteilungsmodelle für slowakische Texte