Peter Grzybek Warum messen wir Wortlängen nicht in der Anzahl

Slides:



Advertisements
Ähnliche Präsentationen
Übersicht Mitgliedsbeitrag (Stand: 09/2010) Gesamtzahl: 673
Advertisements

Mobile Classroom S.OF.T – in the School of Tomorrow
Anzahl der ausgefüllten und eingesandten Fragebögen: 211
Normalverteilte Zufallsvariablen
Ausbildungsbilanz 2003 Eine Bilanz der DGB-Jugend
Alles im Kopf ausrechnen… …und zwar so schnell wie möglich!
Leseleistung LAU 5 und KESS 4 im Vergleich
Statistiken und Tabellen
Forschungsstatistik I
Abfragen aus einer Sprachdatenbank Jonathan Harrington.
Abfragen aus einer Sprachdatenbank Jonathan Harrington.
Der Produkt-Moment- Korrelationskoeffizient Der Produkt-Moment Korrelationskoeffizient gibt Stärke und Richtung des linearen Zusammenhanges zweier Variablen.
Rechneraufbau & Rechnerstrukturen, Folie 2.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 2.
Prof. Dr. Bernhard Wasmayr
Pressekonferenz – 19. Juni Kommunalfinanzen stärken – Standortattraktivität sichern! kranke Kommunen – kranke Infrastruktur ohne Moos nix los! –
Nachholung der Vorlesung vom Freitag
Ab nächster Woche wird die Übungsgruppe Gruppe 2: Henrike Berg Di SR 222 wegen Personalmangel eingestellt.
Kolmogorov-Smirnov-Test. A. N. Kolmogorov Geboren in Tambov, Russland. Begründer der modernen Wahrscheinlichkeitstheorie.
Test auf Normalverteilung
Logischen Grundverknüpfungen
Univariate Statistik M. Kresken.
Prof. Dr. Bernhard Wasmayr VWL 2. Semester
AWA 2007 Natur und Umwelt Natürlich Leben
Zerlegung von Quadraten und ????
Herzlich Willkommen zur Pressekonferenz anlässlich der
Prof. Dr. Günter Gerhardinger Soziale Arbeit mit Einzelnen und Familien Übersicht über die Lehrveranstaltung Grundlegende Bestimmungsfaktoren der Praxis.
Daten auswerten Boxplots
2710 Auswertungen von 50 Schulen
Freiwillige Feuerwehr Gernsbach
Bestand von 2008 Mitgliedsbeiträge vom Land SpendenGesamtvermögen 2.664, , , , , , , ,37 FINANZBERICHT.
Eine Einführung in die CD-ROM
Versuch zur Messung der Geschwindigkeit
Versuch zur Messung der Geschwindigkeit
Peter Grzybek Projekt # (FWF) Projekt # 43s9 (OEAD/SAIA) Graphem-Häufigkeiten.
Wortlängen(häufigkeiten) in Texten slawischer Sprachen
Peter Grzybek ( Graz ) Das Grazer Projekt »Wortlängen(häufigkeiten) in Texten slawischer Sprachen« FWF #15485 ( )
Multivariate Verfahren der Statistik bei der quantitativen Textanalyse
Statistische Tests in kleinen Stichproben
Arbeiten mit der Normalverteilung
Arbeiten mit der Normalverteilung
Sicherheit vs. Freiheit?
Stilistik: Peter Grzybek Qualitativ - Quantitativ
Emmerich Kelih & Gordana Antić Klassifikation von Autor und/oder Text?
Schwerpunkt: Quantitative Linguistik (QL)
Peter Grzybek ( Graz ) Wortlängen(häufigkeiten) in Texten slawischer Sprachen FWF-Projekt #15485 ( )
Peter Grzybek Austrian Research Fund Project #15485 Von der Ökonomie der Sprache zur Selbst- Regulation kultureller.
Kelih, Emmerich (Graz) Wortdefinition und Wortlänge Göttingen, 2003.
Der Ablauf eines Clear Rex Klärzyklus
Ertragsteuern, 5. Auflage Christiana Djanani, Gernot Brähler, Christian Lösel, Andreas Krenzin © UVK Verlagsgesellschaft mbH, Konstanz und München 2012.
L.O.C. Mehrzweckreiniger 1 l Konzentrat 9,00 € ( GP 6,91 €)
Entwurf einer neurologischen Theorie der Sprache
Szenisches Lernen Wie Theaterelemente den Unterricht bereichern
Freiwillige Feuerwehr Gernsbach
MINDREADER Ein magisch - interaktives Erlebnis mit ENZO PAOLO
Obstlt RUHS Anton Von bis
Parkplatz-Orga Diese Version ist vom finale Version!
Lump vom dunklen Zwinger Wurftag 23.Mai 2002 Körklasse 1 Schaubewertung SG BH AD Sch H Punkte SG
Vergleichende deutsch-französische Umfrage zur Situation in China und Tibet März 2014 N° Kontakts : Frédéric Dabi / Alexandre Bourgine
Zusammengestellt von OE3DSB
Folie Beispiel für eine Einzelauswertung der Gemeindedaten (fiktive Daten)
Fußballweltmeisterschaft
PERUANISCHER BERGBAU 2006.
Forschungsprojekt Statistik 2013 „Jugend zählt“ – Folie 1 Statistik 2013 „Jugend zählt“: Daten zur Arbeit mit Kindern und Jugendlichen.
„Faserland“ Stil- und Sprachanalyse
AGOF facts & figures: Branchenpotenziale im Internet Q2 2014: Parfum & Kosmetik Basis: internet facts / mobile facts 2014-I.
Folie Einzelauswertung der Gemeindedaten
Teil I: Sprache im Kontext
Deskriptive Statistik, Korrelationen, Mittelwertvergleiche, Graphiken
1 Branko Tošović SLAWISCHE PHONEMSYSTEME BULGARISCH БЪЛГАРСКИ ЕЗИК.
THEORETISCHE PHONETIK DER DEUTSCHEN SPRACHE
 Präsentation transkript:

Peter Grzybek Warum messen wir Wortlängen nicht in der Anzahl von Buchstaben pro Wort ?

„Die Länge eines Lexems kann in der Anzahl der Grapheme, Phoneme, Phone, Morpheme oder Silben gemessen werden.“ Hoffmann (2001: 84): „Polylexie lexikalischer Einheiten in Texten“ „ …, dass zwischen den einzelnen Metrisierungen eine numerische Transformation vorgenommen werden kann.“

Wortlänge und Bedeutungszahl Slowakische Daten nach Altmann/Schwibbe (1989: 68)

Wortlänge und Bedeutungszahl Slowakische Daten nach Altmann/Schwibbe (1989: 89)

wie z. B. "ein", "der", "die" oder "das" zustande. Darstellung der Worthäufigkeit als Funktion der Wortlänge. Der Spitzenwert der Wortlänge 3 (Buchstaben) kommt durch den häufigen Gebrauch von Worten wie z. B. "ein", "der", "die" oder "das" zustande. http://www.numberland.com/visual/wort.htm

http://www.engineeringobjects.com/eztyp/ezchardistrib.htm

Gesamtstichprobe: 25.000 „fortlaufende Wörter“ P.M. Alekseev (1998): Graphemic and Syllabic Length of Words in Text and Vocabulary Gesamtstichprobe: 25.000 „fortlaufende Wörter“ Fünf Teilstichproben à 5.000 Wörter: Gesprochene Sprache Privatbriefe Drama Poesie Journalistik

Vergleich zweier Texte von Puškin Домик в Коломне / Евгений Онегин (I) Wortlänge in Silben Wortlänge in Buchstaben Domik v Kolomne 2.01 (s² = 0.88) 4.85 (s² = 5.83) Evgenij Onegin (I) 2.06 (s² = 1.01) 5.09 (s² = 6.79) Mittelwert- vergleich t3621 = 2.01 p < 0.05 t3648 = 3.19 p < 0.005

Wortlänge in Silben und Buchstaben Домик в Коломне Wortlänge in Silben und Buchstaben  Korrelation: r = 0.871 (p < 0.001)   Silben pro Wort Grapheme pro Wort Schiefe 0.589 0.415 Kurtosis – 0.357 – 0.325 Kolmogorov-Smirnov 0.221 (p < 0.001) 0.115 (p < 0.001) Shapiro-Wilk 0.845 0.961

Grapheme und Silben pro Wort in Puškins Domik v Kolomne

Wortlänge in Silben und Buchstaben  Korrelation: r = 0.888 (p < 0.001)   Silben pro Wort Grapheme pro Wort Schiefe 0.841 0.615 Kurtosis – 0.518  – 0.030 Kolmogorov-Smirnov 0.222 (p < 0.001) 0.104 (p < 0.001) Shapiro-Wilk 0.849 0.961

Grapheme und Silben pro Wort in Puškins Evgenij Onegin (I)

Grapheme pro Silbe in Puškins Evgenij Onegin (I) und Domik v Kolomne

Wortlängen in Silben und Graphemen Ord‘sches Schema 20 russische Texte Wortlängen in Silben und Graphemen

Peter Grzybek Warum wir Wortlängen nicht in der Anzahl von Buchstaben pro Wort messen…