Transformationen: Text. Zahlen. Bild.

Slides:



Advertisements
Ähnliche Präsentationen
Anzahl der ausgefüllten und eingesandten Fragebögen: 211
Advertisements

Handelskalkulation Inhaltsverzeichnis
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil3.
Die Projektgruppe heißt Sie herzlichst willkommen
LS 2 / Informatik Datenstrukturen, Algorithmen und Programmierung 2 (DAP2)
Webseitenranking für Suchanfragen anhand von Linkgraphen
Telefonnummer.
= = = = 47 = 47 = 48 = =
Statistiken und Tabellen
Quantitative RT-PCR an nativen Prostatakarzinom-Biopsien: Etablierung der Technik und erste vergleichende Ergebnisse Medizinische Fakultät Universitätsklinikum.
EF: Standards + H2O red = H2O.
Rechneraufbau & Rechnerstrukturen, Folie 2.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 2.
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil2.
Differentielles Paar UIN rds gm UIN
Prof. Dr. Bernhard Wasmayr
PowerPoint-Folien zur 5. Vorlesung „Bionik II / Biosensorik“
Univariate Statistik M. Kresken.
Prof. Dr. Bernhard Wasmayr VWL 2. Semester
AWA 2007 Natur und Umwelt Natürlich Leben
Zerlegung von Quadraten und ????
1 Status Index Politikergebnisse Management Index Reformfähigkeit Exekutivkapazität Beteiligungskompetenz Gestaltungsfähigkeit Ressourceneffizienz Internationale.
Investitionen in Projekt B nach Gruppe (Gelb=25%, Weiß=10%)
Prof. Dr. Günter Gerhardinger Soziale Arbeit mit Einzelnen und Familien Übersicht über die Lehrveranstaltung Grundlegende Bestimmungsfaktoren der Praxis.
20:00.
Freiwillige Feuerwehr Gernsbach
AGOF facts & figures: Branchenpotenziale im Internet Q4 2013: Entertainment Basis: internet facts / mobile facts 2013-II.
«Путешествие» ЯЦ ИМОЯК 4 корпус. Lektion 8: Orientierung Orte angeben Den Weg beschreiben S Lektion 10: Deutsche Sprache und deutsche Kultur.
Eine Einführung in die CD-ROM
Referent: Ralf Wollenberg 06/2009
Bewohnerumfrage 2009 durchgeführt vom
Auslegung eines Vorschubantriebes
Peter Grzybek Projekt # (FWF) Projekt # 43s9 (OEAD/SAIA) Graphem-Häufigkeiten.
Wortlängen(häufigkeiten) in Texten slawischer Sprachen
Peter Grzybek ( Graz ) Das Grazer Projekt »Wortlängen(häufigkeiten) in Texten slawischer Sprachen« FWF #15485 ( )
AGOF facts & figures: Branchenpotenziale im Internet Q2 2012: Parfum & Kosmetik Basis internet facts
Multivariate Verfahren der Statistik bei der quantitativen Textanalyse
Messung der Ionisierungsenergie von Wasserstoff
Emmerich Kelih & Gordana Antić Klassifikation von Autor und/oder Text?
Peter Grzybek ( Graz ) Wortlängen(häufigkeiten) in Texten slawischer Sprachen FWF-Projekt #15485 ( )
Peter Grzybek Austrian Research Fund Project #15485 Von der Ökonomie der Sprache zur Selbst- Regulation kultureller.
Peter Grzybek Warum messen wir Wortlängen nicht in der Anzahl
NummerSpracheMittelwert der Wortlänge (in Silben) 1Englisch1,4 2Französisch1,6 3Deutsch1,7 4Esperanto1,9 5Italienisch2,0 6Griechisch2,1 7Ungarisch2,2 8Russisch2,2.
Bitte F5 drücken.
Der Ablauf eines Clear Rex Klärzyklus
Ertragsteuern, 5. Auflage Christiana Djanani, Gernot Brähler, Christian Lösel, Andreas Krenzin © UVK Verlagsgesellschaft mbH, Konstanz und München 2012.
L.O.C. Mehrzweckreiniger 1 l Konzentrat 9,00 € ( GP 6,91 €)
Eine lllustration der Herausforderungen des Stromsystems der Zukunft
AGOF facts & figures: Branchenpotenziale im Internet Q1 2014: Reise & Touristik Basis: internet facts / mobile facts 2013III.
Innovation Onkologie Research & Consulting GmbH
Szenisches Lernen Wie Theaterelemente den Unterricht bereichern
Freiwillige Feuerwehr Gernsbach
MINDREADER Ein magisch - interaktives Erlebnis mit ENZO PAOLO
Plötzlicher Herztod – Definition (I)
AGOF facts & figures: Branchenpotenziale im Internet Q1 2014: Mode & Schuhe Basis: internet facts / mobile facts 2013-III.
Obstlt RUHS Anton Von bis
Parkplatz-Orga Diese Version ist vom finale Version!
Kamin- und Kachelöfen in Oberösterreich
Zusammengestellt von OE3DSB
Folie Beispiel für eine Einzelauswertung der Gemeindedaten (fiktive Daten)
QUIPS 2011 Qualitätsverbesserung in der postoperativen Schmerztherapie.
Dokumentation der Umfrage BR P2.t Ergebnisse in Prozent n= 502 telefonische CATI-Interviews, repräsentativ für die Linzer Bevölkerung ab 18 Jahre;
Forschungsprojekt Statistik 2013 „Jugend zählt“ – Folie 1 Statistik 2013 „Jugend zählt“: Daten zur Arbeit mit Kindern und Jugendlichen.
Projekt Messendorferstraße Graz TOP 1-33 /EG Wohnhaus 1 Grundstück 2 Schlafen10,28 m² Wohnen /Kochen 15,35 m² Diele 2,50 m² Bad mit WC 4,40m² Terrasse.
Quali- Aufgaben.
AGOF facts & figures: Branchenpotenziale im Internet Q2 2014: Parfum & Kosmetik Basis: internet facts / mobile facts 2014-I.
Gedankenlesen Durch Studien fand man heraus, dass Gedanken in einem gewissen Maße lesbar sind.
Überleitung zum TV-H Hochschule
Folie Einzelauswertung der Gemeindedaten
Datum:17. Dezember 2014 Thema:IFRS Update zum Jahresende – die Neuerungen im Überblick Referent:Eberhard Grötzner, EMA ® Anlass:12. Arbeitskreis Internationale.
1 Medienpädagogischer Forschungsverbund Südwest KIM-Studie 2014 Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.
 Präsentation transkript:

Transformationen: Text. Zahlen. Bild. R.U.R. – Rossum’s Universal Robots: Datenverarbeitung in Sprach-, Kultur- und Literaturwissenschaft   Transformationen: Text. Zahlen. Bild. Emmerich Kelih (Graz)

1. Wortlänge und Sprachtypologie Nummer Sprache Mittelwert der Wortlänge (in Silben) 1 Englisch 1,4 2 Französisch 1,6 3 Deutsch 1,7 4 Esperanto 1,9 5 Italienisch 2,0 6 Griechisch 2,1 7 Ungarisch 2,2 8 Russisch 9 Lateinisch 2,4 10 Türkisch 2,5 Aus: W. Fucks (1968): Nach allen Regeln der Kunst. S. 80

Mittlere Wortlänge (gemessen in Silben) Aus: W. Fucks (1968): Nach allen Regeln der Kunst. S. 80

2. Autorenschaft und Wortlänge WL (Graph.) WL (Graph.) K I 5,522 Š I 5,553 TD 1 5,721 K II 5,609 Š II 5,686 TD 2 5,753 K. ges. 5,566 Š. ges. 5,603 TD 4 6, 016   TD ges. 5,851 Aus: Kjetsaa, G. (1984): The Authorship of the Quiet Don. S. 71-73

Ivan Cankar: “Hiša Marije Pomočnice“ Mittlere Wortlänge: Einzelkapitel vs. Gesamtext

število zlogov v besedi 3. Textsortentypologie številka Tip besedila število zlogov v besedi 1 časopisni I 2,29 2 časopisni II 2,08 3 strokovni I 2,28 4 strokovni II 2,09 5 strokovni III 1,90 6 esejistični I 2,26 7 esejistični II 2,01 8 prozni I 1,95 9 prozni II 10 prozni III 1,82 11 poetični I 1,87 12 poetični II 1,84 13 poetični III 1,89 14 dramatični I 1,97 15 dramatični II 1,91 16 dramatični III 1,74 Aus: Poniž, Denis (1974): Slovenski jezik ~literatura ~računalniki. S. 115-117

Gesamtkorpus N=153 N1 = 102 Poesie N2 = 51 N1.1.= 52 Lit. Prosa Presse

ki jih običajmo tudi pišemo s črkami za samoglasnike“ 4. Silbendefinition “Navadno pa je v besedi toliko zlogov, kolikor je v njej samoglasnikov, ki jih običajmo tudi pišemo s črkami za samoglasnike“ (J. Toporišič 2000, 88). Vokale (V) Silbendef. I Silbendef. II a, e, i, o, u 1 V = 1 Silbe K + r + K = 1 Silbe   R/r + K

5. Auszählungsprinzipien   a.)    Akronyme Beispiele: SMS  EsEmEs SDS EsDeEs NK EnKa JLA  JeLeA

b.) Abkürzungen - Auszug Akürzung Ersetzung I Ersetzung II angl. angleško angleščina dol. določen dolenjski c. k. cesarsko- kraljevi cesarsko-kraljevski c. kr. c.kr. dipl. diplomiran diplomatski doc. docent   dr. doktor drugo etc. et cetera fr. francoščina francoski g. gospod ga. gospa gdč. gospodična gen. general generalen Aus: Primož, Jakopin (1999): Zgornja meja entropije pri leposlovnih besedilih v slovenskem jeziku.

Beispiele: Text Ersetzung V angl. drami V angleški drami c.-kr. c.kr. cesarsko-kraljevi cesarsko-kraljevski  

c.) Zahlen   Beispiel: Bilo je leta 1907.  Bilo je leta tisoč devetsto sedem. Včeraj 10. oktobra je bil poseben praznik.  Včeraj desetega oktobra je bil poseben praznik

d.) Fremdsprachliches   Doppelvokale Beispiel: Wiener Neustadt  Viner Nejstadt Lorry  Lorri

6. Exkurs: 0-silbige Wörter Ivan, Cankar: Hiša Marije Pomočnice (HMP)   Ivan, Cankar: Hiša Marije Pomočnice (HMP) Text Wörter (abs.) Silben (abs.) Mittlere Wortlänge/ Silben HMP (mit 0-silbigen Wörtern) 29718 55212 1.8579 HMP (mit 1-silbigen Wörtern) 29459 1.8742

Merkmal: Textlänge in Silben   Textgattung Prosa (lit.) Presse Poesie Total N 52 50 51 153 Mittelwert (x) 3999,98 1084,16 269,86 1803,73 Median (Md) 2777,00 880,00 223,00 883,00 Stabw. (s) 2943,47 784,47 191,75 2393,19 Kurtosis (g1) 1,80 5,91 9,12 6,61 Schiefe (g2) 1,36 2,08 2,49 2,40

Multivariate Diskriminanzanalyse: a.) Für jeden Text unter Angabe von zugehörigen Wahrscheinlichkeiten eine individuelle Zuordnung zu einem der betreffenden Texttypen. b.) Keine individuelle Entscheidung

Scatterplot der Diskriminanzvariablen