Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Diese weltweit größte Sammlung von deutschsprachigen Textkorpora für die linguistische Forschung - online recherchierbar über COSMAS I - umfasst zur Zeit.

Ähnliche Präsentationen


Präsentation zum Thema: "Diese weltweit größte Sammlung von deutschsprachigen Textkorpora für die linguistische Forschung - online recherchierbar über COSMAS I - umfasst zur Zeit."—  Präsentation transkript:

1 Diese weltweit größte Sammlung von deutschsprachigen Textkorpora für die linguistische Forschung - online recherchierbar über COSMAS I - umfasst zur Zeit mehr als 1846 Millionen Textwörter. Die Auswahl der öffentlich verfügbaren Korpora ist aus urheberrechtlichen Gründen auf ca. 1181 Millionen Textwörter beschränkt. Beachten Sie bitte, dass COSMAS I keine "Internet-Suchmaschine", sondern ein Korpus-Recherche- und -Analyse-Werkzeug ist und daher über eine eigene, auf korpuslinguistische Bedürfnisse abgestimmte Suchabfragesprache verfügt. Unter diesem Punkt finden Sie auf vielen Seiten nützliche Hinweise zur COSMAS-I-Bedienung. Wenn Sie COSMAS I zu Ihren Bookmarks hinzufügen wollen, so tun Sie es am besten auf dieser Seite. Die kommerzielle Nutzung der Rechercheergebnisse ist nicht erlaubt.Suchabfragesprache Benutzerkennung Kennwort COSMAS-I-Sitzung Jetzt registrieren? Hier klicken! Kennwort vergessen? Hier klicken!

2 Sitzung: 7703 Sie bitte ein Korpus für die nachfolgenden Suchen. Wenn Sie ein Archiv (Gliederungsebene eins) auswählen, aktiviert COSMAS automatisch alle darin enthaltenen Korpora (Gliederungsebene zwei). Beachten Sie bitte, dass COSMAS I keine "Internet-Suchmaschine", sondern ein Korpus- Recherche- und -Analyse-Werkzeug ist und daher über eine eigene, auf korpuslinguistische Bedürfnisse abgestimmte Suchabfragesprache verfügt. Die Verwendung der im Internet üblichen Suchsyntax führt in COSMAS I im Regelfall nicht zu dem gewünschten Ergebnis....

3 Suchanfrage Such- und Anzeigeoptionen Der Grundformenoperator (&) soll neben Flexion auch Wortzusammensetzung und/oder sonstige Wortbildungsformen und/oder Sonderfälle auflösen. Klein-/Großschreibung Tokenisierung Weggelassener Verknüpfungsoperator bedeutet Expansionslisten Häufigkeiten Nach der Suche durch Zufallsauswahl auf Treffer beschränken. Vorerst nur die ersten Treffer anzeigen.

4 Korpusstatistik Aktuelles Korpuspublic Größe951.67 Mio Wortformen Anzahl Dokumente1132 Anzahl Texte4126091 Anzahl Textwörter1148738550 davon 197070304 nicht als Wortform identifiziert Anzahl Indexeinträge1313761267 Anzahl Sätze53331484 (2 Dokumente ohne Satzgliederung) Anzahl Absätze 21005672 (197 Dokumente ohne Absatzgliederung) Anzahl Zeichen6821317817 Durchschnittliche Dokumentlänge6025899 Zeichen Durchschnittliche Textlänge1653 Zeichen Durchschnittliche Satzlänge21.5 Textwörter Durchschnittliche Textwortlänge4.9 Zeichen Durchschnittliche Wortlänge5.8 Zeichen Durchschnittlich pro 1000 Textwörter 1143.7 Indexeinträge


Herunterladen ppt "Diese weltweit größte Sammlung von deutschsprachigen Textkorpora für die linguistische Forschung - online recherchierbar über COSMAS I - umfasst zur Zeit."

Ähnliche Präsentationen


Google-Anzeigen