Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Diese weltweit größte Sammlung von deutschsprachigen Textkorpora für die linguistische Forschung - online recherchierbar über COSMAS I - umfasst zur Zeit.

Ähnliche Präsentationen


Präsentation zum Thema: "Diese weltweit größte Sammlung von deutschsprachigen Textkorpora für die linguistische Forschung - online recherchierbar über COSMAS I - umfasst zur Zeit."—  Präsentation transkript:

1 Diese weltweit größte Sammlung von deutschsprachigen Textkorpora für die linguistische Forschung - online recherchierbar über COSMAS I - umfasst zur Zeit mehr als 1846 Millionen Textwörter. Die Auswahl der öffentlich verfügbaren Korpora ist aus urheberrechtlichen Gründen auf ca Millionen Textwörter beschränkt. Beachten Sie bitte, dass COSMAS I keine "Internet-Suchmaschine", sondern ein Korpus-Recherche- und -Analyse-Werkzeug ist und daher über eine eigene, auf korpuslinguistische Bedürfnisse abgestimmte Suchabfragesprache verfügt. Unter diesem Punkt finden Sie auf vielen Seiten nützliche Hinweise zur COSMAS-I-Bedienung. Wenn Sie COSMAS I zu Ihren Bookmarks hinzufügen wollen, so tun Sie es am besten auf dieser Seite. Die kommerzielle Nutzung der Rechercheergebnisse ist nicht erlaubt.Suchabfragesprache Benutzerkennung Kennwort COSMAS-I-Sitzung Jetzt registrieren? Hier klicken! Kennwort vergessen? Hier klicken!

2 Sitzung: 7703 Sie bitte ein Korpus für die nachfolgenden Suchen. Wenn Sie ein Archiv (Gliederungsebene eins) auswählen, aktiviert COSMAS automatisch alle darin enthaltenen Korpora (Gliederungsebene zwei). Beachten Sie bitte, dass COSMAS I keine "Internet-Suchmaschine", sondern ein Korpus- Recherche- und -Analyse-Werkzeug ist und daher über eine eigene, auf korpuslinguistische Bedürfnisse abgestimmte Suchabfragesprache verfügt. Die Verwendung der im Internet üblichen Suchsyntax führt in COSMAS I im Regelfall nicht zu dem gewünschten Ergebnis....

3 Suchanfrage Such- und Anzeigeoptionen Der Grundformenoperator (&) soll neben Flexion auch Wortzusammensetzung und/oder sonstige Wortbildungsformen und/oder Sonderfälle auflösen. Klein-/Großschreibung Tokenisierung Weggelassener Verknüpfungsoperator bedeutet Expansionslisten Häufigkeiten Nach der Suche durch Zufallsauswahl auf Treffer beschränken. Vorerst nur die ersten Treffer anzeigen.

4 Korpusstatistik Aktuelles Korpuspublic Größe Mio Wortformen Anzahl Dokumente1132 Anzahl Texte Anzahl Textwörter davon nicht als Wortform identifiziert Anzahl Indexeinträge Anzahl Sätze (2 Dokumente ohne Satzgliederung) Anzahl Absätze (197 Dokumente ohne Absatzgliederung) Anzahl Zeichen Durchschnittliche Dokumentlänge Zeichen Durchschnittliche Textlänge1653 Zeichen Durchschnittliche Satzlänge21.5 Textwörter Durchschnittliche Textwortlänge4.9 Zeichen Durchschnittliche Wortlänge5.8 Zeichen Durchschnittlich pro 1000 Textwörter Indexeinträge


Herunterladen ppt "Diese weltweit größte Sammlung von deutschsprachigen Textkorpora für die linguistische Forschung - online recherchierbar über COSMAS I - umfasst zur Zeit."

Ähnliche Präsentationen


Google-Anzeigen