Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Text Encoding Initiative (TEI) Universität zu Köln, SS 2009, HKI Seminar: Daten- und Metadatenstandards Dozent: Herr Sahle Referentin: Ulrike Henny Datum:

Ähnliche Präsentationen


Präsentation zum Thema: "Text Encoding Initiative (TEI) Universität zu Köln, SS 2009, HKI Seminar: Daten- und Metadatenstandards Dozent: Herr Sahle Referentin: Ulrike Henny Datum:"—  Präsentation transkript:

1 Text Encoding Initiative (TEI) Universität zu Köln, SS 2009, HKI Seminar: Daten- und Metadatenstandards Dozent: Herr Sahle Referentin: Ulrike Henny Datum:

2 Text Encoding Initiative (TEI) TEI meint: - das TEI-Konsortium - ein Dokumentenformat zur Kodierung und zum Austausch von Texten TEI-Konsortium: - geht auf eine 1987 gegründete Organisation zurück - seit 2000 Konsortium zum Erhalt, Entwicklung und Verbreitung von TEI

3 TEI - Ziele - Fokus auf bereits existierenden Texten traditioneller Medien (text capture vs. text creation) - Anwendbarkeit für Texte jeglicher Art: jede natürliche Sprache, jede Epoche, jedes literarische Genre, Wörterbücher, linguistische Korpora... - verlustfreien Datenaustausch garantieren - dabei Unabhängigkeit von Programmen, Computersystemen und Anwendungssoftware - Betonung der modularen Natur von TEI: Flexibilität!

4 TEI - Auszeichnungssprache verschiedene Versionen: - P1 (P = proposal) bis P5 (aktuelle Version) - P1 bis P3: SGML-Syntax - P4: Wahl zwischen SGML und XML möglich - P5: basiert auf XML, Verbindung zu XML-basierten Schemasprachen, zu XSLT und Xquery

5 TEI - Auszeichnungssprache Aufbau von TEI: - tag set aus XML-Elementen → ca. 500! - @type) - 2 Hauptkategorien: 1. Elemente für Metadaten 2. Elemente für Merkmale des Textes selbst - sachbezogene Module - Elementklassen (z.B. model.biblLike, model.divPart) - Attributklassen (z.B. att.global) → formale Klassifikation der Elemente, Hierarchie: Superklassen & Subklassen, bottom-up statt top- down

6 TEI - Module Module (Auswahl): tei → TEI-Infrastruktur: Module, Klassen header → Metadaten core → Elemente für alle Dokumente textstructure → allgemeiner Dokumentaufbau namesdates → Namen, Daten, Personen, Orte figures → Tabellen, Formulare, Graphiken drama → dramatische Texte verse → Lyrik msdescription → Manuskripte dictionaries → Wörterbücher corpus → Korpora spoken → gesprochene Sprache

7 TEI - Schema Auswahl von Modulen zur Beschreibung eines bestimmten Textes: Standardmodule + Zusatzmodule Auswahl wird in einem TEI-Schema festgehalten: - selbst TEI-Dokument - ODD-Dokument: „one document does it all“ - kann in XML DTD, RELAX NG, W3C-Schema umgewandelt werden - Auswahl & Erweiterung von Klassen & Elementen möglich - TEI-Schema: nötig für Validität eines TEI- Dokuments

8 TEI - Schema Beispiel für ein TEI-Schema: → ODD-Prozesser generiert aus diesen Deklarationen ein Schema

9 TEI - Schema Mögliche Änderungen: - Unterdrückung von Elementen (z.B. aus dem Modul namesdates) - Umbenennung von Elementen ( statt ) - Modifikation von Attributen und Attributwerten nur Werte „person“ & „place“) - neue Elemente hinzufügen ( ) - Inhaltsmodelle ändern - Klassenzugehörigkeit ändern

10 Anpassung eines Schemas: durch das Tool Roma vereinfacht! Link:

11 TEI - Dokument Grundgerüst:Header: - enthält Metadaten (Bibliographisches, Kodierung, Textprofil, Revision) - wichtig für: Katalogisierung, Anwendungssoftware, wissenschaftliche Arbeit

12 TEI - Fazit - TEI bietet ein breites Spektrum an Elementen - detaillierte Auszeichnungen möglich - aber: Standard zunächst nicht so leicht zugänglich - Konzentration auf Texte aus dem geisteswissenschaftlichen Bereich (für KoelnCampus Sendungsbeschreibung nur bedingt geeignet) Offizielle Website:


Herunterladen ppt "Text Encoding Initiative (TEI) Universität zu Köln, SS 2009, HKI Seminar: Daten- und Metadatenstandards Dozent: Herr Sahle Referentin: Ulrike Henny Datum:"

Ähnliche Präsentationen


Google-Anzeigen