TEI (Text Encoding Initiative) Ein Standard für die elektronische Erfassung von Textquellen.

Slides:



Advertisements
Ähnliche Präsentationen
Extensible Markup Language
Advertisements

Library of Labs Co-funded by the Community programme eContentplus Library of Labs WP 4: Metadaten Definition Universitätsbibliothek Stuttgart (UBS)
Die Nutzung internationaler Standards in MEX
Dublin Core Antje Schregel, Dublin Core Was ist DC? Architektur von DC (Elements, Qualifiers) Anwendung Aktuelle Situation Projekte.
ELML – Flexibilität und Nachhaltigkeit dank XML Dipl. natw. Jo ë l Fisler - GITTA Koordinator MNF eLearning Tag
Anmerkungen zu XML Im September 2000 Entwicklung/Anspruch von XML
Prof. Dr. Günter Törner Dipl-Math. Thorsten Bahne
SVG und X3D Referentin: Gergana Ivanova
Zurück zur ersten Seite n Style Sheets sind im Prinzip Formatvorlagen für HTML-Dokumente n Über Style Sheets lassen sich zentrale Layout-Vorgaben für eine.
XML - Aufbau und Struktur - mit Einsatz im B2B
Hands On – Einführung in XML
IMS Universität Stuttgart 1 Einführung in XML Hannah Kermes HS: Elektronische Wörterbücher Do,
HTML - Einführung Richard Göbel.
FH-Hof Extensible Markup Language Richard Göbel. FH-Hof Extensible Markup Language XML XML ist universeller Ansatz für die Strukturierung von Zeichenketten.
DOM (Document Object Model)
XINDICE The Apache XML Project Name: Jacqueline Langhorst
TEI Philosophische Fakultät IT-Zertifikat Datenstandards Johanna Bächer
XML-Schema HKI Proseminar Wintersemester 2010/11 Dozentin: Frau Kurz von Jan Kohl und Christian Lütticke.
METS/MODS Referat im Rahmen des IT-Zertifikats f ü r Geisteswissenschaftler Leitung: P. Sahle Referentin: C. Ottnad.
METS / MODS. METS – Metadata Encoding and Transmission Standard – 2002 veröffentlicht – XML Schema – Reale Objekte digital abbilden – hierarchische Struktur.
Eine Biografie aus ADB/NDB als XML Datenbanken vs. Markup Prof Dr. Manfred Thaller WS 2009 / 2010 Referent: Bilal Erkin.
HTML - Eine erste Annäherung
© 2002 Prof. Dr. G. Hellberg 1 XML-Seminar XML-Technologie: XML in Theorie und Praxis Prof. Dr. G. Hellberg XML-Technologie: XML in Theorie und Praxis.
XHTML 1.1 C. Nimz Abstrakte Module XHTML 1.1 C. Nimz Was ist ein abstraktes Modul? Definition eines XHTML-Moduls in spezieller leichter.
Modularization of XHTML™
Cross-Search in Renardus Göttingen State and University Library, Germany (SUB) Dr. Heike Neuroth The Academic Subject.
XML Standardisierungen und Abfragesprachen
Einführung XML XML Einführung Andreas Leicht.
Text-Retrieval mit Oracle Vortrag von Andreas Mück & David Diestel.
Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library
Access 2000 Datenbanken.
1 Grundlagen und Anwendung der Extensible Markup Language (XML ) Peter Buxmann Institut für Wirtschaftsinformatik Johann Wolfgang Goethe-Universität Frankfurt.
Austauschformate für Terminologie
Was versteht man unter XML Schema?
Data Documentation Initiative (DDI)
Wissenschaftliche Übung Metadatenformate und -standards
METS (Metadata Encoding Transmission Standard). Wer und Was Digital Library Federation Vorgänger: MoA II (1997) Standard zur Beschreibung einer Teilmenge.
FH-Hof HTML - Einführung Richard Göbel. FH-Hof Komponenten des World Wide Webs WWW Browser HyperText Transfer Protocol (HTTP) via Internet WWW Server.
T E I [Text Encoding Initiative] IT-Zertifikat Kurs 4 :Daten und Metadaten Dozent: Patrick Sahle.
Cedric Heid, Lukas Burkhardt
Wird ganz am Anfang der HTML-Datei geschrieben Doctype html public bedeutet, dass man sich auf die Öffentlichkeit der html-dtd bezieht Html ist die meist.
Java für Fortgeschrittene
Sesame Florian Mayrhuber
Web-Publishing: HTML im Rahmen des PS aus Elektronischer Datenverarbeitung (Rechnerpraktikum)
XML-Query. Übersicht Was ist XML-Query? Vergleich RDB XML-Dokument Syntaktisches und Use-Cases Kritik und Diskussion.
Wohlgeformtheit und Gültigkeit Grundlagen der Datenmodellierung Anke Jackschina.
Ausgabe vom Seite 1, XML Eine Einführung XML - Eine Einführung.
Oliver Spritzendorfer Thomas Fekete
3. Juni 2003Moritz Petersen Minimales Markup und Templates zur Erstellung von strukturierten Texten Ein Zwischenbericht zur Diplomarbeit.
XML (Extensible Markup Language)
ADAT©2004 Dipl. - Ing. Walter SabinSeite: 1 Version 1.0a XML EXTENSIBLE MARKUP LANGUAGE.
IT-Zertifikat Kurs IV Gunther Sarling
XJustiz XJustiz_XML XJustiz_Schema Fachmodul Wertelisten
Vortrag: Frames & Javascript.
Dublin Core IT-Zertifikat Daten- und Metadatenstandards.
© 2001 Sven Dammann1 Aufbau Integrierter Informationssysteme XML Bearbeitung und relationale Abbildung Sven Dammann Martin-Luther-Universität Halle-Wittenberg.
Daten- und Metadatenstandards SoSe 2009 IT-Zertifikat der Philosophischen Fakultät der Universität zu Köln Dozent: Patrick Sahle 26. Juni 2009: Dublin.
Franz Fischer Einführung in die TEI Franz Fischer
CSS Cascading Style Sheets
HTML Hypertext Markup Language
Hauptseminar Web-Services und verteilte Datenbanken Thema XML, DTDs und XML-Schema XML, DTDs und XML-Schema - Stefan Kurz, 25. April 2003.
Symposium: Die phonetisch-phonologischen, orthoepischen und orthographischen Unterschiede zwischen dem Bosnischen/Bosniakischen, Kroatischen und Serbischen.
Bern University of Applied Sciences Engineering and Information Technology Documentation generator for XML-based description standards Ausgangslage: Die.
- Warum: Das HTML-Dilemma
IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle XML-BasicsWS 08/09.
Text Encoding Initiative Universität zu Köln Daten- und Metadatenstandards Seminarleitung: Patrick Sahle Seminarleitung: Patrick Sahle Referentin: Anna.
Geoinformation3 Geoinformation III XML Grundlagen und Dokumentspezifikation Vorlesung 12b.
TEI Die Text Encoding Initiative (TEI-Konsortium), 1987 gegründet - Dokumentenformat (zunächst SGML)‏
Semantic Markup für Zwecke der Langzeitarchivierung in digitalen Bibliotheken Neubiberg,
Text Encoding Initiative (TEI) Universität zu Köln, SS 2009, HKI Seminar: Daten- und Metadatenstandards Dozent: Herr Sahle Referentin: Ulrike Henny Datum:
 Präsentation transkript:

TEI (Text Encoding Initiative) Ein Standard für die elektronische Erfassung von Textquellen

TEI – Wer und Was 1987: Initiative verschiedener international verteilter Institutionen; 2000: TEI Consortium TEI Guidelines: Standardisiertes Regelwerk für die elektronische Erfassung von Texten –Sowohl rein strukturell (Vewendung der Markupsprachen SGML/ XML) als auch semantisch (bzgl. Aussagen über den Text – Metadaten also) –Spezialisiert für geisteswissenschaftliche Texte –ständig weiterentwickelt/ gepflegt TEI -Format –Nicht-proprietär –Portabel Da TEI auf SGML bzw. XML aufsetzt, werden lediglich die Struktur und Aussagen über den Text an sich erfasst – Die Art der Darstellung des Textdokuments über den Computer wird NICHT erfasst! TEI Homepage

Entity: Archival Storage

Quot. marks

Nicht- standard verschlüss.

Grundstruktur eines TEI-konformen Dokuments Neben der Vollversion gibt es auch eine abgespeckte Version der TEI Guidelines: TEI Lite. Sie umfasst diejenigen Regeln, die als elementar für die TEI- konforme Erfassung eines Dokuments, sei es Prosa, Dichtung, Drama etc., erachtet werden (ca. 150 von 450 Elementen (P4)). TEI-konforme Dokumente sind in ihrer Struktur an die Vorgaben der verwendeten Auszeichnungssprache gebunden. XML: Ein TEI-konformes Dokument besteht somit strukturell aus der eigentlichen Instanz und einer dazugehörigen DTD. In ihnen werden Elemente, Attribute und Entities in Tagstruktur gebunden. Innerhalb der DTD wird unter Anwendung der TEI-Regeln definiert, welche Elemente, Attribute und Entities an welchen Stellen erlaubt sind, wie sie verwendet und verschachtelt werden können.

Grundstruktur Die Instanz des Dokuments besteht mindestens aus einem Header-Teil und einem Text-Teil: [header content] [text content]

Grundstruktur Die entsprechende DTD sieht demnach so aus: teiHeader und text können/ müssen bestimmte weitere Elemente aufnehmen.

Grundstruktur Das text- Element ist der Container für das eigentliche Dokument: Jedes Dokument muß ein body-Element besitzen und kann ein front bzw. back- Element besitzen. Ein Buch hat z.B. meistens eine Titelseite, Inhaltsverzeichnis oder Index, welche dann Teil der front bzw. back- Elemente wären.

Grundstruktur Welche Elemente innerhalb des body- Elements aufgenommen werden, hängt von der Art des Dokuments ab; eine Instanz eines Dokuments könnte so aussehen: [header content] [front content] Der Nikolaus Erstes Kapitel Er reitet hoch zu Ross [back content]

Tagsets TEI unterstützt verschiedene Dokumentarten und Anforderungen über Bündel von Elementen (Tagsets, Module), die eigens dafür kreiert wurden. Einige Tag Sets sind in allen TEI-DTDs enthalten, andere können nur gruppenweise verwendet werden, wieder andere können frei kombiniert werden. Man unterscheidet –Core Tag Sets: in allen TEI-DTDs vorhanden –Base Tag Sets: Eine DTD kann immer nur eines dieser Tagsets enthalten. –Additional Tag Sets: Eine DTD kann eines oder mehrere zusätzlich enthalten.

Tagsets Es gibt zwei Module, die immer in jeder TEI-DTD vorhanden sein müssen: Core, enthält Elemente, die für alle Textgattungen gelten, z.B. (paragraph) header, enthält Elemente des Containers Core Tag Sets

Tagsets Daneben gibt es Base Tag Sets, die optional verwendet werden können (aber immer genau eines). Ihre Elemente definieren den Grundaufbau verschiedener Textgattungen, z.B. enthält das Base Module für die Textgattung Dichtung Elemente wie Strophe oder Zeile, Prosa enthält dagegen typische Elemente wie Abschnitt und Kapitel. Base Tag Sets

Tagsets Additional Tag Sets stellen Elemente zur Verfügung, die speziellen Zwecken dienen. Additional Tag Sets z.B. Manuscript DescriptionManuscript Description

TEI Header Jedes TEI-konforme Dokument enthält ein obligatorisches Tagset, das allgemeine Informationen über den eigentlichen Text aufnimmt. ist somit das Tag Set, das die eigentlichen allgemeinen Metadaten aufnimmt. 4 Hauptteile:

TEI Header Elemente Ein minimaler TEI Header hat folgende Struktur:...

File Description enthält die bibliographische Beschreibung des Dokuments Titelinformationen, Autor, … Editorische Informationen Größe des Dokuments publikatorische Informationen Information zur Serie des Dokuments (falls Teil einer solchen) ergänzende Informationen, die nicht in den anderen Kategorien auftauchen bibliograph. Beschreibung des Texts aus der die elektron. Version generiert wurde

Beispiele Two stories by Edgar Allen Poe: a machine readable transcription Poe, Edgar Allen ( ) compiled by James D. Benson

Beispiele Third draft, substantially revised bytes Oxford University Press Oxford Copyright 1989, Oxford University Press

Beispiele The first folio of Shakespeare, prepared by Charlton Hinman (The Norton Facsimile, 1968)

Encoding description Spezifiziert die Methoden und editorischen Prinzipien die die Transkription des Dokuments begleitet haben Ziel und Zweck der elektron. Erfassung Beschreibung der Hintergründe undMethoden für Textsamples Texts collected for use in the Claremont Shakespeare Clinic, June Samples of 2000 words taken from the beginning of the text

Encoding description : Details der editor. Prinzipien Errors in transcription controlled by using the WordPerfect spelling checker. All quotation marks converted to entity references &odq; and &cdq;. : detaillierte Infos zu den verwendeten Tags

Encoding description spezifiziert kanonische Referenzen. The N attribute on each DIV1 and DIV2 contains the canonical reference for each such division in the form XX.yyy where XX is the book number in roman numeral and yyy is the section number in arabic. Taxonomie Library of Congress Subject Headings

Profile description zur Beschreibung verschiedener deskriptiver Aspekte eines Texts Info zur Entstehung eines Texts August 1992 Taos, New Mexico beschreibt die Sprache, Dialekte etc. innerhalb eines Textdokuments

Profile description gruppiert Information die das Thema eines Texts beschreibt (über standardisiertes Klassifikationsschema, Thesaurus etc.) English literature -- History and criticism -- Data processing. English literature -- History and criticism -- Theory etc. English language -- Style -- Dataprocessing.

Revision description stellt die Möglichkeit zur Dokumentation von Änderungen bereit 6/3/91: EMB ed. File format updated 5/25/90: EMB ed. Stuarts corrections entered

Darstellung von TEI-Dateien TEI-Dateien können (bei Verwendung von XML) mittels XSLT in andere Formate umgewandelt werden (z.B. HTML, PDF) Eine relativ einfache Methode zur akkuraten Darstellung von TEI- Dateien ist die Verwendung von Cascading Style Sheets (Bündel von Regeln zur Darstellung von einer Instanz eines Dokuments) Bsp.: A Midsummer nights dream TEI-Datei DTD CCS dazu Das Ergebnis

Projekte, die TEI verwenden Projekte (TEI Website)

Tool zur Erstellung von TEI-DTDs The TEI Pizza Chef (