Franz Fischer franz.fischer@uni-koeln.de Einführung in die TEI Franz Fischer franz.fischer@uni-koeln.de.

Slides:



Advertisements
Ähnliche Präsentationen
WML – Wireless Markup Language Vortrag von Eduard Jakel.
Advertisements

IT-Zertifikat der Phil.Fak
Die Nutzung internationaler Standards in MEX
Dublin Core Antje Schregel, Dublin Core Was ist DC? Architektur von DC (Elements, Qualifiers) Anwendung Aktuelle Situation Projekte.
Anmerkungen zu XML Im September 2000 Entwicklung/Anspruch von XML
eXist Open Source Native XML Database
TEI (Text Encoding Initiative) Ein Standard für die elektronische Erfassung von Textquellen.
NATURAL Web-Integration 1 / 27/28-Feb-98 TST NATURAL Web-Integration Arbeitskreis NATURAL Süd Theo Straeten SAG Systemhaus GmbH Technologieberater Stuttgart.
Hands On – Einführung in XML
IMS Universität Stuttgart 1 Einführung in XML Hannah Kermes HS: Elektronische Wörterbücher Do,
HTML - Einführung Richard Göbel.
DOM (Document Object Model)
RDF R ESOURCE D ESCRIPTION F RAMEWORK Referentin: Claudia Langer.
XINDICE The Apache XML Project Name: Jacqueline Langhorst
TEI Philosophische Fakultät IT-Zertifikat Datenstandards Johanna Bächer
XML-Schema HKI Proseminar Wintersemester 2010/11 Dozentin: Frau Kurz von Jan Kohl und Christian Lütticke.
METS / MODS. METS – Metadata Encoding and Transmission Standard – 2002 veröffentlicht – XML Schema – Reale Objekte digital abbilden – hierarchische Struktur.
Die Bestandteile des Semantic Web. Sematic Web soll das WWW erweitern und nicht neuerfinden Informationen sollen Maschinenlesbar sein Schemata beschreiben.
HTML - Eine erste Annäherung
Benutzen von Internetseiten
Cross-Search in Renardus Göttingen State and University Library, Germany (SUB) Dr. Heike Neuroth The Academic Subject.
Überblick XML: Extensible Markup Language Entwickelt, um Informationen bereitzustellen, zu speichern und zu übertragen Im Gegensatz zu HTML keine vordefinierten.
Einführung XML XML Einführung Andreas Leicht.
Werkzeuge und Softwareumgebung von Christian Michele.
Hauptseminar XML-Technologie: Resource Description Framework (RDF) Michael Kranz Betreuer: Roland Haratsch.
Concurrent Versions System
DVG Kommentare1 Kommentare. DVG Kommentare 2 Kommentare Es gibt zwei Arten von Kommentaren: einzeilige Kommentare // der Kommentar geht.
DVG Kommentare 1 Kommentare. 2 Kommentare Es gibt zwei Arten von Kommentaren: einzeilige Kommentare // der Kommentar geht bis zum Ende der Zeile.
1 Grundlagen und Anwendung der Extensible Markup Language (XML ) Peter Buxmann Institut für Wirtschaftsinformatik Johann Wolfgang Goethe-Universität Frankfurt.
Was versteht man unter XML Schema?
Data Documentation Initiative (DDI)
Langzeitarchivierung und Metadaten. NAA Preservation Strategy Link: ml.
Wissenschaftliche Übung Metadatenformate und -standards
METS (Metadata Encoding Transmission Standard). Wer und Was Digital Library Federation Vorgänger: MoA II (1997) Standard zur Beschreibung einer Teilmenge.
T E I [Text Encoding Initiative] IT-Zertifikat Kurs 4 :Daten und Metadaten Dozent: Patrick Sahle.
Metadata Registries: Aktueller Stand und zukünftige Entwicklungen 1. Metadaten-Workshop der Arbeitsstelle für Standardisierung / META-LIB Abschluss-Workshop.
- XML-Path Language (xPath) ist eine Empfehlung des W3C - es wurde entwickelt, um durch ein XML- Dokument zu navigieren - und ist ein großer Teil von.
XSLT.
Was macht eigentlich dieses ExsoForm? Ein Beispiel für eine Dokumentendefinition in Screenshots.
Project Perseus Der volle Projektname lautet Perseus Digital Library Project. Das Projekt begann in 1985 als Experiment zur Digitalisierung von Bibliotheken.
Wird ganz am Anfang der HTML-Datei geschrieben Doctype html public bedeutet, dass man sich auf die Öffentlichkeit der html-dtd bezieht Html ist die meist.
Java für Fortgeschrittene
Sesame Florian Mayrhuber
Eine kurze Einführung Andreas Venakis.
Web-Publishing: HTML im Rahmen des PS aus Elektronischer Datenverarbeitung (Rechnerpraktikum)
XML-Query. Übersicht Was ist XML-Query? Vergleich RDB XML-Dokument Syntaktisches und Use-Cases Kritik und Diskussion.
Wohlgeformtheit und Gültigkeit Grundlagen der Datenmodellierung Anke Jackschina.
Aufbau der Stylesheet-Angabe Eigenschaft Eigenschaft das was man formatieren möchte Wert Wert Farbangaben, Einheiten oder Schlüsselworte Deklaration Kombination.
Ausgabe vom Seite 1, XML Eine Einführung XML - Eine Einführung.
3. Juni 2003Moritz Petersen Minimales Markup und Templates zur Erstellung von strukturierten Texten Ein Zwischenbericht zur Diplomarbeit.
XML (Extensible Markup Language)
SQLite und XML in PHP 5.
Einführung Prof. Peter Altmann
IT-Zertifikat Kurs IV Gunther Sarling
Daten- und Metadatenstandards SoSe 2009 IT-Zertifikat der Philosophischen Fakultät der Universität zu Köln Dozent: Patrick Sahle 26. Juni 2009: Dublin.
CSS Cascading Style Sheets
HTML Hypertext Markup Language
prof. dr. dieter steinmannfachhochschule trier © prof. dr. dieter steinmann Folie 1 vom Montag, 30. März 2015.
Hauptseminar Web-Services und verteilte Datenbanken Thema XML, DTDs und XML-Schema XML, DTDs und XML-Schema - Stefan Kurz, 25. April 2003.
- Warum: Das HTML-Dilemma
IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle XML-BasicsWS 08/09.
Abschlussprojekt.  Wahl eines beliebigen Themas (z.b. Hobby)  eigenständige Ausarbeitung des gewählten Themas in Form einer Website Abschlussprojekt.
Text Encoding Initiative Universität zu Köln Daten- und Metadatenstandards Seminarleitung: Patrick Sahle Seminarleitung: Patrick Sahle Referentin: Anna.
1 Java und XML Stephan Baldes Warum XML? In welchem Format wurden die Daten gespeichert? Bernd;Thomas;3;5;1987;Freiburg;Karlsruhe Peter;Maier;7;9;1980;Karlsruhe;Freiburg.
Semantic Markup für Zwecke der Langzeitarchivierung in digitalen Bibliotheken Neubiberg,
The Chicago Style (2 e-publication) -1- The Practice of Citing Scientific Sources in the Chicago Style Part 2 - Electronic sources -
Key-Value Paare (KVP) - Metadaten für Kanäle speichern und nach MDF4 exportieren PM (V1.0)
Text Encoding Initiative (TEI) Universität zu Köln, SS 2009, HKI Seminar: Daten- und Metadatenstandards Dozent: Herr Sahle Referentin: Ulrike Henny Datum:
Metadata - Catalogues and Digitised works
eSciDoc als Plattform für die Wissenschaft Anwendungen und Szenarien
 Präsentation transkript:

Franz Fischer franz.fischer@uni-koeln.de Einführung in die TEI Franz Fischer franz.fischer@uni-koeln.de

Wiederhohlung: Warum Texte kodieren? um maschinenlesbar (explizit) zu machen, was vom Leser implizit verstanden wird um Texte mit Informationen anzureichern um Texte nachzunutzen in unterschiedlichen Formaten in unterschiedlichen Kontexten von unterschiedlichen Nutzern

Was ist TEI? Was bietet die TEI? Consortium Encoding Standard XML Guidelines Werkzeuge / Tools Und mehr…

Die Gründung der TEI Frühling 1987: European workshops on standardisation of historical data Herbst 1987: In the US, the NEH funds an exploratory international workshop on the feasibility of defining "text encoding guidelines” Juni 1990: Release of the first draft (known as "P1") of the Guidelines Vassar College, Poughkeepsie, Herbst 1987

TEI http://www.tei-c.org/ “The TEI was established in 1987 to develop, maintain, and promulgate hardware- and software-independent methods for encoding humanities data in electronic form.” “Over nearly three decades the TEI has been extraordinarily successful at achieving its objective and it is now widely used by scholarly projects and libraries around the world.” “TEI is the de facto standard for text encoding.” http://www.tei-c.org/

<Text Encoding Initiative> TEI P5 Guidelines (derzeit 1.646 Druckseiten) http://www.tei-c.org/release/doc/tei-p5-doc/en/html/index.html Version 2.6.0. (letztes Update am 20. Januar 2014) Tools: OxGarage: Konversion von und nach TEI ROMA: Erstellen von Schemata und Dokumentationen Stylesheets: Konversion von TEI-Dokumenten in diverse Formatvorlagen SIGs, annual members meetings Journal: jTEI http://journal.tei-c.org/journal/index TEI-L Mailingliste: tei-l@listserv.brown.edu Fragen von allen für alle auf allen Niveaus Mail-Archiv: http://listserv.brown.edu/archives/cgi-bin/wa?A0=TEI-L http://markmail.org/list/edu.brown.listserv.tei-l

Aufgabe Konvertiere mittels OxGarage ein Word-Dokument deiner Wahl nach TEI P5. Öffne das Dokument im Oxygen-XML-Editor. Bestimme innerhalb des <text/>-Elements mit Hilfe der Guidelines (Appendices) mind. 4 Elemente: Definition und Modulzugehörigkeit mind. 4 Attribute: Definition und Attributklassen

TEI ist XML TEI folgt den Grundregeln von XML. TEI hat eine ‚Baumstruktur‘: ein Wurzelelement und viele descendant nodes. Ein XML Dokument beinhaltet: Elemente, die Attribute haben können processing instructions Kommentare (begrenzt durch <!- - und - ->) entity references (begrenzt durch & und ;) Die Zeichen < , > und & müssen immer mit < , &rgt; oder & wiedergegeben werden, wenn man sie als solche verwenden möchte. Ein XML Dokument muss wohlgeformt und kann valide sein. a document can be valid in addition to being well-formed. This means that it obeys the rules of a specified schema.

TEI ist XML

TEI Guidelines schränken die im Prinzip unendlichen Möglichkeiten von XML ein stellen formalisierte Schemata zur Validierung von XML-Dateien bereit Fragen, die geklärt werden müssen: Welche Tags und Attribute werden bereitgestellt? Wie dürfen die Tags verschachtelt werden? Wie kann ich die gegebenen Möglichkeiten um eigene Regeln erweitern? …

TEI Customizations Anwendung und Anpassung des TEI-XML Standards Der TEI Standard bietet mehrere hundert Elements und Attribute. Die modulare Architektur der Guidelines erlaubt Teilgruppen von TEI-Elementen zu definieren / auszuwählen. Diese Schemata können mit Hilfe des ROMA-Tools erstellt und modifiziert werden: http://www.tei-c.org/Roma/ oXygen XML editor kann Dokumente mit vordefinierten Schemata verbinden, z.B.: TEI All (umfasst alle Elements, maximales Schema) TEI Bare (umfasst nur absolut notwendige Elemente) TEI Lite (umfasst alle wichtigen und am häufigsten gebrauchten Elemente)

Aufgabe Öffne im Oxygen-XML-Editor ein neues XML-TEI P5-Dokument (TEI Lite). Ersetze die Platzhalter (Title‚ Publication information, Information about the source, Some text here) mit passenden Inhalten.

TEI ist XML <?xml version="1.0" encoding="UTF-8"?> <TEI> <teiHeader> <fileDesc> <titleStmt> <title>Title</title> </titleStmt> <publicationStmt> <p>Publication Information</p> </publicationStmt> <sourceDesc> <p>Information about the source</p> </sourceDesc> </fileDesc> </teiHeader> <text> <body> <p>Some text here.</p> </body> </text> </TEI>

transcription encoding visualisation eBook Analysis Modelling Schema Standards (TEI, XML) Standards (XSLT, CSS) eBook Analysis Modelling Schema Visualisation Prescription database Scholarly digital edition Source Machine readable transcript Encoded text reading text (print) scholarly printed edition transcription encoding visualisation

TEI Grundstruktur Rootelement <TEI> enthält mindestens zwei Unterelemente, nämlich <teiHeader> für Metadaten und muss immer vorhanden sein und <text> für Texte aller Art und/oder <sourceDoc> für genetische Edition / topographische Transkriptionen und/oder <facsimile> für Verknüpfung mit Bildern und/oder <fsdDecl> ‚Feature Structure Declaration‘ v.a. für Textanalysen, linguistische Merkmale u.ä.

N.B.: Only <fileDesc> is mantatory. Der TEI-Header <teiHeader> kann aus vier Hauptteilen bestehen: <fileDesc> (file description) bibliographic description of the electronic text <encodingDesc> (encoding description) description of the relation of the electronic text to its source <profileDesc> (profile description) description of the context in which the electronic text was created, and classification information <revisionDesc> (revision description) description of the revision history of the electronic text N.B.: Only <fileDesc> is mantatory. As indicated in the previous section, the bibliographic file description (<fileDesc>) is the sole mandatory section of any TEI header. When other header sections are present, they must occur in above order.

Grundlegende Elemente TEI-Guidelines: 3 Elements Available in All TEI Documents <p> (paragraph): Absatz <ab> (anonymous block): Irgendein Textblock <head> (head line): Überschrift Außerdem: <lb/> (line break): Zeilenumbruch (z.B. wenn Zeilenumbrüche der Vorlage mit transkribiert werden) <pb/> (page break): Seitenumbruch, normalerweise der der Vorlage … mit @n, @type, @xml:id spezifizierbar

Strukturelle Gliederungselemente TEI-Guidelines: 4 Default Text Structure <div> (Division): Abschnitte im Dokument z.B. Buch, Kapitel, einzelne Gedichte, Akte/Szenen u.ä. Wichtige Attribute: @n (Nummerierung) z.B. "1.1.2.a" (entweder aus der Quelle übernommen oder selbst erstellt) @type z.B. "book", "chapter", "poem") @xml:id (eindeutiger Identifikator) darf im gesamten Dokument nur einmalig vergeben werden muss mit einem Buchstaben beginnen (i.d.R. selbst vergeben oder automatisch erzeugt)

Hervorhebung und wörtliche Rede <hi> (highlighted) allgemeiner Tag für Hervorhebungen z.B. für kursiv, fett, g e s p e r r t etc. spezifizierbar durch @rend <foreign>, <emph>, <distinct> verschiedene Hervorhebungsarten bzw. Markierung ‚ungewöhnlicher‘ Textteile (Fremdsprachiges, Betonung, Archaismen etc.) <q> (quoted) für wörtliche Rede, Fachausdrücke, „sog.“ (anstelle von Anführungsstrichen) <quote> (quotation) und <cit> (citation) für Zitate

Noch ein paar Elemente:

Warum TEI? zum Austausch von Textdaten und Resourcen zwischen Menschen zwischen Maschinen Stichwort “Interoperabilität” zur Intergration von Textdaten und Resourcen von unterschiedlichen Medien aus unterschiedlichen Softwareumgebungen zur Langzeitarchivierung und -verfügbarkeit Metadaten Daten, Inhalte Transmedialisation, standardised way of seperating content and form

Warum nicht TEI?

TEI… Hilfe?! TEI P5 Guidelines: http://www.tei-c.org/release/doc/tei-p5-doc/en/html/index-toc.html IDE: Folien, Mailinglist, Mitglieder TEI by Example (tutorial): http://www.tbe.kantl.be TEI @ Oxford (school material): http://tei.oucs.ox.ac.uk/Talks/; z.B.: http://tei.oucs.ox.ac.uk/Talks/2014-01-toronto/ TEI-L@listserv.brown.edu http://listserv.brown.edu/archives/cgi-bin/wa?A0=TEI-L http://markmail.org/list/edu.brown.listserv.tei-l