Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Franz Fischer franz.fischer@uni-koeln.de Einführung in die TEI Franz Fischer franz.fischer@uni-koeln.de.

Ähnliche Präsentationen


Präsentation zum Thema: "Franz Fischer franz.fischer@uni-koeln.de Einführung in die TEI Franz Fischer franz.fischer@uni-koeln.de."—  Präsentation transkript:

1 Franz Fischer franz.fischer@uni-koeln.de
Einführung in die TEI Franz Fischer

2 Wiederhohlung: Warum Texte kodieren?
um maschinenlesbar (explizit) zu machen, was vom Leser implizit verstanden wird um Texte mit Informationen anzureichern um Texte nachzunutzen in unterschiedlichen Formaten in unterschiedlichen Kontexten von unterschiedlichen Nutzern

3 Was ist TEI? Was bietet die TEI? Consortium Encoding Standard XML
Guidelines Werkzeuge / Tools Und mehr…

4 Die Gründung der TEI Frühling 1987: European workshops on standardisation of historical data Herbst 1987: In the US, the NEH funds an exploratory international workshop on the feasibility of defining "text encoding guidelines” Juni 1990: Release of the first draft (known as "P1") of the Guidelines Vassar College, Poughkeepsie, Herbst 1987

5 TEI http://www.tei-c.org/
“The TEI was established in 1987 to develop, maintain, and promulgate hardware- and software-independent methods for encoding humanities data in electronic form.” “Over nearly three decades the TEI has been extraordinarily successful at achieving its objective and it is now widely used by scholarly projects and libraries around the world.” “TEI is the de facto standard for text encoding.”

6 <Text Encoding Initiative>
TEI P5 Guidelines (derzeit Druckseiten) Version  (letztes Update am 20. Januar 2014) Tools: OxGarage: Konversion von und nach TEI ROMA: Erstellen von Schemata und Dokumentationen Stylesheets: Konversion von TEI-Dokumenten in diverse Formatvorlagen SIGs, annual members meetings Journal: jTEI TEI-L Mailingliste: Fragen von allen für alle auf allen Niveaus Mail-Archiv:

7 Aufgabe Konvertiere mittels OxGarage ein Word-Dokument deiner Wahl nach TEI P5. Öffne das Dokument im Oxygen-XML-Editor. Bestimme innerhalb des <text/>-Elements mit Hilfe der Guidelines (Appendices) mind. 4 Elemente: Definition und Modulzugehörigkeit mind. 4 Attribute: Definition und Attributklassen

8 TEI ist XML TEI folgt den Grundregeln von XML.
TEI hat eine ‚Baumstruktur‘: ein Wurzelelement und viele descendant nodes. Ein XML Dokument beinhaltet: Elemente, die Attribute haben können processing instructions Kommentare (begrenzt durch <!- - und - ->) entity references (begrenzt durch & und ;) Die Zeichen < , > und & müssen immer mit < , &rgt; oder & wiedergegeben werden, wenn man sie als solche verwenden möchte. Ein XML Dokument muss wohlgeformt und kann valide sein. a document can be valid in addition to being well-formed. This means that it obeys the rules of a specified schema.

9 TEI ist XML

10 TEI Guidelines schränken die im Prinzip unendlichen Möglichkeiten von XML ein stellen formalisierte Schemata zur Validierung von XML-Dateien bereit Fragen, die geklärt werden müssen: Welche Tags und Attribute werden bereitgestellt? Wie dürfen die Tags verschachtelt werden? Wie kann ich die gegebenen Möglichkeiten um eigene Regeln erweitern?

11 TEI Customizations Anwendung und Anpassung des TEI-XML Standards
Der TEI Standard bietet mehrere hundert Elements und Attribute. Die modulare Architektur der Guidelines erlaubt Teilgruppen von TEI-Elementen zu definieren / auszuwählen. Diese Schemata können mit Hilfe des ROMA-Tools erstellt und modifiziert werden: oXygen XML editor kann Dokumente mit vordefinierten Schemata verbinden, z.B.: TEI All (umfasst alle Elements, maximales Schema) TEI Bare (umfasst nur absolut notwendige Elemente) TEI Lite (umfasst alle wichtigen und am häufigsten gebrauchten Elemente)

12 Aufgabe Öffne im Oxygen-XML-Editor ein neues XML-TEI P5-Dokument (TEI Lite). Ersetze die Platzhalter (Title‚ Publication information, Information about the source, Some text here) mit passenden Inhalten.

13 TEI ist XML <?xml version="1.0" encoding="UTF-8"?> <TEI> <teiHeader> <fileDesc> <titleStmt> <title>Title</title> </titleStmt> <publicationStmt> <p>Publication Information</p> </publicationStmt> <sourceDesc> <p>Information about the source</p> </sourceDesc> </fileDesc> </teiHeader> <text> <body> <p>Some text here.</p> </body> </text> </TEI>

14 transcription encoding visualisation eBook Analysis Modelling Schema
Standards (TEI, XML) Standards (XSLT, CSS) eBook Analysis Modelling Schema Visualisation Prescription database Scholarly digital edition Source Machine readable transcript Encoded text reading text (print) scholarly printed edition transcription encoding visualisation

15 TEI Grundstruktur Rootelement <TEI>
enthält mindestens zwei Unterelemente, nämlich <teiHeader> für Metadaten und muss immer vorhanden sein und <text> für Texte aller Art und/oder <sourceDoc> für genetische Edition / topographische Transkriptionen und/oder <facsimile> für Verknüpfung mit Bildern und/oder <fsdDecl> ‚Feature Structure Declaration‘ v.a. für Textanalysen, linguistische Merkmale u.ä.

16 N.B.: Only <fileDesc> is mantatory.
Der TEI-Header <teiHeader> kann aus vier Hauptteilen bestehen: <fileDesc> (file description) bibliographic description of the electronic text <encodingDesc> (encoding description) description of the relation of the electronic text to its source <profileDesc> (profile description) description of the context in which the electronic text was created, and classification information <revisionDesc> (revision description) description of the revision history of the electronic text N.B.: Only <fileDesc> is mantatory. As indicated in the previous section, the bibliographic file description (<fileDesc>) is the sole mandatory section of any TEI header. When other header sections are present, they must occur in above order.

17 Grundlegende Elemente
TEI-Guidelines: 3 Elements Available in All TEI Documents <p> (paragraph): Absatz <ab> (anonymous block): Irgendein Textblock <head> (head line): Überschrift Außerdem: <lb/> (line break): Zeilenumbruch (z.B. wenn Zeilenumbrüche der Vorlage mit transkribiert werden) <pb/> (page break): Seitenumbruch, normalerweise der der Vorlage @xml:id spezifizierbar

18 Strukturelle Gliederungselemente
TEI-Guidelines: 4 Default Text Structure <div> (Division): Abschnitte im Dokument z.B. Buch, Kapitel, einzelne Gedichte, Akte/Szenen u.ä. Wichtige Attribute: @n (Nummerierung) z.B. "1.1.2.a" (entweder aus der Quelle übernommen oder selbst erstellt) @type z.B. "book", "chapter", "poem") @xml:id (eindeutiger Identifikator) darf im gesamten Dokument nur einmalig vergeben werden muss mit einem Buchstaben beginnen (i.d.R. selbst vergeben oder automatisch erzeugt)

19 Hervorhebung und wörtliche Rede
<hi> (highlighted) allgemeiner Tag für Hervorhebungen z.B. für kursiv, fett, g e s p e r r t etc. spezifizierbar <foreign>, <emph>, <distinct> verschiedene Hervorhebungsarten bzw. Markierung ‚ungewöhnlicher‘ Textteile (Fremdsprachiges, Betonung, Archaismen etc.) <q> (quoted) für wörtliche Rede, Fachausdrücke, „sog.“ (anstelle von Anführungsstrichen) <quote> (quotation) und <cit> (citation) für Zitate

20 Noch ein paar Elemente:

21 Warum TEI? zum Austausch von Textdaten und Resourcen
zwischen Menschen zwischen Maschinen Stichwort “Interoperabilität” zur Intergration von Textdaten und Resourcen von unterschiedlichen Medien aus unterschiedlichen Softwareumgebungen zur Langzeitarchivierung und -verfügbarkeit Metadaten Daten, Inhalte Transmedialisation, standardised way of seperating content and form

22 Warum nicht TEI?

23 TEI… Hilfe?! TEI P5 Guidelines: IDE: Folien, Mailinglist, Mitglieder TEI by Example (tutorial): Oxford (school material): z.B.:


Herunterladen ppt "Franz Fischer franz.fischer@uni-koeln.de Einführung in die TEI Franz Fischer franz.fischer@uni-koeln.de."

Ähnliche Präsentationen


Google-Anzeigen