Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Text Encoding Initiative Institut für Informationsverarbeitung in den Geisteswissenschaften Hubert Stigler / Petra Steinkellner Guidelines.

Ähnliche Präsentationen


Präsentation zum Thema: "Text Encoding Initiative Institut für Informationsverarbeitung in den Geisteswissenschaften Hubert Stigler / Petra Steinkellner Guidelines."—  Präsentation transkript:

1 Text Encoding Initiative www.tei-c.org Institut für Informationsverarbeitung in den Geisteswissenschaften Hubert Stigler / Petra Steinkellner Guidelines for Electronic Text Encoding and Interchange 1. Ausgabe 1994 (TEI P3)

2 Allgemeines Unabhängiges, portables und offenes Dokumentenformat zur Kodierung von Texten, gedruckten Werken (Editionswissenschaft), von sprachlichen Informationen (Linguistik), von Korpora gesprochener Sprache, von Urkunden u.v.m. Modulübersicht der TEI 5 analysisAnalysis and Interpretation certaintyCertainty and uncertainty coreElements common to all TEI documents corpusHeader extensions (Metadata) for corpus texts declarefsFeature system declarations dictionariesPrinted dictionaries dramaPerformance texts figuresTables, formulae, and figures gaijiCharacter and glyph documentation headerTEI Header (Common Metadata) iso-fsFeature structures linkingLinking, segmentation, and alignment msdescriptionManuscript description namesdatesNames and dates netsGraphs, networks and trees spokenTranscribed Speech tagdocsDocumentation of TEI modules teiDeclarations for datatypes, classes, and macros available to all TEI modules (TEI Infrastructure) textcritText criticism textstructureDefault text structure verseVerse structures

3 Grundstruktur eines TEI modellierten Textes

4 Das teiHeader-Element Bibliographische Beschreibung des Textes Informationen über Titel und für den Inhalt Verantwortliche Titel des elektronischen Textes!! Informationen zur Veröffentlichung des (elektronischen) Textes Beschreibung der Quelle des elektronischen Textes

5 Das body-Element … …

6 Attribute des div-Elementes typeName der Kategorie des Textabschnittes dTexteindeutige Kennung des Textabschnittes nExterne Nummerierung u.Ä. Empirisch-analytisches Wissenschaftsverständnis...

7 Absätze Rechts von dem Bette des Vaters Rhein und gerade in der Mitte des Bodens war eine große und runde Öffnung mit einem goldenen Gitter umgeben; es führten Stufen hinab, und unten sah man rings eine Menge Bogengänge nach allen Seiten hin laufen, aus deren jedem ein anderer Glanz herausschimmerte: grün, rot, blau, gelb, violett, kurz alle möglichen Farben, und als die Nymphen den alten Wassermann fragten, woher dieser wunderbare Schimmer komme, sagte er …

8 Anmerkungen, Fußnoten, Marginalien u.Ä. … Mögliche Angaben für das Attribut "place": left, right, foot, end u.a. Beide entwarfen große Teile ihres Gesamtwerkes nach der Figur des opus Horatianum, d.h. sie verfaßten als ihren wichtigsten Beitrag zur französischen bzw. italienischen Nationalliteratur jeweils eine Reihe von Verssatiren und ein Lehrgedicht über die Dichtkunst Bei Boileau wird das Bild der Horaz-Nachfolge noch durch die zwölf Epîtres vervollständigt, bei Menzini - in einer interessanten Variation – durch die Oden bzw. Canzoni der Poesie liriche. Vgl. Benedetto Fiorentino (Menzini): Poesie liriche, Firenze 1680. Außerhalb der Horaz-Nachfolge stehen freilich die epischen Versuche des Lutrin und des Terrestre Paradiso.. Da sie überdies beinahe Zeitgenossen waren und ….

9 Annotationen im Text Typographische Hervorhebungen Textabschnitte, Phrasen Fremdsprachige Begriffe Fachbegriffe Titel Namen Zahlen Abkürzungen

10 Hervorhebungen Beide entwarfen große Teile ihres Gesamtwerkes nach der Figur des Opus Horatianum, d.h. sie verfaßten als ihren wichtigsten Beitrag zur französischen bzw. italienischen Nationalliteratur jeweils eine Reihe von Verssatiren und ein Lehrgedicht über die Dichtkunst.

11 Fremdsprachige Begriffe … wird Boileau ebenfalls getreu paraphrasiert. Hieß es französisch (I 30) La rime est une esclave et ne doit qu’obéir, …

12 Zahlen, Datums- und Zeitangaben 2. Februar 1980 Um drei Uhr am Nachmittag … XXXIII

13 Die wichtigsten „globalen Attribute“ xml:langSprache xml:idtexteindeutiger Bezeichner nBezeichner (ohne Einschränkungen) anaBezeichner einer Interpretationskategorie rendTypographische Hervorhebung

14 Listen Einfache Listen Listen von bibliographischen Einträgen oder...

15 Interpretationskategorien … Aus „Loreleilied“ von L. Eichrodt:... Der Strudel wird uns erfassen Ihr lockigen Männer, herauf, herbei! Wer holt sich von euch die Lorelei? … Siehe auch unter: http://www2.hu-berlin.de/literatur/projekte/loreley/

16 Tag Set zur Auszeichnung von gesprochenem Text Sprachliche Äußerung (utterance) Pause zwischen oder innerhalb sprachlicher Äußerungen Semi-lexikalische Äußerungen, z.B. „versprachlichte“ Pausen äh, aha, eh u.Ä. Nicht sprachliche, aber kommunikative Äußerungen bzw. Gesten (z.B.Stirnrunzeln u.Ä.) (Nicht-sprachliche) Ereignisse in Kommunikationsverlauf Für den Verlauf des gesprochenen Textes relevante „geschriebene“ Textpassagen (z.B. Zeitungsartikel, Suchergebnisse von Internetrecherchen u.Ä.) Marker für deutliche Veränderungen in Bezug auf paralinguistische Phänomene wie Intonation, Stimme, Tempo etc. http://www.tei-c.org/release/doc/tei-p5-doc/html/TS.html


Herunterladen ppt "Text Encoding Initiative Institut für Informationsverarbeitung in den Geisteswissenschaften Hubert Stigler / Petra Steinkellner Guidelines."

Ähnliche Präsentationen


Google-Anzeigen