Text Encoding Initiative (TEI) Universität zu Köln, SS 2009, HKI Seminar: Daten- und Metadatenstandards Dozent: Herr Sahle Referentin: Ulrike Henny Datum:

Slides:



Advertisements
Ähnliche Präsentationen
Entwicklung von Schemata für den XML-Dokumentenaustausch mit Hilfe des Resource Description Framework (RDF) John McClure Präsentation.
Advertisements

25. Mai 2001Kleyer/Oyen/ReuseFolie 1 Fallstudie im Rahmen des Studienganges Wirtschaftsinformatik Christian Kleyer, Daniel Oyen, Svend Reuse Grundkonzeption.
Extensible Markup Language
Worzyk FH Anhalt Datenbanksysteme für FÜ WS 2004/2005 XML - 1 XML Extensible Markup Language.
IT-Zertifikat der Phil.Fak
DTD XML-Technik Dino Azzano. Definition Document Type Definition Beschreibung der Regeln zum Aufbau aller XML-Dokumente, die zu einer Dokumentklasse.
Anmerkungen zu XML Im September 2000 Entwicklung/Anspruch von XML
P. Sahle und S. Kurz Historisch Kulturwissenschaftliche Informationsverarbeitung IT-Zertifikat der Philosophischen Fakultät Moderne Technik.
SVG und X3D Referentin: Gergana Ivanova
MS Office-Paket: Access
TEI (Text Encoding Initiative) Ein Standard für die elektronische Erfassung von Textquellen.
XML - Aufbau und Struktur - mit Einsatz im B2B
Hands On – Einführung in XML
IMS Universität Stuttgart 1 Einführung in XML Hannah Kermes HS: Elektronische Wörterbücher Do,
FH-Hof Extensible Markup Language Richard Göbel. FH-Hof Extensible Markup Language XML XML ist universeller Ansatz für die Strukturierung von Zeichenketten.
DOM (Document Object Model)
XINDICE The Apache XML Project Name: Jacqueline Langhorst
Datenbanken vs. Markup Manfred Thaller WS 2009/2010 Humanities Computing Linda Scholz.
TEI Philosophische Fakultät IT-Zertifikat Datenstandards Johanna Bächer
Universität zu Köln IT – Zertifikat der Philosophischen Fakultät / Kurs: Daten- und Metadatenstandards mit Patrick Sahle M. A. Lingua Franca für Daten:
XML-Schema HKI Proseminar Wintersemester 2010/11 Dozentin: Frau Kurz von Jan Kohl und Christian Lütticke.
METS/MODS Referat im Rahmen des IT-Zertifikats f ü r Geisteswissenschaftler Leitung: P. Sahle Referentin: C. Ottnad.
HTML - Eine erste Annäherung
Welcome DTD. Document Type Definition Graphic Services/Everything you already know about presentations Was ist eine DTD? DTD ist eine Schemasprache.
XML-Parser Manuel Röllinghoff.
XHTML 1.1 C. Nimz Abstrakte Module XHTML 1.1 C. Nimz Was ist ein abstraktes Modul? Definition eines XHTML-Moduls in spezieller leichter.
Modularization of XHTML™
SQL/XML. © Prof. T. Kudraß, HTWK Leipzig 2 2 Motivation Speicherung von XML in allen großen kommerziellen DBMS vorhanden proprietäre Lösungen für die.
Einführung XML XML Einführung Andreas Leicht.
1 XML und Datenbanken Kapitel 7: Modellierung, Teil 1 Meike Klettke Universität Rostock Fakultät für Informatik und Elektrotechnik
1 Grundlagen und Anwendung der Extensible Markup Language (XML ) Peter Buxmann Institut für Wirtschaftsinformatik Johann Wolfgang Goethe-Universität Frankfurt.
Austauschformate für Terminologie
Was versteht man unter XML Schema?
Data Documentation Initiative (DDI)
Wissenschaftliche Übung Metadatenformate und -standards
T E I [Text Encoding Initiative] IT-Zertifikat Kurs 4 :Daten und Metadaten Dozent: Patrick Sahle.
Vortrag HTML, XHTML, DHTML
Erstellen einer Webseitenstatistik mithilfe eines OLAP-Servers
Erstellen einer Webseitenstatistik mithilfe eines OLAP-Servers
Typo3 Templates und TypoScript
Metadata Encoding & Transmission Standard
Wird ganz am Anfang der HTML-Datei geschrieben Doctype html public bedeutet, dass man sich auf die Öffentlichkeit der html-dtd bezieht Html ist die meist.
Java für Fortgeschrittene
Daniel Kucher Proseminar XHTML. 1. HTML – Struktur und Versionen 2. Der – Teil 3. Der – Teil 4. Stylesheets (CSS) – Das Rückrat von XHTML.
Ausgabe vom Seite 1, XML Eine Einführung XML - Eine Einführung.
Kurzpräsentation von Herbert Schlechta
IT-Zertifikat Kurs IV Gunther Sarling
Dublin Core IT-Zertifikat Daten- und Metadatenstandards.
Daten- und Metadatenstandards SoSe 2009 IT-Zertifikat der Philosophischen Fakultät der Universität zu Köln Dozent: Patrick Sahle 26. Juni 2009: Dublin.
XML-Verarbeitung mit dem.NET-Framework. Inhalt 1.XML-Verarbeitung mittels XmlReader- und XmlWriter-basierter Klassen 2.XML-Verarbeitung mittels XmlDocument.
Museumdat 1.0 XML-basiertes Schema zur Bereitstellung von Kerndaten in museumsübergreifenden Beständen Daten- und Metadatenstandards Dozent: Patrick Sahle.
Hauptseminar Web-Services und verteilte Datenbanken Thema XML, DTDs und XML-Schema XML, DTDs und XML-Schema - Stefan Kurz, 25. April 2003.
IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle Semantic WebWS 08/09.
- Warum: Das HTML-Dilemma
IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle XML-BasicsWS 08/09.
XML Die “E-Lance Economy” oder die “Digital Economy” stellt neue Anforderungen an Funktionalität im Netz. XML wurde vom World Wide Web Consortium (W3C)
Seminar zur Geoinformation Folie 1 Inhalt: –XML –XML- SCHEMA –XSL –Syntax –GML Seminar zur Geoinformation Datenaustausch mit XML / GML im InternetDatenaustausch.
Text Encoding Initiative Universität zu Köln Daten- und Metadatenstandards Seminarleitung: Patrick Sahle Seminarleitung: Patrick Sahle Referentin: Anna.
Peter Brezany Institut für Softwarewissenschaften Universität Wien
(Syntax, Strings/Zahlen, Variablen, Arrays)
XML Schema Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung WS2011/2012 Hist.-kult.wiss. Informationsverarbeitung (Teil.
TEI Die Text Encoding Initiative (TEI-Konsortium), 1987 gegründet - Dokumentenformat (zunächst SGML)‏
1 Java und XML Stephan Baldes Warum XML? In welchem Format wurden die Daten gespeichert? Bernd;Thomas;3;5;1987;Freiburg;Karlsruhe Peter;Maier;7;9;1980;Karlsruhe;Freiburg.
XSLT I Re-usable Content in 3D und Simulationssystemen Dozent: Prof. Manfred Thaller Referentin: Elisabeth Chang.
Semantic Markup für Zwecke der Langzeitarchivierung in digitalen Bibliotheken Neubiberg,
13.Dezember 2006–1Elektronisches Publizieren: Schemasprachen — Relax NG Schemasprachen für XML — Relax NG — Anne Brüggemann-Klein TU München.
Theorie. Was ist Drupal? Content-Management-System, Open Source Software Hauptanwendung in der Organisation von Websites In PHP geschrieben und wird als.
Digitale Langzeitarchivierung Internet Universität zu Köln WS 2011/12 Dozent: Prof. Dr. Manfred Thaller AM 2: Digitale Langzeitarchivierung Referentin:
Ein Toolkit zur Präsentation von hierarchischen Bibliotheksdaten Andres von Arx UB Basel, August 2006.
MusicXML und MEI.
 Präsentation transkript:

Text Encoding Initiative (TEI) Universität zu Köln, SS 2009, HKI Seminar: Daten- und Metadatenstandards Dozent: Herr Sahle Referentin: Ulrike Henny Datum:

Text Encoding Initiative (TEI) TEI meint: - das TEI-Konsortium - ein Dokumentenformat zur Kodierung und zum Austausch von Texten TEI-Konsortium: - geht auf eine 1987 gegründete Organisation zurück - seit 2000 Konsortium zum Erhalt, Entwicklung und Verbreitung von TEI

TEI - Ziele - Fokus auf bereits existierenden Texten traditioneller Medien (text capture vs. text creation) - Anwendbarkeit für Texte jeglicher Art: jede natürliche Sprache, jede Epoche, jedes literarische Genre, Wörterbücher, linguistische Korpora... - verlustfreien Datenaustausch garantieren - dabei Unabhängigkeit von Programmen, Computersystemen und Anwendungssoftware - Betonung der modularen Natur von TEI: Flexibilität!

TEI - Auszeichnungssprache verschiedene Versionen: - P1 (P = proposal) bis P5 (aktuelle Version) - P1 bis P3: SGML-Syntax - P4: Wahl zwischen SGML und XML möglich - P5: basiert auf XML, Verbindung zu XML-basierten Schemasprachen, zu XSLT und Xquery

TEI - Auszeichnungssprache Aufbau von TEI: - tag set aus XML-Elementen → ca. 500! - @type) - 2 Hauptkategorien: 1. Elemente für Metadaten 2. Elemente für Merkmale des Textes selbst - sachbezogene Module - Elementklassen (z.B. model.biblLike, model.divPart) - Attributklassen (z.B. att.global) → formale Klassifikation der Elemente, Hierarchie: Superklassen & Subklassen, bottom-up statt top- down

TEI - Module Module (Auswahl): tei → TEI-Infrastruktur: Module, Klassen header → Metadaten core → Elemente für alle Dokumente textstructure → allgemeiner Dokumentaufbau namesdates → Namen, Daten, Personen, Orte figures → Tabellen, Formulare, Graphiken drama → dramatische Texte verse → Lyrik msdescription → Manuskripte dictionaries → Wörterbücher corpus → Korpora spoken → gesprochene Sprache

TEI - Schema Auswahl von Modulen zur Beschreibung eines bestimmten Textes: Standardmodule + Zusatzmodule Auswahl wird in einem TEI-Schema festgehalten: - selbst TEI-Dokument - ODD-Dokument: „one document does it all“ - kann in XML DTD, RELAX NG, W3C-Schema umgewandelt werden - Auswahl & Erweiterung von Klassen & Elementen möglich - TEI-Schema: nötig für Validität eines TEI- Dokuments

TEI - Schema Beispiel für ein TEI-Schema: → ODD-Prozesser generiert aus diesen Deklarationen ein Schema

TEI - Schema Mögliche Änderungen: - Unterdrückung von Elementen (z.B. aus dem Modul namesdates) - Umbenennung von Elementen ( statt ) - Modifikation von Attributen und Attributwerten nur Werte „person“ & „place“) - neue Elemente hinzufügen ( ) - Inhaltsmodelle ändern - Klassenzugehörigkeit ändern

Anpassung eines Schemas: durch das Tool Roma vereinfacht! Link:

TEI - Dokument Grundgerüst:Header: - enthält Metadaten (Bibliographisches, Kodierung, Textprofil, Revision) - wichtig für: Katalogisierung, Anwendungssoftware, wissenschaftliche Arbeit

TEI - Fazit - TEI bietet ein breites Spektrum an Elementen - detaillierte Auszeichnungen möglich - aber: Standard zunächst nicht so leicht zugänglich - Konzentration auf Texte aus dem geisteswissenschaftlichen Bereich (für KoelnCampus Sendungsbeschreibung nur bedingt geeignet) Offizielle Website: