Semantic Markup für Zwecke der Langzeitarchivierung in digitalen Bibliotheken Neubiberg,
Gliederung Semantic Markup Anforderungen Formen Ansätze Zusammenfassung
Semantic Markup Tell what it is No Layout Metadaten Beschreibung des gesamten Dokuments Textauszeichnung Textauszeichnung Zeichenfolge Markup Markup Bedeutung What is it?
Semantic Markup Zusammenhang mit Langzeitarchivierung Informationserhaltung Erhaltung der Bedeutung Semantische Suche Informationen extrahieren Dokumentauswahl Metadaten
Semantic Markup Ebenen
Anforderungen (1) Plattformunabhängigkeit Human-readable Machine-interpretable Eindeutigkeit Vollständigkeit
Anforderungen (2) Emulierbarkeit / Migrierbarkeit Editierbarkeit (oder nicht?) Einfachheit Erweiterbarkeit Modularität
Formen Physisch Digital Veränderbar Nicht veränderbar Medien
Formen Semantic Markup
Ansätze SGML / XML Dokument = DAG DTD Regeln Stylesheets Layout Metasprachen (SGML/XML) Dokument DTD Stylesheet Conventions Ausgabe Stylesheet
Ansätze Plattformunabhängigkeit Human Readability Erweiterbarkeit Modularität Leichte Emulier- / Migrierbarkeit Einfache Dokumentenstruktur Metasprachen (Vorteile)
Ansätze Metasprachen f :: Element -> Semantik
Ansätze Metadaten Basis-Menge von Metadaten Keine Implementationsvorschrift Dublin Core Element Set Dublin Core Element Set Attribute Semantik Bereits häufig eingesetzthäufig Dublin Core Metadata Initiative (DCMI)
Ansätze Philologische Texte SGML/XML - DTD Metadaten: Metadaten: teiHeader Dokumentinhalt: Dokumentinhalt: text TEI Documentation Semantik “Stand Alone” Text Encoding Initiative (TEI)
Ansätze Maschinenlesbare Suchunterstützung SGML/XML – DTD Metadaten Metadaten (ähnlich TEI) kein Semantic Markup im Dokument Tag-Bibliothek Semantik Bereits häufig eingesetzthäufig Encoded Archival Description (EAD)
Ansätze ???? f :: Element -> Semantik
Ansätze Automatische Verarbeitung von WWW-Inhalten machine understandable Ziel: „machine understandable“ Keine Implementationsvorschrift Semantik Baumstruktur gleiche Bäume Dokumente gleichwertig RDF-Schema RDF-Schema Resource Description Framework (RDF) f :: Element -> Semantik
Ansätze RDF (Beispiel)
Nutzen für Langzeitarchivierung Vorteile digitaler Dokumente nutzen Vorteile digitaler Dokumente nutzen Metadaten EAD, DCMI, RDF Semantic Markup TEI Derzeitige Praxis: Derzeitige Praxis: Metadaten Reicht das?
Fragen ? !