Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle Daten- und Metadaten SS 09.

Ähnliche Präsentationen


Präsentation zum Thema: "IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle Daten- und Metadaten SS 09."—  Präsentation transkript:

1 IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle Daten- und Metadaten SS 09

2 TEI (Text Encoding Initiative) Einstieg homesick-blues homesick-blues content/uploads/tei/Encoded_Dylan_Lyrics.xml content/uploads/tei/Encoded_Dylan_Lyrics.xml

3 TEI (Text Encoding Initiative) Basics: Wikipedia Grundansatz (Auszeichnung als Abstraktion) Schieflagen? Anwendungsbereich?

4 TEI (Text Encoding Initiative) Ein Beispiel: site: file: TEI verstehen und benutzen Einstieg: Elemente: ELEMENTS.htmlhttp://www.tei-c.org/release/doc/tei-p5-doc/en/html/REF- ELEMENTS.html

5 TEI (Text Encoding Initiative) TEI Strukturen P5: ongoing activities:

6 TEI (Text Encoding Initiative) TEI anwenden Das Roma-Tool:

7 Dublin Core (DC) Einstieg: (besser!)http://en.wikipedia.org/wiki/Dublin_Core Organisatorischer, historischer und konzeptioneller Hintergrund

8 Dublin Core einfacher Satz an Elementen/Begriffen zur Beschreibung von Objekten auf der Metadatenebene core elements, version 1.1, ISO (2003): identifier format, type, language title, subject, coverage, description creator, publisher, contributor, rights, provenance relation, source date

9 Dublin Core "Dublin Core Simple" (15 Elemente) vs. "Dublin Core Qualified" (element refinements) "Begriffe im Namensraum DCTerms" (55 Elemente):

10 Dublin Core … definiert Begriffe / Konzepte, keine Syntax … kann ausgedrückt werden z.B. mittels HTML oder XML DC Einführung Patrick Sahle

11 Dublin Core Anwendungsbeispiel: BSB-Digitalisate an der OAI-Schnittstelle Reichstagshandbuch. Reichsdr text/xml 6 Reichstagshandbuch. Reichsdr text/xml 1

12 DC revisited Vor und Nachteile? Lob der Einfachheit! Informationsreduktion? (Strategien) Gebunden an Perspektiven und Wissensbereiche Was ist das Objekt? Granularität, Seitenbezug Typ, Ontologischer Status

13 Rekapitulation: Dublin Core (DC) "Scope" Ansatz Datenstandard, kein Datenformat Syntax? HTML und XML. Dublin Core Simple / Dublin Core Qualified Vor- und Nachteile? Problematisierung?

14 Dublin Core Anwendungsbeispiel: OPAL

15 Dublin Core Anwendungsbeispiel: OPAL myOpal xmlDownload ein Beispiel aussuchen Was ist hier los? Ist das noch Dublin Core? Lokale Anwendung! Dokumentation: "Application Profile" Leicht übersetzbar auf Standard-"Dublin Core"

16 DC revisited Vor und Nachteile? Lob der Einfachheit! Informationsreduktion? (Strategien) Gebunden an Perspektiven und Wissensbereiche Was ist das Objekt? Granularität, Seitenbezug Typ, Ontologischer Status

17 OAI = Open Archives Initiative (eigentlich: OAI-PMH = Protocol for Metadata Harvesting)

18 OAI Einstieg: Beispiel für eine Schnittstelle zur Kommunikation von (Meta-)Daten über das Internet Wichtige Begriffe: Data-Provider, Service-Provider

19 OAI Datenkommunikation über http-Request Basisadresse + Script (+ Verb (+ Argument) ? )* Sechs "Verben" zur Kommunikation Identify [wer bist du?] ListMetadataFormats [was sprichst du?] ListSets[was hast du für Sammlungen?] ListIdentifiers[gib mir deine Identifier] ListRecords[gib mir Datensätze] GetRecords[gib mir Datensätze] Sechs "Argumente": metadataPrefix, identifier, from, until, set, resumptionToken

20 OAI Beispielanwendungen OAISTER (Service Provider): ZVDD (Data Provider): BSB (Data Provider): CEEC (Data Provider):

21 OAI Beispielanwendung CEEC Handschrift Dom 213 Bild: cgi/kleioc/0010/exec/pagesma/%22kn _001.jpg%22/segment/%22body%22http://www.ceec.uni-koeln.de/ceec- cgi/kleioc/0010/exec/pagesma/%22kn _001.jpg%22/segment/%22body%22 Beschreibung: cgi/kleioc/0010/exec/katl/%22kn %22http://www.ceec.uni-koeln.de/ceec- cgi/kleioc/0010/exec/katl/%22kn %22 XML (TEI-like): koeln.de/projekte/CEEC/database/descriptions/kn xmlhttp://www.ceec.uni- koeln.de/projekte/CEEC/database/descriptions/kn xml OAI (oai_dc): oai/kleioc?verb=GetRecord&metadataPrefix=oai_dc&identifier=kn http://www.ceec.uni-koeln.de/ceec- oai/kleioc?verb=GetRecord&metadataPrefix=oai_dc&identifier=kn

22 Rekapitulation: OAI (PMH) "Scope" http-Requests "Schnittstelle"; Data-Provider, Service-Provider Sechs "Verben" ( Identify, ListMetadataFormats, ListSets, ListIdentifiers, ListRecords, GetRecords ), mehrere "Argumente" oai_dc plus weitere Metadatenformate

23 Metadaten im BAM-Sektor (Bibliotheken / Archive / Museen – a.k.a Cultural Heritage) Bibliotheken: METS Archive: EAD Museen: museumdat

24 Metadaten in Bibliotheken Bibliographische Daten MAB2 MARC ( RDA) MODS DC Komplexe digitale Objekte METS / MODS

25 METS / MODS (Zusammenfassung) "Scope" Problemlage verschiedene Sichten auf ein Objekt Grundprinzip Verbindung verschiedener Arten von Metadaten (METS-header, descriptive metadata, administrative metadata, files, structural map, links) Nochmals ein Beispiel? (Ponickau)

26 7 Abschnitte eines METS-Dokuments - Der Kopfteil - METS Header - Erschließungsangaben - Descriptive Metadata -Verwaltungsangaben - Administrative Metadata - Dateiabschnitt - File Section - Strukturbeschreibung – Structural Map - Strukturverknüpfungen – Structural Links - Verhalten – Behavior

27 … … METS als Containerformat

28 Konkurrierende Hierarchien?

29 Rekapitulation: Metadaten in Bibliotheken Traditionell: Bibliographische Daten Ausweitung: Komplexe digitale Objekte Standard: METS / MODS "Scope" Problemlage verschiedene Sichten auf ein Objekt Grundprinzipien Verbindung unterschiedlicher Metadaten (METS-header, descriptive metadata, administrative metadata, files, structural map, links) "Containerformat"

30 Metadaten im Archiv: EAD Die Heimat von EAD: wikipedia: Scope Bestandteile: 146 Elemente zur Beschreibung von Findmitteln und Archivalien eadHeader (über die EAD-Datei) archDesc did (Zum Gesamtbestand) dsc / c… (Beschreibung über geschachtelte Container) Beispiel:

31 Rekapitulation: Metadaten in Archiven; EAD Scope Findmittel, nicht Archivalien Bestandteile: eadHeader (über die EAD-Datei) archDesc did (Zum Gesamtbestand) dsc / c… (Beschreibung über geschachtelte Container) Übung: Vergleichen Sie EAD mit TEI und METS …

32 Metadaten in Museen HIDA-MIDAS (Marburger Informations-, Dokumentations- und Administrations-System) VRA Core 4.0 (http://www.vraweb.org/projects/vracore4/index.html)http://www.vraweb.org/projects/vracore4/index.html CDWA (http://www.getty.edu/research/conducting_research/standards/cdwa/)http://www.getty.edu/research/conducting_research/standards/cdwa/ museumdat (http://museum.zib.de/museumdat/, )http://museum.zib.de/museumdat/http://www.museumdat.org/http://de.wikipedia.org/wiki/Museumdat

33 Rekapitulation: Metadaten im Museum; Beispiel: Museumdat Scope Zielstellung Harvesting, Datenaustausch Bezug zu anderen Standards CDWA Lite, CIDOC CRM Beschreibungsbereiche: Objektklassifikation, Identi- fikation, Beschreibung, Ereignisse, Beziehungen, Administration

34 Semantic Web – Zusammenfassung Problem: Wie kann die "Bedeutung" von Daten für den Computer verwertbar gemacht werden? Lösung: Explikation, Annotation, Metadaten, Taxonomien, Authority Files (Normdaten), eindeutige Identifikatoren (z.B. auch URIs), Ontologien, standardisierte Ausdrucksformen

35 RDF – Zusammenfassung (Fallback: RDF – Resource Description Framework Formale Beschreibung von Informationen ("Resourcen") Aussagen werden als Tripel modelliert Subjekt – Prädikat – Objekt … sind selbst wieder als URI identifiziert (oder auch nur Strings) RDF als Datenmodell und als Syntax (XML, N3) Frage: Verhältnis von RDF und DC? RDFS als Schema für die formale Beschreibung ein- facher Ontologien (Konstrukte: Klassen und Eigenschaften)

36 OWL – Zusammenfassung (Fallback: Web Ontology Language Sprache zur formalen Beschreibung von Ontologien Baut auf RDF auf und geht über RDFS hinaus Konstrukte: Klassen, Eigenschaften, Instanzen

37 Noch Zeit? Übung: Wir semantisieren Regest 9 (nur konzeptionell natürlich)

38 CDWA / CDWA Lite Die Heimat von CDWA: wikipedia: Scope CDWA vs. CDWA Lite Charakteristika

39 CDWA-Lite Beispiel: nting_gm_816.cdwalite

40 Museumdat Die Heimat von Museumdat: Scope Zielstellung Harvesting, Datenaustausch Bezug zu anderen Standards CDWA Lite, CIDOC CRM Beschreibungsbereiche: Objektklassifikation, Identi- fikation, Beschreibung, Ereignisse, Beziehungen, Administration

41 CIDOC-CRM Ausgangspunkte Die Heimat von CIDOC-CRM:

42 Semantic Web – Zusammenfassung Problem: Wie kann die "Bedeutung" von Daten für den Computer verwertbar gemacht werden? Lösung: Explikation, Annotation, Metadaten, Taxonomien, Authority Files (Normdaten), eindeutige Identifikatoren (z.B. auch URIs), Ontologien, standardisierte Ausdrucksformen

43 RDF – Zusammenfassung (Fallback: RDF – Resource Description Framework Formale Beschreibung von Informationen ("Resourcen") Aussagen werden als Tripel modelliert Subjekt – Prädikat – Objekt … sind selbst wieder als URI identifiziert (oder auch nur Strings) RDF als Datenmodell und als Syntax (XML, N3) Frage: Verhältnis von RDF und DC? RDFS als Schema für die formale Beschreibung ein- facher Ontologien (Konstrukte: Klassen und Eigenschaften)

44 RDF – Beispiel Tony Benn Wikipedia

45 OWL – Zusammenfassung (Fallback: Web Ontology Language Sprache zur formalen Beschreibung von Ontologien Baut auf RDF auf und geht über RDFS hinaus Konstrukte: Klassen, Eigenschaften, Instanzen


Herunterladen ppt "IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle Daten- und Metadaten SS 09."

Ähnliche Präsentationen


Google-Anzeigen