Wissenschaftliche Übung Metadatenformate und -standards Volker Herrmann Philosophikum, Raum 232 (2.Stock) Tel. 470 5228 Sprechstunde nach Vereinbarung.

Slides:



Advertisements
Ähnliche Präsentationen
Online-Dissertationen für die Praxis
Advertisements

Entwicklung von Schemata für den XML-Dokumentenaustausch mit Hilfe des Resource Description Framework (RDF) John McClure Präsentation.
Idee und Realisierung des Internet der Zukunft
Library of Labs Co-funded by the Community programme eContentplus Library of Labs WP 4: Metadaten Definition Universitätsbibliothek Stuttgart (UBS)
Die Nutzung internationaler Standards in MEX
Dublin Core Antje Schregel, Dublin Core Was ist DC? Architektur von DC (Elements, Qualifiers) Anwendung Aktuelle Situation Projekte.
PADLR Submodul Modular Content Archives Ein Content Browser für Lehr- materialien aus der Elektrotechnik Dipl.-Ing. Mark Painter Institut für Nachrichtentechnik.
Prof. Dr. Günter Törner Dipl-Math. Thorsten Bahne
BSZ Volker Conradt Bibliotheksservice-Zentrum Baden-Württemberg (BSZ) Ein Datenmodell für digitale Bibliotheken auf Basis der Dublin Core Empfehlungen.
Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik Vertiefung.
Resource Description Framework (RDF)
HTML - Einführung Richard Göbel.
Suchmaschine vs. Katalog Such-Robots i.d.R. werden alle Seiten erfasst täglich werden mehrere Mio. Seiten besucht Redaktion relativ wenig Seiten erfasst.
METS / MODS. METS – Metadata Encoding and Transmission Standard – 2002 veröffentlicht – XML Schema – Reale Objekte digital abbilden – hierarchische Struktur.
Die Bestandteile des Semantic Web. Sematic Web soll das WWW erweitern und nicht neuerfinden Informationen sollen Maschinenlesbar sein Schemata beschreiben.
HTML - Eine erste Annäherung
Cross-Search in Renardus Göttingen State and University Library, Germany (SUB) Dr. Heike Neuroth The Academic Subject.
Einführung XML XML Einführung Andreas Leicht.
Support.ebsco.com Lernprogramm zur einfachen Suche in wissenschaftlichen Bibliotheken.
Hauptseminar XML-Technologie: Resource Description Framework (RDF) Michael Kranz Betreuer: Roland Haratsch.
Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library
Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03.
1 Grundlagen und Anwendung der Extensible Markup Language (XML ) Peter Buxmann Institut für Wirtschaftsinformatik Johann Wolfgang Goethe-Universität Frankfurt.
Data Documentation Initiative (DDI)
Langzeitarchivierung und Metadaten. NAA Preservation Strategy Link: ml.
Wissenschaftliche Übung Metadatenformate und -standards
METS (Metadata Encoding Transmission Standard). Wer und Was Digital Library Federation Vorgänger: MoA II (1997) Standard zur Beschreibung einer Teilmenge.
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
RDF Resource Description Framework
1. Metadaten-Workshop der AfS / META-LIB-Abschluss-Workskop, 21./22. Oktober 2002 Metadaten an Der Deutschen Bibliothek: Ergebnisse des DFG-Projekts META-LIB.
Kathrin Schroeder AfS und META-LIB Workshop Metadaten und Standards - Persistent Identifier im Kontext von Metadaten Kathrin Schroeder Die Deutsche.
Installation FAQ-Forum Zope Basisinstallation Zusätzliche Module (Products) Grundkonfiguration Einrichten neuer Foren.
Nicolas Frings Maximilian Bernd Stefan Piernikarcyk
Wird ganz am Anfang der HTML-Datei geschrieben Doctype html public bedeutet, dass man sich auf die Öffentlichkeit der html-dtd bezieht Html ist die meist.
Entwicklung verteilter Anwendungen II, SS 13 Prof. Dr. Herrad Schmidt SS 13 Kapitel 4 Folie 2 REST Web Services (1)
Sesame Florian Mayrhuber
Wohlgeformtheit und Gültigkeit Grundlagen der Datenmodellierung Anke Jackschina.
Zauberwort Metadaten Elementares Handwerkszeug des Content- und Wissensmanagement.
Struktur von RDF Fabian Scheller.
XML (Extensible Markup Language)
1 Kommunikation im Netz Beratungsrektor Johannes M. L. Pasquay Die modernen Informations- und Kommunikationsmedien, allen voran das Internet mit dem World.
IT-Zertifikat Kurs IV Gunther Sarling
KOOP-LITERA Tagung 2003, 8. / 9. Mai 2003 Archivierung digitaler Dokumente Problemstellung - kooperative Lösungsansätze - Aktivitäten der Österreichischen.
Dublin Core IT-Zertifikat Daten- und Metadatenstandards.
EAD Encoded Archival Description IT-Zertifikat Universität zu Köln – Datenstandards für Web, Humanities und Kulturerbe Dozent: Patrick Sahle Referent:
Daten- und Metadatenstandards SoSe 2009 IT-Zertifikat der Philosophischen Fakultät der Universität zu Köln Dozent: Patrick Sahle 26. Juni 2009: Dublin.
1 XCDL eXtensible Characterisation Description Language Von Maike Wosnitza.
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
Willkommen zum Brückensemester
Seminar: Neue Ansätze der Künstlichen Intelligenz Seite 1Ulf Schneider02. Juli 2002 Ulf Schneider Neue Ansätze der Künstlichen Intelligenz: OIL Ontology.
Semantic Web.
IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle Semantic WebWS 08/09.
Dedizierte Systeme – Opus Eva Cynkar Dedizierte Systeme - Digital Library.
Digitale Annotationen. Grundlage: John Bradley “Towards a Richer Sense of Digital Annotation: Moving Beyond a Media Orientation of the Annotation of Digital.
IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle BAM-SektorWS 08/09.
RDA, MARC und Co. | Österreichischer Bibliothekartag Sarah Hartmann RDA, MARC und Co. Von der Formalerschließung zum Metadatenmanagement II RDA,
Vorteile von XML Die installed base von HTML, HTTP und Webbrowsern XML ist einfach und portabel XML kann Dokumente beliebiger Komplexität abbilden XML.
Text Encoding Initiative Universität zu Köln Daten- und Metadatenstandards Seminarleitung: Patrick Sahle Seminarleitung: Patrick Sahle Referentin: Anna.
Welcome to Web Services & Grid Computing Jens Mache
TEI Die Text Encoding Initiative (TEI-Konsortium), 1987 gegründet - Dokumentenformat (zunächst SGML)‏
Greenstone. Theoretischer Teil Entstehung: Entwickelt vom New Zealand Digital Library Project an der Universität von Waikato Kooperation mit der UNESCO.
Das Internet Ein Netzwerk, das viele Rechner miteinander verbindet
Vorteile von XML Die installed base von HTML, HTTP und Webbrowsern XML ist einfach und portabel XML kann Dokumente beliebiger Komplexität abbilden XML.
OAISter wichtigste Verbundkatalog für digitale Ressourcen Open Access wissenschaftliche Literatur und Materialien im Internet frei zugänglich zu machen.
Semantic Markup für Zwecke der Langzeitarchivierung in digitalen Bibliotheken Neubiberg,
OAI Protocol for Metadata Harvesting
Hypertext 2015/2016.
Metadata - Catalogues and Digitised works
- moodle – a internet based learning platform
 Präsentation transkript:

Wissenschaftliche Übung Metadatenformate und -standards Volker Herrmann Philosophikum, Raum 232 (2.Stock) Tel Sprechstunde nach Vereinbarung per Mail:

Metadaten sind… Metadata is sometimes defined literally as 'data about data,' but the term is normally understood to mean structured data about resources that can be used to help support a wide range of operations. (M.Day, 2001)

Metadaten sind… Metadata is sometimes defined literally as 'data about data,' but the term is normally understood to mean structured data about resources that can be used to help support a wide range of operations. (M.Day, 2001) Daten über Daten: Kanzler Schröder Autor Harold Pinter

Metadaten sind… Metadata is sometimes defined literally as 'data about data,' but the term is normally understood to mean structured data about resources that can be used to help support a wide range of operations. (M.Day, 2001) Daten über Daten: Kanzler Schröder Autor Harold Pinter in strukturierter Form: Schröder 100: Pinter, Harold

Metadaten sind… Metadata is sometimes defined literally as 'data about data,' but the term is normally understood to mean structured data about resources that can be used to help support a wide range of operations. (M.Day, 2001) Daten über Daten: Kanzler Schröder Autor Harold Pinter in strukturierter Form: Schröder 100: Pinter, Harold Semantik Kanzler= Vom deutschen Bundestag gewählter Regierungschef

Metadaten sind… Metadata is sometimes defined literally as 'data about data,' but the term is normally understood to mean structured data about resources that can be used to help support a wide range of operations. (M.Day, 2001) Daten über Daten: Kanzler Schröder Autor Harold Pinter in strukturierter Form: Schröder 100: Pinter, Harold Semantik Kanzler= Vom deutschen Bundestag gewählter Regierungschef Syntax Ein xml-Element (tag) muß immer in spitze Klammern gefasst sein, ein Endtag enthält zusätzlich vor dem Elementnamen einen Slash

Metadaten – wozu? 1.Information Retrieval: Suchen und Finden von Daten - Suchen nach bestimmten Kriterien - ähnliche Quellen zusammenfassen, verschiedenenartige Quellen auseinanderhalten - den Ort der Datenquelle festhalten

Das World Wide Web – Growing and growing … Source:

Einige weitere Fakten (nach Gill, 2000): -Überwiegende Suchstrategien der User: Suchmaschinen und Hyperlinks -Nur ein Teil der Gesamtmenge der Daten im Web machen den eigentlichen Gehalt an Informationen aus (40 %) User statistics

Informationssuche über Suchmaschinen: Google -Page Ranking -Verankerter Text -Visuelle Merkmale -Volltext Parser -Location information -Verteiltes System

Probleme von Suchmaschinen -Hohes Recall, niedrige Precision Relevanz der Ergebnisse Ergebnismenge -Aktualität der Suchergebnisse -Erfasste Datenmenge Qualität Indexierungstiefe -versteckte Daten dynamisch generierte Daten

Metadaten zur Beschreibung von Webseiten? Meta-Tags für Suchmaschinen: Dublin Core Metadata Initiative (DCMI) Resource Description Framework (RDF)

DC Elemente Webseite als HTML mit eingebetteten DC Elementen

Metadaten zur Beschreibung von Webseiten? Ja, aber… Problem 1: Spamming Problem 2: Wie zuverlässig sind die Metadaten bzgl. ihrer Inhaltsbeschreibung? Problem 3: Interoperabilität Problem 4: Zusatzkosten Lösung: z.B.: Mechanismen finden, um Webseiten bzgl. ihrer Vertrauenswürdigkeit einstufen zu können.

Beispiel: PICS (Platform for Internet Content Selection) Grundprinzipien: Rating einer Webseite nach bestimmten Themenbereichen Rating System Software, die PICS-Metadaten lesen und verarbeiten kann

Beispiel: Vancouver Webpages Rating Service Multiculturalism Educational Content Environmental Awareness Tolerance Violence Sex Profanity Safety Canadian Content Commercial Content Gambling Category: Tolerance Promotion: Promotion of tolerant behaviour. Positive: Portrayal of tolerant behaviour. Neutral: No Intolerant content; reference works, etc. Negative: Portrayal of intolerant behaviour by minor characters Intolerance: Portrayal of intolerant behaviour by role-model figures. Active Intolerance: Promoting hatred based on differences in religion, culture, race, sexual orientation etc. Unlimited Intolerance: Active promotion of intolerant behaviour; calling for ethnic cleansing, Jihad, genocide etc.

Metadaten – wozu? 2.Daten eindeutig identifizieren Daten(-objekte) lokalisieren durch Persistent Identifier: - DOI (Digital Object Identifier) - PURL (Persistent Uniform Resource Locator) Metadatenelemente zur standardisierten Identifikation, z.B. über standardisierte Nummerierungen

Beispiel: PURL (Persistent Uniform Resource Locator)

PURL - Funktionsprinzip PURL ist funktional ein URL PURL verweist auf einen Resolvermechanismus Quelle: URL= PURL=

Metadaten - wozu? 3.Daten Aufbewahren und Bereitstellen - in geordnetem System ablegen - Indexieren - Katalogisieren - Organisieren - Beschreiben - Langfristige digitale Erhaltung

Bibliothekarische Metadaten

Bibliographische Metadaten

MAB2 und MARC - Metadatenformate für bibliothekarische Daten Bibliographische Angaben werden in bibliothekarischen Metadatenformaten in Kategorien gefasst. Die MAB2 Felder Jedem MAB2 Feld sind Regeln zugeordnet, mit welchem Inhalt und in welcher Syntax das Feld gefüllt werden darf. Das Basisregelwerk für die Katalogisierung in der BRD sind die Regeln für die Formalkatalogisierung (früher RAK). RFK GBV Katalogisierungsrichtlinien

MAB2 und MARC - Metadatenformate für bibliothekarische Daten Bibliographische Angaben werden in bibliothekarischen Metadatenformaten in Kategorien gefasst. Die MAB2 Felder Jedem MAB2 Feld sind Regeln zugeordnet, mit welchem Inhalt und in welcher Syntax das Feld gefüllt werden darf. Das Basisregelwerk für die Katalogisierung in der BRD sind die Regeln für die Formalkatalogisierung (früher RAK). RFK GBV Katalogisierungsrichtlinien

TEI (Text Encoding Initiative) Gedruckte und elektronische Dokumente enthalten i.d.R. mehr Information als den eigentlichen Text. Z.B.: –Ein Dokument kann durch mehrgliedrige Überschriften strukturiert sein; –Bücher verfügen typischerweise über Einleitung und Register. –Sowohl gedruckte als auch elektronische Texte können Kommentare, Fußnoten und Varianten aufweisen. Elektronische Texte sind dynamisch. Man kann elektronischem Text ständig neue Zusatzinformation hinzufügen. Ausgewählt werden kann z.B., welche Informationen bei der Wiedergabe des Textes, aufgeführt werden sollen.

TEI (Text Encoding Initiative) TEI hat ein unabhängiges, portables und offenes Format zu Speicherung, Austausch und Analyse von Texten in den Geisteswissenschaften entwickelt. Das TEI folgte in der Kodierung zunächst der SGML, neuere Versionen folgen der XML. Nach TEI ausgezeichnete Texte sind also in SGML oder XML gehalten, wobei die verwendeten Elemente über eine zugehörige DTD (=Datei, die angibt, welche Kodierungsregeln in den dazugehörigen Dokumenten erlaubt sind) validiert werden. Beispiel einer TEI Kodierung

Encoded Archival Description (EAD) EAD basiert ebenfalls auf SGML/ XML. Mit EAD lassen sich digitalisierte Dokumente in ihrem Zusammenhang beschreiben und über das WWW präsentieren. Beispiel EAD Archive und Findhilfen