Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
Veröffentlicht von:Elmar Beyer Geändert vor über 8 Jahren
1
Identifikation Von Digitalen Dokumenten Marco Kuhrmann Institut für Softwaretechnologie Fakultät für Informatik Universität der Bundeswehr München DBMS für spezielle Anwendungen
2
Gliederung Einleitung Lösungsansätze URL ISBN/ISSN PURL Persistent-Identifier-Systems - URN -DOI Speichern in Datenbanken
3
Einleitung File not found, Error 404 tote Links aufgrund verzogener/gelöschter Dateien bes. ärgerlich bei Newsbeiträgen, Nachrichtenartikeln, Videos... digitale Dokumente eindeutig zu identifizieren, archivieren und verfügbar lassen größte Motivation: Vermeidung toter Links, Verfügbarkeit von Informationen eCommerce, kommerzielle Anwendung z.B. bei eBooks Worum geht es?
4
Lösungsansätze URL (Uniform Resource Location) ISBN/ISSN PURL (Persistent Uniform Resource Location) Persistent-Identifier-Systems: URN (Uniform Resource Name) DOI (Digital Object Identifier)
5
ISBN/ISSN ISBN/ISSN eindeutige Identifikatoren für Bücher, Zeitschriften, etc. eindeutig identifizierbar, persistent ISSN auch für digitale Publikationen, beschränkt Online-Antrag auf ISSN möglich kein Verweis auf Ort der Resource keine einzelnen Artikel keine Videos, Audio-Dateien, etc.
6
PURL Entwickelt von OCLC (Online Computer Library Center), http://purl.oclc.org/http://purl.oclc.org/ Datenbank weltweit verfügbar im Prinzip URL mit HTTP-redirect Beispiel: http://purl.org/DC/http://purl.org/DC/ Bildung der PURL: verwaltender Server als Hostadresse und Entsprechende Top-Level-Domain bzw. Namespace, evtl. weitere Subdomains Beispiel:http://www.purl.org/net/eric/talks/dc5-rdf-talk/http://www.purl.org/net/eric/talks/dc5-rdf-talk/
7
PURL Registrierung „NET“ Standard-Top-Level-Domain beliebige Subdomains möglich doppelte Einträge durch entsprechendes Programm verhindert Erstellen einer PURL: Vorteile: Links in Hypertexten bedürfen keiner Veränderung bei Änderung der URL nur Änderung in DB erforderlich für jeden frei verfügbar Protokolle
8
PURL Nachteile: registrierte Nutzer müssen Änderungen der URLs an Datenbank melden keine Metadaten nur für Texte von wahrscheinlicher bleibender Bedeutung keine einzelnen Kapitel keine Grafiken, Videos,... keine vergänglichen Meldungen keine Überprüfung bestehender PURLs
9
Persistent Identifier (PI) „dauerhafter Identifikator“ weltweite eindeutige Identifikation digitaler Dokumente ähnlich ISBN/ISSN alle Formate (Audio, Video, Text,...) verwendbar für alle Artikel, Absätze, Kapitel... Konzept: Trennung von Bezeichnung und Location Beispiele: URN, DOI
10
URN – Spezifikation (1) „Uniform Resource Name“, seit 1992 entwickelt im Auftrag von Internet Engineering Task Force (IETF) Spezifikation in RFC 1737: standortunabhängig (global scope) weltweit einmalig (global uniqueness) dauerhaft gültig (persistence) Skalierbarkeit (scalability) URN-Schema muss leicht erweiterbar sein (extensibility)
11
URN – Spezifikation (2) Integrierbarkeit bestehender Ressourcenidentifikationssysteme (z.B. ISBN) (legacy support) Unabhängigkeit URNs vergebender Autoritäten (independence) feste Gestaltung von URNs (resolution) Spezifikation in RFC 1737 (Forts.): Sub-Namespaces ermöglichen feinere Granularität unabhängig vom referenzierten Objekt
12
URN - Syntax 1. Angabe „urn“ 2. Standard bzw. Normbezeichnung, Namespace Identifier (INET, ISBN, ISSN) 3. spezifische Identifikation: Syntax der URN (nach RFC 2141 und 1737): urn:[Namespace Identifier -- NID]:[Namespace Specific String -- NSS] [Naming Authority]:[Opaque String] a)Verantwortliche/vergebende Stelle b)Vergebene Ziffern- oder Buchstabenfolge für spezielles Objekt
13
URN - Beispiele Beispiele für URNs: NIDNaming Authority URN:ISBN_Publisher_ID:519:A3282DC8DXX Opaque String URN:NBN:DE:1111-2003121811 NIDNaming AuthorityOpaque StringPrüfziffer
14
URN – Auflösung (1)
15
URN – Auflösung (2) optimal: Eingabe URN in Browser aber: bisher keine Unterstützung von Browser oder DNS bisherige Lösung mit Proxy-Servern oder Plugins Erweiterung des DNS um „Naming Authority PointR“-Komponente (RFC 2168) Integration vorhandener Namensräume in URN-Schema, Einbettung in gängige Protokolle, z.B.: http:// / / ?urn=urn:inet:dstc.edu.au:017A5d24
16
URN – Metadaten Metadaten sollten als Teil der URN spezifiziert werden URN, URL spezifiziert als URI (Uniform Resource Identifier) URI enthält noch URC (Uniform Resource Character) speichern von URN in Datenbank mit (mehreren) URLs URC ebenfalls in DB abgelegt Metadaten enthalten, komplexe Suche möglich
17
URN – Implementation Projekt CARMEN-AP4 Partner: Deutsche Bibliothek (DDB) vertraut machen als nationale Agentur zur URN-Vergabe Vergabe von persistent Identifier im Rahmen des NBN-Namespace (NBN:DE) seit September 2001URNs für Online-Dissertationen administriert und aufgelöst Erprobung und Weiterentwicklung Integration von bestehenden Systemen (ISSN, ISBN, PURL, DOI...) bereits große Verbreitung in bibliothekarischen und nicht-kommerziellen Bereichen
18
DOI - Spezifikation „Digital Object Identifier“, begann 1994 als Teil des allgemeinen Copyrights Spezifikation nach RFC 1737 ab 1998 weiterentwickelt von IDF (International DOI Foundation) Ziel: eindeutige Identifizierung, Verwaltung von Rechten Ergebnis: DOI, DOI System (Verwaltung) eindeutiger Identifikator für beliebiges digitales Objekt unabhängig von Location „unintelligente“ Zahlenfolge
19
DOI - Syntax DOI bestehend aus Präfix und Suffix: Präfix: Bezeichnung für Anbieter, Produktlinie,... Suffix: Identifikatoren, Produktnummern, Bezeichnungen oder Codes beschreibt beliebige Größe oder Granularität Integration von bestehenden Systemen möglich (ISBN, ISSN,...)
20
DOI - Auflösung optimal: Eingabe in Browser, derzeit nicht unterstützt Auflösung durch Proxy-Server oder Plugins DOI-System, bestehend aus 3 Komponenten: Metadaten von Anbieter gepflegt Mindestmenge verlangt mehrere Projekte zur Standardisierung von Metadaten DOI als Persistent Identifier technische Implementation des Handle-Systems
21
Handle-System entwickelt von Corporation for National Research Initiatives (CNRI) stellt Funktionen für PIs in Form von Handles bereit Syntax ist Basis für DOIs:
22
DOI – Implementation Registrierungsagenturen IDF unterstellt CrossRef (USA), Content Directions (USA), Enpia Systems (Asien) seit Juli 2003 „mEDRA“ offizielle Europäische DOI-Agentur kommerzielle Nutzung, Online-Verlage Problem: IDF fehlen finanzielle Mittel zur Durchsetzung Durchsetzung des Standards nur langsam Kritik: kryptische Identifier
23
PIs und Datenbanken PIs aufgrund Eindeutigkeit gut geeignet für Primärschlüssel in DB unterschiedliche DB/Tabellen aufbaubar: URLsRelationen PI DOI/URN - Datenbank Metadaten PI Archiv Dokument1 PI1 Metadaten1 Dokument2 PI2 Metadaten2
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.