Identifikation Von Digitalen Dokumenten Marco Kuhrmann Institut für Softwaretechnologie Fakultät für Informatik Universität der Bundeswehr München DBMS.

Slides:



Advertisements
Ähnliche Präsentationen
M-Commerce - Technik, Anwendungen und Konsortien
Advertisements

DataCite Jan Brase, TIB & DataCite 3. November 2011 TIB-Workshop zur DOI-Registrierung Hannover.
PADLR Submodul Modular Content Archives Ein Content Browser für Lehr- materialien aus der Elektrotechnik Dipl.-Ing. Mark Painter Institut für Nachrichtentechnik.
Dl-konzepte bmb+f-Projekt im Digital Library-Forum Rudi Schmiede Verteilte Informationsstrukturen in der Wissenschaft Digital Library Konzepte bmb+f Projekt.
Persistent Identifiers: URNs
SendEplanung Datenbank
HTML - Einführung Richard Göbel.
Colibi Bibliothekssystem der Computerlinguistik. Einführung Motivation Was braucht Colibi? Software Datenbankdesign.
Internetstruktur Das Internet besteht aus vielen Computern, die weltweit untereinander vernetzt sind.
Renardus The Academic Subject Gateway in Europe Nationalbibliotheken und nationale Dienste – Interoperabilität mit Subject Gateways Christel Hengel.
Anwendungen. © Prof. T. Kudraß, HTWK Leipzig Historie des WWW Grundlage Internet – Entwickelt Ende der 60er Jahre vom US-Militär (ARPA-Net) – Technische.
Oracle WebServer - Einführung. © Prof. T. Kudraß, HTWK Leipzig Oracle Web Application Server HTML WebServer ® File system Static HTML PL/SQL Packages.
Anwendungen. © Prof. T. Kudraß, HTWK Leipzig Historie des WWW Grundlage Internet – Entwickelt Ende der 60er Jahre vom US-Militär (ARPA-Net) – Technische.
Natalia Wehler: DOI und Metadaten DOI und Metadaten.
FH-Hof HTML - Einführung Richard Göbel. FH-Hof Komponenten des World Wide Webs WWW Browser HyperText Transfer Protocol (HTTP) via Internet WWW Server.
Ordner- und Dateistrukturen in Windows 7 (Teil 1)
Normdaten und Metadaten Die Idee eines Internationalen Authority File Christel Hengel Die Deutsche Bibliothek META-LIB-Workshop, 22. Oktober 2002, Die.
Kathrin Schroeder AfS und META-LIB Workshop Metadaten und Standards - Persistent Identifier im Kontext von Metadaten Kathrin Schroeder Die Deutsche.
Entwicklung verteilter Anwendungen I, WS 13/14 Prof. Dr. Herrad Schmidt WS 13/14 Kapitel 12 Folie 2 Web Services (1)
Xenario IES Information Enterprise Server. Xenario Information Enterprise Server (IES) Die neue Architektur des Sitepark Information Enterprise Servers.
Nicolas Frings Maximilian Bernd Stefan Piernikarcyk
KOOP-LITERA Tagung 2003, 8. / 9. Mai 2003 Archivierung digitaler Dokumente Problemstellung - kooperative Lösungsansätze - Aktivitäten der Österreichischen.
Dokumenten- und Publikationsserver
M. Lautenschlager (M&D/MPIM)1 Beständige Indikatoren und Langzeitarchivierung Michael Lautenschlager Modelle und Daten Max-Planck-Institut für.
Dublin Core IT-Zertifikat Daten- und Metadatenstandards.
Eike Schallehn, Martin Endig
Daten- wo bleiben sie? Bernd Richter.
BADI – Barrierefreie Aufbereitung Digitaler Inhalte
MareNet Ein neuer elektronischer Informationsdienst für die Meeresforschung IuK Trier, 12. März 2001 Michael Hohlfeld Institute for Science Networking.
Dedizierte Systeme – Opus Eva Cynkar Dedizierte Systeme - Digital Library.
Datenbanken im Web 1.
MareNet Marine Research Institutions & Documents Worldwide Ein elektronischer Informationsdienst für die Meeresforschung Michael Hohlfeld, Institute for.
XML Die “E-Lance Economy” oder die “Digital Economy” stellt neue Anforderungen an Funktionalität im Netz. XML wurde vom World Wide Web Consortium (W3C)
1 Wolfgang Wiese, Regionales RechenZentrum Erlangen WCMS 3. August 2000 Wolfgang Wiese RRZE / Lehrstuhl für Informatik VII
Fedora by C. Göpfert.
Dieser Vortrag wird gesponsort von:
Das Internet Ein Netzwerk, das viele Rechner miteinander verbindet
OAISter wichtigste Verbundkatalog für digitale Ressourcen Open Access wissenschaftliche Literatur und Materialien im Internet frei zugänglich zu machen.
DSpace IT Zertifikat Blockseminar Dedizierte Systeme Dozentin: Susanne Kurz, M.A. Referentin: Camilla Ottnad, B.A.
Modul 6 Handy-Signatur: Anwendung. Anwendungsbereiche der Handy-Signatur „Eigenhändige Unterschrift“ Elektronische Behördenwege Rechtsgültiges Unterschreiben.
IOS Entwicklung von 0 auf 100 Von Philipp Koulen Lehr- und Forschungsgebiet Ingenieurhydrologie.
N Beratung n Betreuung n Koordinierung Umsetzung der Betriebssicherheitsverordnung im Rahmen des Arbeits- und Gesundheitsschutzmanagementsystems NRW (AGM.
Generic Enabler Felix Holzäpfel-Stein, Aachen Generische Komponenten im Cloudkontext.
OER-Festival 2016 Berlin - #OERde16 – OER-Fachforum Panel PaB16: OER und Qualitätssicherung , Uhr Input: Qualitätssicherung als Prozess.
Bildquelle: Internet – Google-Suche. Agenda 1.Warum ist die IT heute so wichtig? 2.Ihre EKIBA IT stellt sich vor. 3.Wo unterstützt mich die IT in meiner.
SFX in der ULB Sachsen-Anhalt Monika Lützkendorf.
Seite ZB MED: Eine Zentralbibliothek als treibender Motor für Open Access in den Lebenswissenschaften Ursula Arning.
Wohnungssuche Mobiles georeferenziertes Informationssystem am Beispiel der aktiven und passiven Wohnungssuche Michael Raber.
Geschichte des Internet Informatik-AG IKG Reutlingen Schuljahr 2006/07.
Funktionsweise eines Funambolservers Natascha Graf Aachen, 01. Februar 2010.
H. Grottenegg 1 Geodaten – zur Prüfung bitte!. H. Grottenegg2 Um welche Prüfung gehts?  Prüfung von (Geo-)Daten gegen eine Richtlinie/Vorgabe (z.B.Naturbestand,
Božana Bokan, Albert Geukes, Katja Mruck Center für Digitale Systeme (CeDiS) PKP Scholarly Publishing Conference 2011 Workshop on functional extensions.
Key-Value Paare (KVP) - Metadaten für Kanäle speichern und nach MDF4 exportieren PM (V1.0)
Patrick Richterich Lattwein GmbH Web Services Softwareentwicklung mit SOAP.
E-Government AG - Umweltinformation Geodatenverbund der österreichischen Bundesländer Thomas Ebert Amt der OÖ Landesregierung Abteilung.
Internet Universität zu Köln WS 2011/12 Dozent: Prof. Dr. Manfred Thaller AM 2: Digitale Langzeitarchivierung Referentin: Rasa Sommer.
Zehn Schritte zu Linux Der Weg in eine andere Welt...
Ein Projekt der FU Berlin Im Auftrag der FU Berlin Gefördert durch Netzwerk für Nachhaltige Schülerfirmen
Torsten Rathmann (DKRZ) Torsten Rathmann Deutsches Klimarechenzentrum (DKRZ) Datenmanagement am DKRZ PubFlow Workshop 18. März 2014.
Christine Stohn.
Schulungsunterlagen der AG RDA
AURIS-MM Spezifikation
Inhalte Die BTL Online enthält die Inhalte aller im Druck erschienenen Ausgaben der Bibliotheca Teubneriana Latina in elektronischer Form: Die Bibliotheca.
PI Infrastruktur in der Max-Planck-Gesellschaft
Da·ten·bank /Dátenbank/ Substantiv, feminin [die]
Von Diana Braun und Daria Bures
Von Wietlisbach, Lenzin und Winter
Transformator Hausaufgaben Michael Funke – DL4EAX.
Wie die ZHB Sie dabei unterstützen kann
Mathematische Grundkenntnisse
 Präsentation transkript:

Identifikation Von Digitalen Dokumenten Marco Kuhrmann Institut für Softwaretechnologie Fakultät für Informatik Universität der Bundeswehr München DBMS für spezielle Anwendungen

Gliederung  Einleitung  Lösungsansätze URL ISBN/ISSN PURL Persistent-Identifier-Systems - URN -DOI  Speichern in Datenbanken

Einleitung  File not found, Error 404  tote Links aufgrund verzogener/gelöschter Dateien  bes. ärgerlich bei Newsbeiträgen, Nachrichtenartikeln, Videos...  digitale Dokumente eindeutig zu identifizieren, archivieren und verfügbar lassen  größte Motivation: Vermeidung toter Links, Verfügbarkeit von Informationen  eCommerce, kommerzielle Anwendung z.B. bei eBooks Worum geht es?

Lösungsansätze  URL (Uniform Resource Location)  ISBN/ISSN  PURL (Persistent Uniform Resource Location)  Persistent-Identifier-Systems: URN (Uniform Resource Name) DOI (Digital Object Identifier)

ISBN/ISSN  ISBN/ISSN eindeutige Identifikatoren für Bücher, Zeitschriften, etc.  eindeutig identifizierbar, persistent  ISSN auch für digitale Publikationen, beschränkt  Online-Antrag auf ISSN möglich  kein Verweis auf Ort der Resource  keine einzelnen Artikel  keine Videos, Audio-Dateien, etc.

PURL  Entwickelt von OCLC (Online Computer Library Center),  Datenbank weltweit verfügbar  im Prinzip URL mit HTTP-redirect  Beispiel:  Bildung der PURL: verwaltender Server als Hostadresse und Entsprechende Top-Level-Domain bzw. Namespace, evtl. weitere Subdomains Beispiel:

PURL  Registrierung  „NET“ Standard-Top-Level-Domain  beliebige Subdomains möglich  doppelte Einträge durch entsprechendes Programm verhindert Erstellen einer PURL: Vorteile:  Links in Hypertexten bedürfen keiner Veränderung bei Änderung der URL  nur Änderung in DB erforderlich  für jeden frei verfügbar  Protokolle

PURL Nachteile: registrierte Nutzer müssen Änderungen der URLs an Datenbank melden keine Metadaten nur für Texte von wahrscheinlicher bleibender Bedeutung keine einzelnen Kapitel keine Grafiken, Videos,... keine vergänglichen Meldungen keine Überprüfung bestehender PURLs

Persistent Identifier (PI)  „dauerhafter Identifikator“  weltweite eindeutige Identifikation digitaler Dokumente  ähnlich ISBN/ISSN  alle Formate (Audio, Video, Text,...)  verwendbar für alle Artikel, Absätze, Kapitel...  Konzept: Trennung von Bezeichnung und Location  Beispiele: URN, DOI

URN – Spezifikation (1)  „Uniform Resource Name“, seit 1992  entwickelt im Auftrag von Internet Engineering Task Force (IETF)  Spezifikation in RFC 1737: standortunabhängig (global scope) weltweit einmalig (global uniqueness) dauerhaft gültig (persistence) Skalierbarkeit (scalability) URN-Schema muss leicht erweiterbar sein (extensibility)

URN – Spezifikation (2) Integrierbarkeit bestehender Ressourcenidentifikationssysteme (z.B. ISBN) (legacy support) Unabhängigkeit URNs vergebender Autoritäten (independence) feste Gestaltung von URNs (resolution)  Spezifikation in RFC 1737 (Forts.):  Sub-Namespaces ermöglichen feinere Granularität  unabhängig vom referenzierten Objekt

URN - Syntax 1. Angabe „urn“ 2. Standard bzw. Normbezeichnung, Namespace Identifier (INET, ISBN, ISSN) 3. spezifische Identifikation:  Syntax der URN (nach RFC 2141 und 1737): urn:[Namespace Identifier -- NID]:[Namespace Specific String -- NSS] [Naming Authority]:[Opaque String] a)Verantwortliche/vergebende Stelle b)Vergebene Ziffern- oder Buchstabenfolge für spezielles Objekt

URN - Beispiele  Beispiele für URNs: NIDNaming Authority URN:ISBN_Publisher_ID:519:A3282DC8DXX Opaque String URN:NBN:DE: NIDNaming AuthorityOpaque StringPrüfziffer

URN – Auflösung (1)

URN – Auflösung (2)  optimal: Eingabe URN in Browser  aber: bisher keine Unterstützung von Browser oder DNS  bisherige Lösung mit Proxy-Servern oder Plugins  Erweiterung des DNS um „Naming Authority PointR“-Komponente (RFC 2168)  Integration vorhandener Namensräume in URN-Schema, Einbettung in gängige Protokolle, z.B.: / / ?urn=urn:inet:dstc.edu.au:017A5d24

URN – Metadaten  Metadaten sollten als Teil der URN spezifiziert werden  URN, URL spezifiziert als URI (Uniform Resource Identifier)  URI enthält noch URC (Uniform Resource Character)  speichern von URN in Datenbank mit (mehreren) URLs  URC ebenfalls in DB abgelegt  Metadaten enthalten, komplexe Suche möglich

URN – Implementation  Projekt CARMEN-AP4  Partner: Deutsche Bibliothek (DDB)  vertraut machen als nationale Agentur zur URN-Vergabe  Vergabe von persistent Identifier im Rahmen des NBN-Namespace (NBN:DE)  seit September 2001URNs für Online-Dissertationen administriert und aufgelöst  Erprobung und Weiterentwicklung  Integration von bestehenden Systemen (ISSN, ISBN, PURL, DOI...)  bereits große Verbreitung in bibliothekarischen und nicht-kommerziellen Bereichen

DOI - Spezifikation  „Digital Object Identifier“, begann 1994 als Teil des allgemeinen Copyrights  Spezifikation nach RFC 1737  ab 1998 weiterentwickelt von IDF (International DOI Foundation)  Ziel: eindeutige Identifizierung, Verwaltung von Rechten  Ergebnis: DOI, DOI System (Verwaltung) eindeutiger Identifikator für beliebiges digitales Objekt unabhängig von Location „unintelligente“ Zahlenfolge

DOI - Syntax  DOI bestehend aus Präfix und Suffix:  Präfix: Bezeichnung für Anbieter, Produktlinie,...  Suffix: Identifikatoren, Produktnummern, Bezeichnungen oder Codes  beschreibt beliebige Größe oder Granularität  Integration von bestehenden Systemen möglich (ISBN, ISSN,...)

DOI - Auflösung  optimal: Eingabe in Browser, derzeit nicht unterstützt  Auflösung durch Proxy-Server oder Plugins  DOI-System, bestehend aus 3 Komponenten: Metadaten von Anbieter gepflegt Mindestmenge verlangt mehrere Projekte zur Standardisierung von Metadaten DOI als Persistent Identifier technische Implementation des Handle-Systems

Handle-System  entwickelt von Corporation for National Research Initiatives (CNRI)  stellt Funktionen für PIs in Form von Handles bereit  Syntax ist Basis für DOIs:

DOI – Implementation  Registrierungsagenturen IDF unterstellt  CrossRef (USA), Content Directions (USA), Enpia Systems (Asien)  seit Juli 2003 „mEDRA“ offizielle Europäische DOI-Agentur  kommerzielle Nutzung, Online-Verlage  Problem: IDF fehlen finanzielle Mittel zur Durchsetzung  Durchsetzung des Standards nur langsam  Kritik: kryptische Identifier

PIs und Datenbanken  PIs aufgrund Eindeutigkeit gut geeignet für Primärschlüssel in DB  unterschiedliche DB/Tabellen aufbaubar: URLsRelationen PI DOI/URN - Datenbank Metadaten PI Archiv Dokument1 PI1 Metadaten1 Dokument2 PI2 Metadaten2