Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik
2 Zentrale Infrastruktur DataCite braucht eine zentrale Infrastruktur 1.DOI-Registrierung 2.Metadatenmanagement 3.Zusätzliche Services Suche Metadatenexport Content Negotiation (Linked Data) Integration in Drittsysteme
3 DOI-Registrierungs-Infrastruktur 2010 Überblick
4 DOI-Registrierungs-Infrastruktur 2010 Webservice nicht standardkonform Nicht wartbar Keine zentrale Speicherung von Metadaten Keine Benutzerverwaltung: Fehlende Benutzerrechte z.B. auf Präfixlevel Auflistung aller DOIs pro Datenzentrum nicht möglich Viele verschiedene Lieferwege (Soap, Web, Ftp, Handle, E- Mail) Probleme
5 DataCite Developer Core Group Developer Core Group wurde gebildet im September 2010 Ziel: Aufbau einer zentralen Infrastruktur für DataCite Entwickler von BL, CDL, CISTI, TIB Alle Projekte sind Open Source Benutzung von GitHub (Quellcode, Tickets, Wiki)
6 DataCite Services Produktivstadium: Metadata Store (MDS, DOI/Metadaten-Management) Betastadium: Metadaten Export (OAI) Suche Alphastadium: Content Service (Content Negotiation)
7 Metadata Store (MDS) MDS ist DataCites zentrale Infrastruktur für DOI-Management: Registrieren/Aktualisieren von DOIs Speichern/Verwalten von Metadaten Veröffentlichungen: Dezember 2010 (öffentliche Betaversion) 1. Juni 2011 (Version 2, Produktionsstadium) Überblick
8 Metadata Store (MDS) Infrastruktur
9 Auswirkungen für TIB-Datenzentren TIB verwendet die zentrale DataCite Infrastruktur und betreibt keine eigene DOI-Infrastruktur mehr TIB bleibt erster Ansprechpartner in allen technischen Fragen Keine Auswirkungen für die Auflösbarkeit vorhandener DOIs Jedes Datenzentrum bekommt einen Account im MDS Migration vorhandener Metadaten Neuimport durch das Datenzentrum (bevorzugt) oder sukzessive Konvertierung durch die TIB Alle alternativen Registrierungsmöglichkeiten entfallen
10 Metadatenhandhabung Wir akzeptieren nur XML Metadaten müssen gegen ein DataCite Schema validieren ( Metadaten werden mit einer Versionsnummer abgelegt. Alte Metadaten werden nicht gelöscht. XML wird 1:1 gespeichert (keine Transformationen) Automatische Konvertierung im Fall von obsoleten Schemata (sofern möglich)
11 Einschränkungen und Qualitätsicherung Registrieren von DOIs nur in zugeteilten DOI-Präfixen Update nur von eigenen Datensätzen Liste von erlaubten Hostnamen für Landing Pages [ DOI-Kontingent (Quota) ] Metadaten müssen valide sein Regelmäßiges Überprüfen, ob die Landing Page existiert
12 Ausprobieren Für Testzwecke bitte unser spezielles Testpräfix nutzen: Gemeinsames Präfix aller Datenzentrum Achtung: Ihre gewünschte DOI könnte schon vergeben sein echtes Präfix Metadaten sind nicht öffentlich (keine Suche, kein OAI) Das Testen der API ist mit einem speziellen testMode möglich.
13 Schnittstellen Browserschnittstelle Verwalten von DOIs und Metadaten mittels einfacher Formulare Für die schnelle DOI zwischendurch… Liste aller DOIs, Liste aller Metadatenversionen Anzeige der Accountinformationen (Kontaktdaten, Berechtigungen, …) Programmierschnittstelle (API) Ideal für Registrierung vieler DOIs Kann einfach in bestehende Systeme integriert werden
14 Browserschnittstelle Benutzerinformation
15 Browserschnittstelle DOI registrieren
16 Browserschnittstelle Alle Datensätze anzeigen
17 Browserschnittstelle Datensatz anzeigen
18 Browserschnittstelle Metadaten hochladen
19 Browserschnittstelle Metadaten anzeigen
20 Metadata Search Offener Service zum Durchsuchen der Metadaten des MDS Basiert auf Lucene Solr Benutzerschnittstelle und API Beta version available at Überblick
21 Metadata Search Ergebnisliste
22 Metadata Search Drilldown
23 Metadata Search Formular für erweiterte Suche komplexe Lucene-Query-Syntax ebenfalls möglich, z.B. title:laser OR subject:laser publicationYear:[1990 TO 1995] Erweiterte Suche
24 Metadatenexport (OAI-PMH) Open Archives Initiative Protocol for Metadata Harvesting (OAI- PMH). Offener Service für Dritte, um die Metadaten des MDS zu harvesten Angebotene Metadatenformate: Dublin Core, DataCite Metadata Schema Sets für jeden Allocator (z.B. TIB) und jedes Datenzentrum Betaversion verfügbar:
25 Metadata Export (OAI) Beispiel
26 DataCite Content Service Service zum Anzeigen der DOI-Metadataen Verschiedene Metadatenformate (BibTeX, RIS, RDF, etc.) Content Negotation (mittels MIME-Typ) Zugriff mittels DOI proxy ( Zuerst umgesetzt von CNRI und CrossRef: Geplant: Weitere Metadatenformate bereitgestellt von Datenzentren (optionaler) Zugriff auf Rohdaten Alphaversion ist verfügbar: Überblick
27 DataCite Content Service Beispiel
28 DOI-Registrierungs-Infrastruktur 2012
29 Zukunftspläne Import alter DOIs und Metadaten in den MDS Bulk-Operationen (DOI&Metadaten) im Browserinterface OAI-PMH zum Import in den MDS Formular zum Bearbeiten der Metadaten DOI-Auflösungsstatistik Linkchecker für Landing Pages
Vielen Dank für Ihre Aufmerksamkeit!