Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
Veröffentlicht von:Ingrid Bach Geändert vor über 7 Jahren
1
Tobias Weigel, Merret Buurman (DKRZ) Tobias Weigel, Merret Buurman Deutsches Klimarechenzentrum (DKRZ) RDA-Deutschland-Training: Persistente Identifikatoren DKRZ, 25.05.2016
2
Tobias Weigel, Merret Buurman (DKRZ) Zur Einstimmung... Wieviele von Ihnen verwenden institutionell... DOI? Handles? URN? URL? PURL? IGSN? ORCID? Andere...? 25.05.2016 RDA-DE-Training: PIDs2
3
Tobias Weigel, Merret Buurman (DKRZ) Motivation für PIDs 1.Langfristig stabiler Umgang mit Objektreferenzen Auch über die Lebensdauer eines Objekts hinaus 2.Umgang mit einer steigenden Zahl von Objekten 3.Abstraktion: Objektnutzung hat Vorrang vor Fragen der Speicherung, Verwaltung, Zugriffsmethoden 25.05.2016 RDA-DE-Training: PIDs3
4
Tobias Weigel, Merret Buurman (DKRZ) Motivation für PIDs 1: Referenzierung Langfristig stabiler Umgang mit Objektreferenzen Zitierung: Titel, Autor, Jahr. doi: 10.123/456 Verwaltung von Objekten mit unklarem Aufbewahrungsstatus Tatort: Datenproduktion Löschen des Objekts – Aufbewahrung des PID 25.05.2016 RDA-DE-Training: PIDs4
5
Tobias Weigel, Merret Buurman (DKRZ) Beispiel/Exkurs: CMIP6-Anwendungsfall Verwaltung von Objekten mit unklarem Aufbewahrungsstatus: Frühe Referenzierbarkeit – vor Zitierfähigkeit Tool zur Versionsprüfung Aufbau einer zentralen Infrastrukturkomponente – Transparenz der Prozesse, Rechenschaft zu jedem Objekt 25.05.2016 RDA-DE-Training: PIDs5
6
Tobias Weigel, Merret Buurman (DKRZ) CMIP6-Datenpublikationsprozess Objekte sind lange Zeit instabil und können durch Nachfolgeversionen ersetzt werden. RDA-DE-Training: PIDs6 25.05.2016 Modelling group Checkpoint D2/M2ESGF publication STATUS flags OK! PID tracking_ID syntax correct Citation information complete PID registration Citation information confirmation File publication Errata / Annotation available Errata / Annotation registration Versionierung
7
Tobias Weigel, Merret Buurman (DKRZ) Motivation für PIDs 2: Umgang mit Massendaten Umgang mit einer steigenden Zahl von Objekten – Automatisierung! Skalierbarkeit technischer Verwaltung Rolle von Softwareagenten – Maschine trifft Entscheidungen, basierend auf klaren Metadaten Aufbau von Objektkollektionen und darauf basierenden Diensten 25.05.2016 RDA-DE-Training: PIDs7
8
Tobias Weigel, Merret Buurman (DKRZ) Motivation für PIDs 3: Abstraktion – Neue Schichtung Objektnutzung steht im Vordergrund Ablösung von Sicht auf Dateisystem Abstraktion von: Aufbewahrungsart Zugriffsweg Fragen der Übertragung ... Weicherer Übergang im Lebenszyklus Auch: Prozessierung nahe am Objekt 25.05.2016 Cloud... RDA-DE-Training: PIDs8
9
Tobias Weigel, Merret Buurman (DKRZ) Was wird benötigt? RDA-DE-Training: PIDs9 25.05.2016 PID Technische PID-Infrastruktur, gemeinsame Schnittstellen Endnutzertools, Einbindung in Portale und Arbeitsabläufe Dienstleistungsmodell, Prozesse, QA, Zertifizierung
10
Tobias Weigel, Merret Buurman (DKRZ) Was sind PIDs? PIDs bleiben auch über Änderungen von Objektort und -eigentümer hinweg gültig 25.05.2016 RDA-DE-Training: PIDs10
11
Tobias Weigel, Merret Buurman (DKRZ) Konzeptionelle: PIDs und elementare Metadaten 25.05.2016 IDENTIFIER black box size checksum timestamps version parent children... Properties PID Record RDA-DE-Training: PIDs11
12
Tobias Weigel, Merret Buurman (DKRZ) Was steht wo? Abhängig vom Anwendungsfall, aber: Es gibt einen Kern – Systemmetadaten 25.05.2016 size checksum timestamps version parent children... Properties Titel Autor Lizenz Herausgeber... Fachinformationen... Fachliche Metadaten RDA-DE-Training: PIDs12... auch: Unterscheidung interne vs. externe Eigenschaften
13
Tobias Weigel, Merret Buurman (DKRZ) Warum die Trennung? Warum sollen einige Metadaten nahe am Objekt stehen? Automatisierung von technischen Prozessen – Verwaltung durch Softwareagenten Aufbewahrung PID vs. Aufbewahrung Objekt Schichtensystem: Unterbau unabhängig von Disziplin Leichtere Indizierung – Schaffung von Standards über Repositorien hinweg 25.05.2016 RDA-DE-Training: PIDs13
14
Tobias Weigel, Merret Buurman (DKRZ) Aber wir haben doch z.B. Dublin Core... Ziel ist nicht so sehr die Beschreibung und Katalogisierung, sondern Verwaltung Objektoperationen: Verschieben, Replizieren, Versionierung,... Reduzierung auf das allernötigste – Fokus auf Softwareagenten Zitierung als ein Folgefall 25.05.2016 RDA-DE-Training: PIDs14
15
Tobias Weigel, Merret Buurman (DKRZ) PID-Informationstypen Überblick über die RDA-Arbeitsgruppe zu PID Information Types 25.05.2016 RDA-DE-Training: PIDs15
16
Tobias Weigel, Merret Buurman (DKRZ) RDA-Arbeitsgruppe zu PID Information Types Laufzeit: März 2013 bis September 2015 Co-Chairs: Tim DiLauro, Tobias Weigel Ergebnisse: Empfehlungen zu PID-Kernmetadaten Konzeptioneller Überbau, um diese zu verwalten Definition einer Programmierschnittstelle (API) inkl. einer prototypischen Umsetzung Interoperabilität zwischen PID-Systemen und Nutzern von PID-Records 25.05.2016 RDA-DE-Training: PIDs16
17
Tobias Weigel, Merret Buurman (DKRZ) Arten von Informationen, die in PIT möglich sind Zustandsinformationen (size, checksums, modifiable, tombstone, timestamps, managament policies) Hierarchieinformationen (parent/children, ordering) Versionierungsinformationen (predecessor, successor, version number) Provenance-Informationen (input objects, processor object) 25.05.2016 (Beispiele – keine abgeschlossene Aufstellung...) RDA-DE-Training: PIDs17
18
Tobias Weigel, Merret Buurman (DKRZ) Definition einer Eigenschaft Titel Identifier Wertebereich (String, Boolean, Date, Integer,...) Beschreibung 25.05.2016 RDA-DE-Training: PIDs18
19
Tobias Weigel, Merret Buurman (DKRZ) Beispiel für eine Eigenschaftsdefinition Titel: Creation date Identifier: 11314.3/6b3e1230d1b68965e290b16a43d2f46d Wertebereich: DATE Beschreibung: Erstellungsdatum des Objekts Verwaltung von registrierten Eigenschaften mittels einer Type Registry (RDA-WG) 25.05.2016 RDA-DE-Training: PIDs19
20
Tobias Weigel, Merret Buurman (DKRZ) Gruppierung von Eigenschaften 25.05.2016 Properties Types Profiles Conform? RDA-DE-Training: PIDs20
21
Tobias Weigel, Merret Buurman (DKRZ) Beispielanwendung über Repositorien hinweg 25.05.2016 Format: Checksum: Size: Version: Creation date: Size: Format: Parent: Checksum: Replica: Integrity verification service PIT API RDA-DE-Training: PIDs21
22
Tobias Weigel, Merret Buurman (DKRZ) Policies, Prozesse, Qualitätssicherung 25.05.2016 RDA-DE-Training: PIDs22
23
Tobias Weigel, Merret Buurman (DKRZ) Eine Frage des Vertrauens. 25.05.2016 Ich schenke Ihnen PIDs. So viele Sie wollen! RDA-DE-Training: PIDs23
24
Tobias Weigel, Merret Buurman (DKRZ) Was macht einen PID persistent? Die Bereitstellung von PIDs ist kein primär technisches Problem. Die Komplexität der beteiligten Systeme ist eher gering (Ausnahme: Skalierbarkeit) Essentiell: Vertrauen in die Stabilität der Verbindung von PID zu Objekt Auch: Wiedererkennungswert, Anerkennung durch Verlage oder andere Nachnutzer 25.05.2016 RDA-DE-Training: PIDs24
25
Tobias Weigel, Merret Buurman (DKRZ) Vertrauen durch Institutionalisierung Beispiel: DONA und ePIC DONA eScience Persistent Identifier Consortium (ePIC) Geschäftsmodell, Prozesse, Reporting Ausblick am DKRZ: Modellierung mittels IT Service Management (FitSM) 25.05.2016 http://www.dona.nethttp://www.pidconsortium.eu RDA-DE-Training: PIDs25
26
Tobias Weigel, Merret Buurman (DKRZ) Institutionale Prozesse: PID-Dienstleister Prefix management Anfrage, Erstellung Prefix hosting, server hosting Mirroring Betreuung PID/Objektlebenszyklus Produktentwicklung Infrastrukturkomponenten Tools für Endanwender Reporting Support desk Beratung RDA-DE-Training: PIDs26 25.05.2016 to be continued...
27
Tobias Weigel, Merret Buurman (DKRZ) Collections 25.05.2016 RDA-DE-Training: PIDs27
28
Tobias Weigel, Merret Buurman (DKRZ) Was ist eine Kollektion? A bag of things with a persistent identifier. 25.05.2016 RDA-DE-Training: PIDs28
29
Tobias Weigel, Merret Buurman (DKRZ) RDA WG: Research Data Collections Laufzeit: März 2016 – September 2017 Co-Chairs: Bridget Almas, Frederik Baumgardt, Tobias Weigel, Tom Zastrow Geplante Ergebnisse: Konzeptionell: Modelle für Kollektionen, Definitionen Technisch: API-Spezifikation und Prototyp 25.05.2016 RDA-DE-Training: PIDs29
30
Tobias Weigel, Merret Buurman (DKRZ) Was sind die Ziele der Arbeitsgruppe? ID:... Collection ID:... Create Read Update Delete Collection models List? Iterate?...? 25.05.2016 RDA-DE-Training: PIDs30 Definitions
31
Tobias Weigel, Merret Buurman (DKRZ) Beispiel: Verknüpfung von Daten und Metadaten 25.05.2016 DatenMetadaten Collection PID RDA-DE-Training: PIDs31
32
Tobias Weigel, Merret Buurman (DKRZ) Beispiel: Aufbau von Hierarchien CMIP6 Datenhierarchie 25.05.2016 250 Mio. Files? RDA-DE-Training: PIDs32
33
Tobias Weigel, Merret Buurman (DKRZ) Beispiel: Ablauf bei Perseus RDA-DE-Training: PIDs33 25.05.2016 from Bridget Almas
34
Tobias Weigel, Merret Buurman (DKRZ) Derzeitiger Stand Vielfalt an Anwendungsfällen No single size fits all Kollektionsmodelle mittels traits Grundsätzlich: Jede Kollektion trägt einen PID. Objekte können PIDs tragen. Rule-based collections Aber: wie umsetzen? 25.05.2016 RDA-DE-Training: PIDs34
35
Tobias Weigel, Merret Buurman (DKRZ) Ende Teil 1 Vielen Dank für Ihre Aufmerksamkeit! 25.05.2016 RDA-DE-Training: PIDs35
36
Tobias Weigel, Merret Buurman (DKRZ) Type Registry Exkurs: Type Registry Installierbare Software (CNRI) Oberfläche zur Verwaltung von Typen RESTful API Jeder Typ besitzt ein Handle Verschiedene Einsatzszenarien 25.05.2016 RDA-DE-Training: PIDs36
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.