Tobias Weigel, Merret Buurman (DKRZ) Tobias Weigel, Merret Buurman Deutsches Klimarechenzentrum (DKRZ) RDA-Deutschland-Training: Persistente Identifikatoren.

Slides:



Advertisements
Ähnliche Präsentationen
Architektur eines Human-Task-Service
Advertisements

Einer der Dienste im Internet
DataCite Jan Brase, TIB & DataCite 3. November 2011 TIB-Workshop zur DOI-Registrierung Hannover.
Datenbanken Einführung.
Bibliotheksservice-Zentrum Baden-Württemberg
Texteingabe Überschrift
© ZPID – Universität Trier – Mitglied der Leibniz-Gemeinschaft Jutta von Maurice – IuK Das Psychologische Datenarchiv PsychData Stand: März 2003.
Dl-konzepte bmb+f-Projekt im Digital Library-Forum Rudi Schmiede Verteilte Informationsstrukturen in der Wissenschaft Digital Library Konzepte bmb+f Projekt.
DINI Symposium Wiss. Publizieren in der Zukunft – Open Access, 23./ B. Diekmann Ein Dokumentenserver kostet ? Ökonomische Aspekte für Serverbetreiber.
Universität zu Köln IT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A. Vom Contentmanagementsystem.
Eigenschaften und Pflichten vertrauenswürdiger digitaler Archive
Ruby on Rails im Überblick
Universität Stuttgart Institut für Kernenergetik und Energiesysteme Was ist Refactoring? Bevor man die Integration angeht, mag es angebracht sein, den.
es gibt (fast) nichts, was nicht anders gemacht werden könnte
DOM (Document Object Model)
ZVDD Damals.
PinK Plattform für intelligente Kollaborationsportale Dr. Joachim Quantz, e.V. Berlin, 13. September 2005.
Explizite und editierbare Metainformationen für Software Muster.
Aufgaben eines IT-Koordinators
AWI externer WWW-Server interner WWW-Server Ausgangssituation www.
RelationentheorieObjektorientierte Datenbanken AIFB SS Das ODMG-Objektmodell vs. relationales Modell (1/9) ODMG-Objektmodell Literal_type Atomic_literal.
UML Begleitdokumentation des Projekts
Langzeitarchivierung und Metadaten. NAA Preservation Strategy Link: ml.
Fedora Repository.
Gliederung Litsearch Litsearch+ V.1 Litsearch+ V.2 Freigabe/Versionisierung Litsearch+ Ressourcenverwendung.
Normdaten und Metadaten Die Idee eines Internationalen Authority File Christel Hengel Die Deutsche Bibliothek META-LIB-Workshop, 22. Oktober 2002, Die.
Evaluierung des ITU-T.124 Telekonferenzstandards
Titelfolie Status und weiteres Vorgehen Pilotentreffen Publication Management Service 07. September 2006 Berlin, Harnack-Haus.
Spezifikation von Anforderungen
Was umfaßt die CORBA Core Spezifikation? Welche zusätzlichen Komponenten muß ein ORB Produkt beinhalten? Core: CORBA Objekt Modell CORBA Architektur OMG.
1 Produktive ZDB-Schnittstellen : OAI Bernd Althaus / 10| Produktive ZDB-Schnittstellen: OAI| Althaus | 14. Oktober 2013.
Bewertung von Cloud-Anbietern aus Sicht eines Start-ups
Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Anforderungen von eScience und Grid-Technologie.
Rainer Spittel Technologie-Zentrum Informatik, Universität Bremen
OceanRep das Institutional Repository des Helmholtz-Zentrums für Ozeanforschung Kiel, GEOMAR Barbara Schmidt, GEOMAR Bibliothek.
Letzter Tag Spaeter Zeitpunkt letzte Lied hoert man weiter.
SharePoint 2010 for Information Architects
PHP und MYSQL am Organisatorisches Der komplette Kurs im Schnelldurchgang Bewertung von wichtig und unwichtig Historisch Kulturwissenschaftliche.
Nicolas Frings Maximilian Bernd Stefan Piernikarcyk
A Social Tagging Environment for Web Information Extraction
Sesame Florian Mayrhuber
Das Pilotprojekt zur Langzeitarchvierung an der ETH Zürich
Welchen Problemen ist man bei heterogener, verteilter Programmierung ausgesetzt? Hardware: nicht einheitliche, inkompatible Systeme, verschiedene Leistungsfähigkeit.
Archiv Def: Siehe Digitales Langzeitarchiv.
Zauberwort Metadaten Elementares Handwerkszeug des Content- und Wissensmanagement.
Perspektiven der Akkreditierung an deutschen Hochschulen
KOOP-LITERA Tagung 2003, 8. / 9. Mai 2003 Archivierung digitaler Dokumente Problemstellung - kooperative Lösungsansätze - Aktivitäten der Österreichischen.
Untersuchungen zur Erstellung eines
Eine kurze Einführung.  Software zur Erstellung eines Dokumenten- servers  Dient zur Aufbewahrung von allen Typen von digitalen Inhalten (Texte, Bilder,
M. Lautenschlager (M&D/MPIM)1 Beständige Indikatoren und Langzeitarchivierung Michael Lautenschlager Modelle und Daten Max-Planck-Institut für.
Eike Schallehn, Martin Endig
->Prinzip ->Systeme ->Peer – to – Peer
Vortrag - Diplomarbeiten (HS I)
System Center 2012 Automatisierung von IT-Prozessen Sinja Herbertz Education Support Centre Deutschland.
Linked Open Europeana: Das Europeana Data Model (EDM) Prof. Dr. Stefan Gradmann Unter Rückgriff auf M. Doerr, S. Hennicke, A. Isaac, C. Meghini, G. Schreiber,
RDA, MARC und Co. | Österreichischer Bibliothekartag Sarah Hartmann RDA, MARC und Co. Von der Formalerschließung zum Metadatenmanagement II RDA,
Fedora by C. Göpfert.
IT2 – WS 2005/20061Nov 14, 2005 Visibility  public: Sichtbar in allen Paketen  protected: Sichtbar innerhalb des Pakets und in den Unterklassen  (default,
Konica Minolta IT Solutions GmbH IT-InFRASTRUKTUR
Game Loop & Update Method Robert Nystrom – Game Programming Patterns Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung SS.
Rechen- und Kommunikationszentrum (RZ) Entwicklung einer Web- Oberfläche mit Apache Wicket am Beispiel des IdentityAdmins Seminarvortrag Melanie.
IT-Dienstleistungen E-Learning Systeme Content Management 1 Fallbeispiel ILIAS: Das Repository-Objekt-Plugin „Centra“
Möglichkeiten des elektronischen Publizierens Workshop der AG Physikalische Praktika der DPG Projektidee Möglichkeiten des elektronischen.
| Folie | Folie 2 Neue Herausforderungen im Bereich Umweltinformationsmanagement Wilhelm Vogel.
Technische Universität München, Informatik XI Angewandte Informatik / Kooperative Systeme Verteilte Anwendungen: Entwurf Dr. Wolfgang Wörndl
Vertrauenswürdige Repositorien Take Away Botschaften I Repositorien sind Kern moderner Dateninfrastrukturen Repositorien müssen vielschichtige Vertrauensrelationen.
RDA Deutschland 2016 Trainingskurs #1: Datenobjekte in zuverlässigen Repositorien Teil #2: Persistent Identifiers Tibor Kálmán Gesellschaft für wissenschaftliche.
Entwicklung von produktionsorientierten Simulationskomponenten zur Stoffstromsimulation auf Basis einer Open Source Platform Referenten: Paul Jahr, Lars.
Einführung des Forschungsinformationssystems Pure an der CAU Kiel
PI Infrastruktur in der Max-Planck-Gesellschaft
 Präsentation transkript:

Tobias Weigel, Merret Buurman (DKRZ) Tobias Weigel, Merret Buurman Deutsches Klimarechenzentrum (DKRZ) RDA-Deutschland-Training: Persistente Identifikatoren DKRZ,

Tobias Weigel, Merret Buurman (DKRZ) Zur Einstimmung... Wieviele von Ihnen verwenden institutionell...  DOI?  Handles?  URN?  URL?  PURL?  IGSN?  ORCID?  Andere...? RDA-DE-Training: PIDs2

Tobias Weigel, Merret Buurman (DKRZ) Motivation für PIDs 1.Langfristig stabiler Umgang mit Objektreferenzen  Auch über die Lebensdauer eines Objekts hinaus 2.Umgang mit einer steigenden Zahl von Objekten 3.Abstraktion: Objektnutzung hat Vorrang vor Fragen der Speicherung, Verwaltung, Zugriffsmethoden RDA-DE-Training: PIDs3

Tobias Weigel, Merret Buurman (DKRZ) Motivation für PIDs 1: Referenzierung  Langfristig stabiler Umgang mit Objektreferenzen  Zitierung: Titel, Autor, Jahr. doi: /456  Verwaltung von Objekten mit unklarem Aufbewahrungsstatus  Tatort: Datenproduktion  Löschen des Objekts – Aufbewahrung des PID RDA-DE-Training: PIDs4

Tobias Weigel, Merret Buurman (DKRZ) Beispiel/Exkurs: CMIP6-Anwendungsfall Verwaltung von Objekten mit unklarem Aufbewahrungsstatus:  Frühe Referenzierbarkeit – vor Zitierfähigkeit  Tool zur Versionsprüfung  Aufbau einer zentralen Infrastrukturkomponente – Transparenz der Prozesse, Rechenschaft zu jedem Objekt RDA-DE-Training: PIDs5

Tobias Weigel, Merret Buurman (DKRZ) CMIP6-Datenpublikationsprozess  Objekte sind lange Zeit instabil und können durch Nachfolgeversionen ersetzt werden. RDA-DE-Training: PIDs Modelling group Checkpoint D2/M2ESGF publication STATUS flags OK! PID tracking_ID syntax correct Citation information complete PID registration Citation information confirmation File publication Errata / Annotation available Errata / Annotation registration Versionierung

Tobias Weigel, Merret Buurman (DKRZ) Motivation für PIDs 2: Umgang mit Massendaten Umgang mit einer steigenden Zahl von Objekten – Automatisierung!  Skalierbarkeit technischer Verwaltung  Rolle von Softwareagenten – Maschine trifft Entscheidungen, basierend auf klaren Metadaten  Aufbau von Objektkollektionen und darauf basierenden Diensten RDA-DE-Training: PIDs7

Tobias Weigel, Merret Buurman (DKRZ) Motivation für PIDs 3: Abstraktion – Neue Schichtung  Objektnutzung steht im Vordergrund  Ablösung von Sicht auf Dateisystem  Abstraktion von:  Aufbewahrungsart  Zugriffsweg  Fragen der Übertragung ...  Weicherer Übergang im Lebenszyklus  Auch: Prozessierung nahe am Objekt Cloud... RDA-DE-Training: PIDs8

Tobias Weigel, Merret Buurman (DKRZ) Was wird benötigt? RDA-DE-Training: PIDs PID Technische PID-Infrastruktur, gemeinsame Schnittstellen Endnutzertools, Einbindung in Portale und Arbeitsabläufe Dienstleistungsmodell, Prozesse, QA, Zertifizierung

Tobias Weigel, Merret Buurman (DKRZ) Was sind PIDs? PIDs bleiben auch über Änderungen von Objektort und -eigentümer hinweg gültig RDA-DE-Training: PIDs10

Tobias Weigel, Merret Buurman (DKRZ) Konzeptionelle: PIDs und elementare Metadaten IDENTIFIER black box size checksum timestamps version parent children... Properties PID Record RDA-DE-Training: PIDs11

Tobias Weigel, Merret Buurman (DKRZ) Was steht wo?  Abhängig vom Anwendungsfall, aber: Es gibt einen Kern – Systemmetadaten size checksum timestamps version parent children... Properties Titel Autor Lizenz Herausgeber... Fachinformationen... Fachliche Metadaten RDA-DE-Training: PIDs12... auch: Unterscheidung interne vs. externe Eigenschaften

Tobias Weigel, Merret Buurman (DKRZ) Warum die Trennung?  Warum sollen einige Metadaten nahe am Objekt stehen?  Automatisierung von technischen Prozessen – Verwaltung durch Softwareagenten  Aufbewahrung PID vs. Aufbewahrung Objekt  Schichtensystem: Unterbau unabhängig von Disziplin  Leichtere Indizierung – Schaffung von Standards über Repositorien hinweg RDA-DE-Training: PIDs13

Tobias Weigel, Merret Buurman (DKRZ) Aber wir haben doch z.B. Dublin Core...  Ziel ist nicht so sehr die Beschreibung und Katalogisierung, sondern Verwaltung  Objektoperationen: Verschieben, Replizieren, Versionierung,...  Reduzierung auf das allernötigste – Fokus auf Softwareagenten  Zitierung als ein Folgefall RDA-DE-Training: PIDs14

Tobias Weigel, Merret Buurman (DKRZ) PID-Informationstypen Überblick über die RDA-Arbeitsgruppe zu PID Information Types RDA-DE-Training: PIDs15

Tobias Weigel, Merret Buurman (DKRZ) RDA-Arbeitsgruppe zu PID Information Types  Laufzeit: März 2013 bis September 2015  Co-Chairs: Tim DiLauro, Tobias Weigel  Ergebnisse:  Empfehlungen zu PID-Kernmetadaten  Konzeptioneller Überbau, um diese zu verwalten  Definition einer Programmierschnittstelle (API) inkl. einer prototypischen Umsetzung  Interoperabilität zwischen PID-Systemen und Nutzern von PID-Records RDA-DE-Training: PIDs16

Tobias Weigel, Merret Buurman (DKRZ) Arten von Informationen, die in PIT möglich sind  Zustandsinformationen (size, checksums, modifiable, tombstone, timestamps, managament policies)  Hierarchieinformationen (parent/children, ordering)  Versionierungsinformationen (predecessor, successor, version number)  Provenance-Informationen (input objects, processor object) (Beispiele – keine abgeschlossene Aufstellung...) RDA-DE-Training: PIDs17

Tobias Weigel, Merret Buurman (DKRZ) Definition einer Eigenschaft  Titel  Identifier  Wertebereich (String, Boolean, Date, Integer,...)  Beschreibung RDA-DE-Training: PIDs18

Tobias Weigel, Merret Buurman (DKRZ) Beispiel für eine Eigenschaftsdefinition  Titel: Creation date  Identifier: /6b3e1230d1b68965e290b16a43d2f46d  Wertebereich: DATE  Beschreibung: Erstellungsdatum des Objekts  Verwaltung von registrierten Eigenschaften mittels einer Type Registry (RDA-WG) RDA-DE-Training: PIDs19

Tobias Weigel, Merret Buurman (DKRZ) Gruppierung von Eigenschaften Properties Types Profiles Conform? RDA-DE-Training: PIDs20

Tobias Weigel, Merret Buurman (DKRZ) Beispielanwendung über Repositorien hinweg Format: Checksum: Size: Version: Creation date: Size: Format: Parent: Checksum: Replica: Integrity verification service PIT API RDA-DE-Training: PIDs21

Tobias Weigel, Merret Buurman (DKRZ) Policies, Prozesse, Qualitätssicherung RDA-DE-Training: PIDs22

Tobias Weigel, Merret Buurman (DKRZ) Eine Frage des Vertrauens Ich schenke Ihnen PIDs. So viele Sie wollen! RDA-DE-Training: PIDs23

Tobias Weigel, Merret Buurman (DKRZ) Was macht einen PID persistent? Die Bereitstellung von PIDs ist kein primär technisches Problem.  Die Komplexität der beteiligten Systeme ist eher gering (Ausnahme: Skalierbarkeit)  Essentiell: Vertrauen in die Stabilität der Verbindung von PID zu Objekt  Auch: Wiedererkennungswert, Anerkennung durch Verlage oder andere Nachnutzer RDA-DE-Training: PIDs24

Tobias Weigel, Merret Buurman (DKRZ) Vertrauen durch Institutionalisierung Beispiel: DONA und ePIC  DONA  eScience Persistent Identifier Consortium (ePIC)  Geschäftsmodell, Prozesse, Reporting  Ausblick am DKRZ: Modellierung mittels IT Service Management (FitSM) RDA-DE-Training: PIDs25

Tobias Weigel, Merret Buurman (DKRZ) Institutionale Prozesse: PID-Dienstleister  Prefix management  Anfrage, Erstellung  Prefix hosting, server hosting  Mirroring  Betreuung PID/Objektlebenszyklus  Produktentwicklung  Infrastrukturkomponenten  Tools für Endanwender  Reporting  Support desk  Beratung RDA-DE-Training: PIDs to be continued...

Tobias Weigel, Merret Buurman (DKRZ) Collections RDA-DE-Training: PIDs27

Tobias Weigel, Merret Buurman (DKRZ) Was ist eine Kollektion?  A bag of things with a persistent identifier RDA-DE-Training: PIDs28

Tobias Weigel, Merret Buurman (DKRZ) RDA WG: Research Data Collections  Laufzeit: März 2016 – September 2017  Co-Chairs: Bridget Almas, Frederik Baumgardt, Tobias Weigel, Tom Zastrow  Geplante Ergebnisse:  Konzeptionell: Modelle für Kollektionen, Definitionen  Technisch: API-Spezifikation und Prototyp RDA-DE-Training: PIDs29

Tobias Weigel, Merret Buurman (DKRZ) Was sind die Ziele der Arbeitsgruppe? ID:... Collection ID:... Create Read Update Delete Collection models List? Iterate?...? RDA-DE-Training: PIDs30 Definitions

Tobias Weigel, Merret Buurman (DKRZ) Beispiel: Verknüpfung von Daten und Metadaten DatenMetadaten Collection PID RDA-DE-Training: PIDs31

Tobias Weigel, Merret Buurman (DKRZ) Beispiel: Aufbau von Hierarchien  CMIP6 Datenhierarchie Mio. Files? RDA-DE-Training: PIDs32

Tobias Weigel, Merret Buurman (DKRZ) Beispiel: Ablauf bei Perseus RDA-DE-Training: PIDs from Bridget Almas

Tobias Weigel, Merret Buurman (DKRZ) Derzeitiger Stand  Vielfalt an Anwendungsfällen  No single size fits all  Kollektionsmodelle mittels traits  Grundsätzlich:  Jede Kollektion trägt einen PID.  Objekte können PIDs tragen.  Rule-based collections  Aber: wie umsetzen? RDA-DE-Training: PIDs34

Tobias Weigel, Merret Buurman (DKRZ) Ende Teil 1 Vielen Dank für Ihre Aufmerksamkeit! RDA-DE-Training: PIDs35

Tobias Weigel, Merret Buurman (DKRZ) Type Registry  Exkurs: Type Registry  Installierbare Software (CNRI)  Oberfläche zur Verwaltung von Typen  RESTful API  Jeder Typ besitzt ein Handle  Verschiedene Einsatzszenarien RDA-DE-Training: PIDs36