Torsten Rathmann (DKRZ) Torsten Rathmann Deutsches Klimarechenzentrum (DKRZ) Datenmanagement am DKRZ PubFlow Workshop 18. März 2014.

Slides:



Advertisements
Ähnliche Präsentationen
Zukunftsaussichten DOI Registrierung Jan Brase, DataCite 3. November 2011 TIB-Workshop zur DOI-Registrierung Hannover.
Advertisements

DataCite Jan Brase, TIB & DataCite 3. November 2011 TIB-Workshop zur DOI-Registrierung Hannover.
MIRAKEL Die Klimadatenbank des DWD
PADLR Submodul Modular Content Archives Ein Content Browser für Lehr- materialien aus der Elektrotechnik Dipl.-Ing. Mark Painter Institut für Nachrichtentechnik.
Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.
CC0-Lizenz für Metadaten
Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik Vertiefung.
Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen Am Fassberg, Göttingen Fon: Fax:
DissOnline / Digitale Dissertationen Dr. P. Schirmbacher Offene Standards und internationale / nationale Abstimmung Gliederung: 1.Open Archive.
Data Documentation Initiative (DDI)
1. Metadaten-Workshop der AfS / META-LIB-Abschluss-Workskop, 21./22. Oktober 2002 Zusammenfassung, Ausblick Renate Gömpel Arbeitsstelle für Standardisierung.
Thats IT!. Titelmasterformat durch Klicken bearbeiten Über uns Mit uns bekommen Sie: Beratung – Doing - Betreuung langjährige Erfahrung umfassende Beratung.
Architekturen und Techniken für computergestützte Engineering Workbenches.
Sesame Florian Mayrhuber
Das Pilotprojekt zur Langzeitarchvierung an der ETH Zürich
WissGrid AP3: LZA Dienste
Virtuelle Forschungsumgebungen
Expertise Grid und eScience Jens Klump nestor AG Grid/eScience DNB, Frankfurt (M),
Stand der Expertise Workshop am SUB Göttingen
Qualitätskontrolle der IPCC-AR5 Daten
M. Lautenschlager (M&D/MPIM) / / 1 WDC Konsortium Meeting Oberpfaffenhofen, 24/ )CERA-DB 2)WDCC Homepage 3)DLR EOWEB Zugang 4)Kostenmodell.
Informationsdienste Torsten Rathmann (Deutsches Klimarechenzentrum, Hamburg) Workshop: Virtuelle Forschungsumgebungen aufbauen – mit D-Grid Abstract: Thema.
CLM Konsortialrechnungen bei Modelle und Daten (M&D) Martina Schubert CLM-Community Assembly 2007 (Langen)
KOOP-LITERA Tagung 2003, 8. / 9. Mai 2003 Archivierung digitaler Dokumente Problemstellung - kooperative Lösungsansätze - Aktivitäten der Österreichischen.
M. Lautenschlager (M&D/MPIM)1 Beständige Indikatoren und Langzeitarchivierung Michael Lautenschlager Modelle und Daten Max-Planck-Institut für.
Daten- wo bleiben sie? Bernd Richter.
Erst Theorie… …dann Praxis. Erst Theorie… …dann Praxis.
Fedora by C. Göpfert.
Die digitale Langzeitarchivierung Referentin: Marietta Steinhöfel Seminar: Digitale Langzeitarchivierung Prof. Dr. Manfred Thaller
Was kommt nach der URL? Referenzierung elektronischer Inhalte SunSummit / Dr. Stefan Gradmann Regionales Rechenzentrum der Universität Hamburg.
Einbindung in laufende und zukünftige Aufgaben Rainer Lehfeldt Bundesanstalt für Wasserbau Hamburg - Workshop Büsum Ziele für NOKIS++
Das OAIS Modell Manfred Thaller Universität zu Köln
Möglichkeiten des elektronischen Publizierens Workshop der AG Physikalische Praktika der DPG Projektidee Möglichkeiten des elektronischen.
H. Grottenegg 1 Geodaten – zur Prüfung bitte!. H. Grottenegg2 Um welche Prüfung gehts?  Prüfung von (Geo-)Daten gegen eine Richtlinie/Vorgabe (z.B.Naturbestand,
Internet Universität zu Köln WS 2011/12 Dozent: Prof. Dr. Manfred Thaller AM 2: Digitale Langzeitarchivierung Referentin: Rasa Sommer.
Jan Dovermann Uniklinik RWTH Aachen University Institut für Medizinische Informatik Modellierung und Entwicklung eines generischen Tools zum Export von.
Langzeitarchivierung am DKRZ Langzeitarchivierung am D K R Z Workshop Archivierung sozial- und wirtschaftswissenschaftlicher Datenbestände Deutsche.
SEKTORVORHABEN NACHHALTIGE WIRTSCHAFTSENTWICKLUNG
Rahmenkonzept Beratung- Förderung-Begleitung
CMIP6-DICAD – FU Berlin Thomas Schartner
Formaterkennung: FIDO
aus Mitteln des SAW-Verfahrens 2014
Daten Management in COSYNA
Technische und soziale forschungsinfrastrukturen für die humanities das beispiel dagaare – english – cantonese dictionary eveline wandl-vogt1, adams bodomo2,
Metadaten als Grundlage der MDI-DE
Informationsveranstaltung Forschungsdatenmanagement
Status MIWP (Fitness for purpose – Analysis)
Arbeitsschritte für das Erstellen eines neuen Themas für die
1 Tobias Steinke Langzeitarchivierungs-Policy der Deutschen Nationalbibliothek: Theorie und Praxis | 18 | Langzeitarchivierungs-Policy der DNB: Theorie.
AURIS-MM Spezifikation
Das Literaturverwaltungsprogramm Citavi plus X Teil 2c: Forschungsdatenmanagement Dr. Daniel Rudolf.
Stefan Kurz, Werner Heinrich Universität Passau, Projekt InteLeC
Gewachsene Architektur Das kann nicht funktionieren!
Änderungen im Urheberrecht und ihre Auswirkungen für die Fernleihe
UrMEL und Langzeitarchivierung mit KolibRi/Kopal-Dias
Die Zukunft des Kalliope-Verbundes „gemeinsam gestalten“
X-NetMES – Erfassung und Auswertung direkt in SAP-ERP
7th German CDISC User Group Basel, 11. März 2010
KIT Campus Management - Wie funktioniert mein KIT-Account?
Wir sprechen Ihre Sprache.
PI Infrastruktur in der Max-Planck-Gesellschaft
…die richtige digitale Unterstützung für ihre Firma
Ein Referat von Sabrina vissel und Yannick Fuchs
Studienphase 2.
Präsentation von Darleen und Michèle
Vom Feld zur Cloud eine kollaborative Online-Plattform zur Verwaltung hydrologischer Observatorien Philipp Kraft, David Windhorst, Lutz Breuer.
CMIP6 Datenmanagement Daten-bereitstellung Qualitätsprüfung
Risiko – Check Erkennung von Politisch exponierten Persönlichkeiten (PeP‘s) bzw. von Personen mit Verdacht auf Geldwäsche und/oder Terrorismusfinanzierung.
Konzeption und Institutionalisierung des FDM — aus der Erfahrung eines Forschungsprojekts in den digitalen Geisteswissenschaften Teil 2: Die Perspektive.
Forschungsdatenmanagement in den Regionalwissenschaften am Beispiel des GIGA German Institute of Global and Area Studies Dr. Birte Pfeiffer GIGA German.
 Präsentation transkript:

Torsten Rathmann (DKRZ) Torsten Rathmann Deutsches Klimarechenzentrum (DKRZ) Datenmanagement am DKRZ PubFlow Workshop 18. März 2014

Torsten Rathmann (DKRZ)  Schwerpunkt Klimamodelldaten Aufbereitete Daten, keine Rohdaten  Datenproduzenten sind Großprojekte mit Konsortialrechnungen, Metadatenerzeugung und Qualitätskontrolle am DKRZ ‒ CMIP (Coupled Model Intercomparison Project): liefert Daten für Weltklimabericht ‒ CORDEX (Coordinated Regional Climate Downscaling Experiment): Regionalmodelle Projekte, die Archivierung benötigen/wollen (z.B. 10 Jahre) 2 Das World Data Center for Climate (WDCC)

Torsten Rathmann (DKRZ) 3 Entwicklung des Datenvolumens am WDCC

Torsten Rathmann (DKRZ) 4 Warum so viel?  Experimente Historical: Representative Concentration Pathway (RCP)  Anfangswerte, 3D-Gitter, Zeitreihe, Modelle

Torsten Rathmann (DKRZ)  NetCDF (Network Common Data Form) Eines von 3 im WDCC erlaubten Dateiformaten Trend geht in Richtung NetCDF wegen der Großprojekte CMIP5 und CORDEX Binär, Header+Arrays  CF (Climate and Forecast) Konkretisierung von NetCDF für die Klimaforschung Standardnamen für Variablen, z.B. „air_temperature“ 5 Standards

Torsten Rathmann (DKRZ) 6 Datenlebenszyklus Planung und Erstellung Pre-Ingest Ingest Speicherung Kuration Zugriff und Nutzung Portierung von Werkzeugen DOI-Vergabe (optional) Homogenisierung Formatkonvertierung Metadaten-Erzeugung Web-Portale DVD-Versand Qualitätskontrolle Einfüllen Welche Daten/Metadaten werden gebraucht? Namen für Datensätze und Dateien Durchführung von Konsortialrechnungen

Torsten Rathmann (DKRZ) 7 Ingest und Speicherung mit Arbeitsstunden Pro Auftrag Pro Experiment Pro Experiment bei gleichen Datenstrukturen Daten- und Metadatenarchivierung (Ingest) Information und Beratung4 Projekt-Spezifikation (Festlegung Daten­umfang, Formate, Datenorganisation, Speicherstrategie, Weg der Daten zum WDCC, Data-Policy, Zugriffsbedingungen) 2 Erstellen eines Konzeptes (Metadaten­umfang, Preprocessing, Zeitplan) und Kostenabschätzung 4 Erfassen, Einfüllen und Qualitätskontrolle der Metadaten 1053 Aufsetzen Datentransfer und Einfüllen der Daten711 Qualitätskontrolle der Daten einschl. Prüfung der Konsistenz von Metadaten und Daten 104 Freischaltung und Abschluss-Report6 insgesamt Jahre Speicherung inklusive Pflege Aktualisierung der Metadaten10 8 Pflege der Datensätze innerhalb der Datenbank 105 Anpassung der Zugriffsberechtigungen822 Laufende Anpassung an DKRZ-Infrastruktur1053 insgesamt282718

Torsten Rathmann (DKRZ) Speicherung 8 2 Brandabschnitte 7 automatische Oracle/StorageTek SL8500- Bandbibliotheken Hierarchical Storage Management (HSM) > 100 PetaByte Kapazität

Torsten Rathmann (DKRZ) Speicherung 9 8 Roboter je Bandbibliothek Ca Stellplätze für Magnetbandkassetten

Torsten Rathmann (DKRZ) 10 DOI (Digital Object Identifier) für Daten Persistenter IdentifikatorURLLandungsseiteDaten International DOI Foundation (IDF) CrossRef DataCite … GESIS TIB ZB MED ZBW … WDCC am DKRZ PANGAEA … Registrierungsagenturen Allocation Agencies Datenzentren

Torsten Rathmann (DKRZ) 11 Workflow der DOI-Vergabe am WDCC search.datacite.org DOI-Resolver CERA Metadaten CERA Wissenschaftliche Qualitätskontrolle Technische Qualitätskontrolle, Stufe 1 Technische Qualitätskontrolle, Stufe 2 Daten­ erzeuger World Data Centre for Climate DataCite International DOI Foundation DOI DOI/URL URL DOI

Torsten Rathmann (DKRZ) 12 Zugriff und Nutzung