Qualitätskontrolle der IPCC-AR5 Daten

Slides:



Advertisements
Ähnliche Präsentationen
Primary Data for Chemistry
Advertisements

Cadastre for the 21st Century – The German Way
Vernetzung von Repositorien : DRIVER Guidelines Dr Dale Peters, SUB Goettingen 4. Helmholtz Open Access Workshop Potsdam, 17 Juni 2008.
PSI and Competition The General Framework
E-Solutions mySchoeller.com for Felix Schoeller Imaging
SION Vacuum Circuit-Breakers 3AE5 and 3AE1
Development of a Web-Service for the DIOXIN- Database of Germany
DEUTSCHE INITIATIVE FÜR NETZWERKINFORMATION E.V. DINI Zertifikat 2007 Frank Scholze Universitätsbibliothek Stuttgart Erfahrungsaustausch DINI-zertifizierter.
Forschungsdatenzentrum der Bundesagentur für Arbeit im Institut für Arbeitsmarkt- und Berufsforschung Two Issues on Remote Data Access.
R. Zankl – Ch. Oelschlegel – M. Schüler – M. Karg – H. Obermayer R. Gottanka – F. Rösch – P. Keidler – A. Spangler th Expert Meeting Business.
© 2006 Open Grid Forum OGF26 - Chapel Hill, May 2009 Addressing Metadata Challenges OGF Digital Repositories RG.
An OGC Standards Driven Geodata Online Access for DLRs National Remote Sensing Data Library (NRSDL) Torsten Heinen German Remote Sensing Data Center (DLR/DFD)
Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik Vertiefung.
Fakultät für informatik informatik 12 technische universität dortmund Hardware/Software Partitioning Peter Marwedel Informatik 12 TU Dortmund Germany Chapter.
DissOnline / Digitale Dissertationen Dr. P. Schirmbacher Offene Standards und internationale / nationale Abstimmung Gliederung: 1.Open Archive.
Zusammenfassung / Ausblick Persistente Domänenmodelle mit JPA 2.0 und Bean Validation.
Normen für Windenergieanlagen
1 Geistes-, Natur-, Sozial- und Technikwissenschaften – gemeinsam unter einem Dach The Academic Information Domain DGI Top-Tech-Trends Panel 2010 Dr. Wolfram.
Das Late Maunder Minimum – Folge von Strahlungsanomalien?
Thomas Herrmann Software - Ergonomie bei interaktiven Medien Step 6: Ein/ Ausgabe Instrumente (Device-based controls) Trackball. Joystick.
POST MARKET CLINICAL FOLLOW UP
CTS2 based Terminology Server – Overview – Project eBPG
Fachabteilung 16A Überörtliche Raumplanung Cross border co-operation from the view of a public administration unit.
Seminar Telematiksysteme für Fernwartung und Ferndiagnose Basic Concepts in Control Theory MSc. Lei Ma 22 April, 2004.
Methods Fuzzy- Logic enables the modeling of rule based knowledge by the use of fuzzy criteria instead of exact measurement values or threshold values.
Status eSciDoc Malte Dreyer eSciDoc Hauptaktivitäten in 2006 Abstimmung mit den Zielgruppen Funktionale Anforderungserhebung mit.
Integration of renewable energies: competition between storage, the power grid and flexible demand Thomas Hamacher.
Case Study Session in 9th GCSM: NEGA-Resources-Approach
Institut AIFB, Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825 Towards Automatic Composition of Processes based on Semantic.
A good view into the future Presented by Walter Henke BRIT/SLL Schweinfurt, 14. November 2006.
Z Corp Customer Examples
Bundesamt für Wehrtechnik und Beschaffung THE COST EFFECTIVE DEVELOPMENT OF HLA FEDERATIONS FOR COMPUTER- ASSISTED EXERCISES (CAX) K. Pixius 23-Sep-02.
The free XML Editor for Windows COOKTOP Semistrukturierte Daten 1 Vortrag Semistrukturierte Daten 1 COOKTOP The free XML-Editor for Windows
Deutsch 1 G Stunde. Donnerstag, der 25. Oktober 2012 Deutsch 1, G Stunde Heute ist ein B- Tag Unit: Family & homeFamilie & Zuhause Objectives: Phrases.
Deutsch 1 G Stunde. Donnerstag, der 18. Oktober 2012 Deutsch 1, G Stunde Heute ist ein E- Tag Unit: Family & homeFamilie & Zuhause Objectives: Phrases.
G Stunde DEUTSCH 1. Unit: Family & homeFamilie & Zuhause Objectives: Phrases about date, weather and time-telling Alphabet – pronunciation and words The.
Deutsch 1 G Stunde. Montag, der 22. Oktober 2012 Deutsch 1, G Stunde Heute ist ein F- Tag Unit: Family & homeFamilie & Zuhause Objectives: Conjugations.
Deutsch 1 G Stunde. Donnerstag, der 18. Oktober 2012 Deutsch 1, G Stunde Heute ist ein D- Tag Unit: Family & homeFamilie & Zuhause Objectives: Phrases.
Deutsch 1 G Stunde. Unit: Introduction to German & Germany Objectives: Learn phrases about date, weather and time-telling Some organization items: grades,
Neno Loje Berater & MVP für Visual Studio ALM und TFS (ehemals VSTS) Hochqualitative Produkte mit Visual Studio & TFS 2010.
Department of Computer Science Homepage HTML Preprocessor Perl Database Revision Control System © 1998, Leonhard Jaschke, Institut für Wissenschaftliches.
Web Services Semistrukturierte Daten 1 – Gruppe 6.
Mein Stammbaum.
SIT-MOON ESPRIT Project Nr st Review, Brussels, 27th of April 1998 slide 1 Siemens AG Österreich Robotiker Technische Universität Wien Politecnico.
Template v5 October 12, Copyright © Infor. All Rights Reserved.
WissGrid AP3: LZA Dienste
Impairments in Polarization-Multiplexed DWDM Channels due to Cross- Polarization Modulation Marcus Winter Christian-Alexander Bunge Klaus Petermann Hochfrequenztechnik-Photonik.
Berner Fachhochschule Hochschule für Agrar-, Forst- und Lebensmittelwissenschaften HAFL Recent activities on ammonia emissions: Emission inventory Rindvieh.
4th Symposium on Lidar Atmospheric Applications
Virtuelle Forschungsumgebungen
Digital Dashboard Toolkit 2001 SharePoint Portal Server released targeting portal market SharePoint Team Services (STS) released as free add-
3rd Review, Vienna, 16th of April 1999 SIT-MOON ESPRIT Project Nr Siemens AG Österreich Robotiker Technische Universität Wien Politecnico di Milano.
3rd Review, Vienna, 16th of April 1999 SIT-MOON ESPRIT Project Nr Siemens AG Österreich Robotiker Technische Universität Wien Politecnico di Milano.
RZPD Deutsches Ressourcenzentrum für Genomforschung GmbH DESPRAD-Meeting 02/09/2003 Steffen Schulze-Kremer (until 7/2003) Bernd Drescher (since 8/2003)
M. Lautenschlager (M&D/MPIM) / / 1 WDC Konsortium Meeting Oberpfaffenhofen, 24/ )CERA-DB 2)WDCC Homepage 3)DLR EOWEB Zugang 4)Kostenmodell.
CLM Konsortialrechnungen bei Modelle und Daten (M&D) Martina Schubert CLM-Community Assembly 2007 (Langen)
KIT – die Kooperation von Forschungszentrum Karlsruhe GmbH und Universität Karlsruhe (TH) Vorlesung Knowledge Discovery - Institut AIFB Tempus fugit Towards.
Ressourcen in Process-Aware Information Systems Paul Hübner | | DBIS Seminar Betreuer : Andreas Lanz Quelle : Seven Fallacies.
Launch ON Global.vi System ID object name classname Services to suscribe Observer Control Ref vi-path Service name Step 1 : Objects register to the Global.vi´s,
Lehrstuhl für Waldbau, Technische Universität MünchenBudapest, 10./11. December 2006 WP 1 Status (TUM) Bernhard Felbermeier.
How Does Fuzzy Arithmetic Work ? © Hartwig Jeschke Institut für Mikroelektronische Schaltungen und Systeme Universität Hannover
EN/FAD Ericsson GmbH EDD/ Information im 21. Jahrundert muss Erwünscht Relevant Erreichbar Schnell Kostenlos!?
TUM in CrossGrid Role and Contribution Fakultät für Informatik der Technischen Universität München Informatik X: Rechnertechnik und Rechnerorganisation.
Structure of architecture documentation
Page 1 XXX21/08/2014 Implemented by Benutzen Sie diese Titelfolie für Programme und Projekte im Ausland. Setzen Sie das „einheitliche Logo der Zusammenarbeit“
COPSGOPD-PHASEWORLD Scientific community DFG rules for good scientific practice Maintenance of long term archive COPS/GOP/D-PHASE Common Data Policy WDCC.
Torsten Rathmann (DKRZ) Torsten Rathmann Deutsches Klimarechenzentrum (DKRZ) Datenmanagement am DKRZ PubFlow Workshop 18. März 2014.
OAI Protocol for Metadata Harvesting
CMIP6 Datenmanagement Daten-bereitstellung Qualitätsprüfung
 Präsentation transkript:

Qualitätskontrolle der IPCC-AR5 Daten Martina Stockhause, Michael Lautenschlager, Heinke Höck, Heinz-Dieter Hollweg DACH2010, 24.09.2010

Überblick CMIP5 / IPCC-AR5 CMIP5 Infrastruktur IPCC-AR5 Qualitätskontrollen Martina Stockhause et al. DACH2010 24.09.2010 2 / 20

CMIP5 / IPCC-AR5 Martina Stockhause et al. DACH2010 24.09.2010 3 / 20

CMIP5 / IPCC-AR5 in Zahlen Coupled Model Intercomparison Project (CMIP5) Teilnehmer: ca. 20 teilnehmende Modellierungszentren mit ca. 40 Modellkonfigurationen (i.W. versch. Auflösungen) Experimente: 60 Experimente mit t.w. mehreren Realisationen (Ensemble) über ca. 90 000 Modelljahre ca. 2 Mio. Datensätze von ca. 400 Experimenten Datenumfang: ca. 10 PByte output, davon ca. 2 PByte requested und ca. 1 PByte replicated : IPCC-AR5 Martina Stockhause et al. DACH2010 24.09.2010 4 / 20

Datenstruktur: Datenformat Verwendete Standards: Format: netcdf3 (selbst-beschreibend) Climate and Forecast (CF): Konvention zur Beschreibung von wiss. Parametern gridspec: Konvention zu Gitterdefinitionen Controlled Vocabulary (CMIP5): DRS (Data Reference Syntax) + digital Identifier für die File-Identifizierung CMOR2: Tool zum Eintrag/Kontrolle in Datenheadern Martina Stockhause et al. DACH2010 24.09.2010 5 / 20

Data Reference Syntax (DRS): Datenstruktur: DRS Data Reference Syntax (DRS): Bsp.: CMIP5.output.MPI-M.ECHAM6-MPIOM-LR.rcp45.mon.atmos.v1.tas.r1i1p1. tas_Amon_ECHAM6-MPIOM-LR_rcp45_r1i1p1.nc Martina Stockhause et al. DACH2010 24.09.2010 6 / 20

CMIP5 Infrastruktur Martina Stockhause et al. 24.09.2010 DACH2010 7 / 20

CMIP5 Infrastruktur: Earth System Grid Federation (ESGF) ESGF Partner - PCMDI, BADC, DKRZ : ESG Gateway Daten-Replikation des IPCC-AR5-Subsets der CMIP5-Daten Verteilte Qualitätskontrollen der Daten für Level 2 ESGF Martina Stockhause et al. DACH2010 24.09.2010 8 / 20

CMIP5 Infrastruktur: Earth System Grid Federation (ESGF) Aufgaben der ESGF-Partner: PCMDI: BADC: WDCC / DKRZ: Daten- und Sicherheits- Infrastruktur ESG Metadaten-Infrastruktur METAFOR / CIM Qualitätskontrollen und Datenpublikation (STD-DOI) Martina Stockhause et al. DACH2010 24.09.2010 9 / 20

CMIP5 Qualitätskontrollen Martina Stockhause et al. DACH2010 24.09.2010 10 / 20

Qualitätskontrollen: Überblick Statistical or Record Checks of Data STD-DOI: Double Check of Data and Metadata / Author Approval Scientific Control of Questionnaire Input Martina Stockhause et al. DACH2010 24.09.2010 11 / 20

Qualitätskontrolle: QC Level 1 QC Level 1 (automated conformance checks passed): CMOR2 checks: ESG Publisher checks: Metadata checks: DRS syntax check Axis checks Variable checks (CF standard name, unit) cross-check of file name vs. netcdf header File readable and of size>0 bytes axis and variables recognizable time is monotonic, calendar recognizable METAFOR / CIM conformance (technical validity of questionnaire entries) Martina Stockhause et al. DACH2010 24.09.2010 12 / 20 12 / 16 12 / 16

Qualitätskontrolle: Level 2 File System Data Node Metadata THREDDS Data Server MD on data Metafor / CIM Questionnaire MD on model+simulation Data in prescribed DRS Syntax MD Quality Checks L2 Data Quality Checks L2 QC DB Quality MD Data MD Information MD Metadata Repository Martina Stockhause et al. DACH2010 24.09.2010 13 / 20

Qualitätskontrolle: QC Level 2 QC Level 2 (subjective quality control passed): Performed on IPCC-AR5 subset of CMIP5 data at all ESGF partners Data checks: Check of statistical global values and additional DRS checks Record checks against predefined thresholds for data unchecked by 1. Subjective metadata control by scientist Metadata checks: Martina Stockhause et al. DACH2010 24.09.2010 14 / 20

Qualitätskontrolle: QC Level 2 Daten QC level 2 checks on data (statistical checks): Files Check against table with CMIP5 requirements: - name - unit - cf standard name - field dimensions Time Values Check: - time step ≥ 0 - no identical time points Variables Checks on global time series: statistical values: average, standard deviation, minimum, maximum - check for constant fields and filling value fields - check for runaway points Martina Stockhause et al. DACH2010 24.09.2010 15 / 20

Qualitätskontrolle: L3/STD-DOI Publication DOI Target Page access to data and metadata TIB:DOI Registration Agency STD-DOI MD Information MD STD-DOI Catalogue Filesystem Data Longterm Archive Data Node Metadata QC DB THREDDS Data Server MD on data Metafor / CIM MD on model+simulation +data+quality Quality MD Data MD Information MD Data Quality Checks L3 double checks, cross checks, author approval WDCC:DOI Publication Agency Martina Stockhause et al. DACH2010 24.09.2010 16 / 20

Qualitätskontrolle: QC Level 3 / STD-DOI QC Level 3 (approved by author): Subjective controls (double checks) of data and metadata Author check and approval of data and metadata STD-DOI publication of data: persistent identifiers DOI/URN assigned to persistent data as citation direction E.g. doi:10.1594/WDCC/CMIP5_MXELr4 Martina Stockhause et al. DACH2010 24.09.2010 17 / 20

Zusammenfassung CMIP5 Infrastruktur: Verteilte Datenhaltung in Grid Infrastruktur (ESG) Detaillierte Metadaten (Metafor – CIM) über Modelle, Simulationen und Qualität. Qualitätschecks (Level 1 bis 3) mit Einfluss auf die Zugriffsrechte Durchführung durch die drei ESGF-Partner: PCMDI, BADC, WDCC/DKRZ; Level 3 nur am WDCC Am Ende der Qualitätschecks steht die Datenpublikation nach STD- DOI (dataCite), die eine Zitiervorschrift für die Daten liefert. Metadaten des Questionnaires, aus den Datenheadern und aus den Qualitätskontrollen werden bei der STD-DOI Publikation zusammengeführt. CMIP5 Qualitätskontrollen: Martina Stockhause et al. DACH2010 24.09.2010 18 / 20

WDCC Metadata Concept Relational DB RDF XML WDCC GUI SIMULA- TION ACCESS TOPIC ENTRY MODEL PLAT- FORM WDCC GUI Scientific Portal (e.g. IS-ENES) CERA2 Data Model Information Model performant easy-to-use complete flexible 19 / 20

http://www.wdc-climate.de http://cmip-pcmdi.llnl.gov/cmip5/ http://www.wdc-climate.de http://cmip-pcmdi.llnl.gov/cmip5/ Martina Stockhause et al. DACH2010 24.09.2010 20 / 20

Technische Infrastruktur: Earth System Grid Federation (ESGF) BADC DKRZ PCMDI ESGF Partner: PCMDI, BADC, DKRZ ESG Gateway Replikation des IPCC-AR5 Subsets der CMIP5-Daten Martina Stockhause et al. DACH2010 24.09.2010

Technische Infrastruktur: Earth System Grid Federation (ESGF) Qualitätskontrolle: Workflow STD-DOI Publication 22 / 20