Technische Implementation von CERA Hannes Thiemann Max-Planck-Institut für Meteorologie Modelle und Daten zmaw.de Jena, 24. Januar 2007.

Slides:



Advertisements
Ähnliche Präsentationen
Cadastre for the 21st Century – The German Way
Advertisements

Service Oriented Architectures for Remote Instrumentation
E-Solutions mySchoeller.com for Felix Schoeller Imaging
Service Discovery in Home Environments
DEUTSCHE INITIATIVE FÜR NETZWERKINFORMATION E.V. DINI Zertifikat 2007 Frank Scholze Universitätsbibliothek Stuttgart Erfahrungsaustausch DINI-zertifizierter.
IndraMotion MLC RoCo Electric Drives and Controls
Forschungsdatenzentrum der Bundesagentur für Arbeit im Institut für Arbeitsmarkt- und Berufsforschung Two Issues on Remote Data Access.
R. Zankl – Ch. Oelschlegel – M. Schüler – M. Karg – H. Obermayer R. Gottanka – F. Rösch – P. Keidler – A. Spangler th Expert Meeting Business.
G21Billing Document Outbound via EDI Overview
G20 Sales Order Processing via EDI Overview
Windows Vista für Entwickler
An OGC Standards Driven Geodata Online Access for DLRs National Remote Sensing Data Library (NRSDL) Torsten Heinen German Remote Sensing Data Center (DLR/DFD)
1 | R. Steinbrecher | IMK-IFU | KIT – die Kooperation von Forschungszentrum Karlsruhe GmbH und Universität Karlsruhe (TH) Natural Sources SNAP11.
Prof. Dr. HildebrandtFunktionale Darstellungen 1 Darstellung der Zusammenhänge Verbal Grafisch Algebraisch Minimiere die Kosten im Rahmen deiner Möglichkeiten.
Dr. M. Schlottke Common Description of Web Services Source: P. Gerbert, 2002 Web Services allow to establish B2B e-commerce on the fly Web Services allow.
Fakultät für informatik informatik 12 technische universität dortmund Optimizations Peter Marwedel TU Dortmund Informatik 12 Germany 2009/01/17 Graphics:
Peter Marwedel TU Dortmund, Informatik 12
Lehrstuhl Informatik III: Datenbanksysteme Andreas Scholz 1 Programming Database Web Applications Web Service Technologies Andreas Scholz.
Regional Support in the context of LCG/EGEE
Installation des Add-In SOLVERSTAT
Institut für Verkehrsführung und Fahrzeugsteuerung > Technologien aus Luft- und Raumfahrt für Straße und Schiene Automatic Maneuver Recognition in the.
Thomas Herrmann Software - Ergonomie bei interaktiven Medien Step 6: Ein/ Ausgabe Instrumente (Device-based controls) Trackball. Joystick.
Institut für Wasserbau Stuttgart Geodätisches Institut Stuttgart Institut für Meteorologie und Klimaforschung IMK-IFU SPP 1257 DIRECT WATERBALANCE An interdisciplinary.
Methods Fuzzy- Logic enables the modeling of rule based knowledge by the use of fuzzy criteria instead of exact measurement values or threshold values.
virtPresenter „lecture recording framework“
Institut für Umweltphysik/Fernerkundung Physik/Elektrotechnik Fachbereich 1 Pointing Meeting Nov 2006 S. Noël IFE/IUP Elevation and Azimuth Jumps during.
Institut AIFB, Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825 Towards Automatic Composition of Processes based on Semantic.
Sanjay Patil Standards Architect – SAP AG April 2008
| DC-IAP/SVC3 | © Bosch Rexroth Pneumatics GmbH This document, as well as the data, specifications and other information set forth in.
Vergleich der verschiedenen kommerziellen Datenbanksysteme
Centre for Public Administration Research E-Government for European Cities Thomas Prorok
3rd Review, Vienna, 16th of April 1999 SIT-MOON ESPRIT Project Nr Siemens AG Österreich Robotiker Technische Universität Wien Politecnico di Milano.
Ich möchte ein Eisberg sein. Last time … 3 icebergs Triangels Unique connections Ich möchte ein Eisberg sein
Übungsaufgabe, Permissions, ACLs
Developer Day Webseiten auf Windows Azure hosten Britta Labud bbv Software Services AG Roland Krummenacher bbv Software Services AG.
Neno Loje Berater & MVP für Visual Studio ALM und TFS (ehemals VSTS) Hochqualitative Produkte mit Visual Studio & TFS 2010.
Frank Fischer + Bernhard Frank Microsoft Deutschland GmbH.
3/28/2017 8:11 PM Visual Studio Tools für Office { Rapid Application Development für Office } Jens Häupel Platform Strategy Manager Microsoft Deutschland.
Department of Computer Science Homepage HTML Preprocessor Perl Database Revision Control System © 1998, Leonhard Jaschke, Institut für Wissenschaftliches.
Ministerium für Umwelt und Naturschutz, Landwirtschaft und Verbraucherschutz des Landes Nordrhein-Westfalen Modelling of the carbon accumulation in beech.
XML IV: Cocoon 2.
Algorithm Engineering Parallele Algorithmen Stefan Edelkamp.
SIT-MOON ESPRIT Project Nr st Review, Brussels, 27th of April 1998 slide 1 Siemens AG Österreich Robotiker Technische Universität Wien Politecnico.
Impairments in Polarization-Multiplexed DWDM Channels due to Cross- Polarization Modulation Marcus Winter Christian-Alexander Bunge Klaus Petermann Hochfrequenztechnik-Photonik.
4th Symposium on Lidar Atmospheric Applications
Ein Projekt des Technischen Jugendfreizeit- und Bildungsvereins (tjfbv) e.V. kommunizieren.de Blended Learning for people with disabilities.
CERA Eine Oracle Datenbank in der Klimaforschung
Special Profile Demonstration
Design Patterns Ein Muster (pattern) ist eine Idee, die sich in einem praktischen Kontext als nützlich erwiesen hat und dies auch in anderen sein wird.
External Labels – The rules For all external labels the following rules apply (external labels are all labels which are not inside of a shape) - all labels.
By: Jade Bowerman. German numbers are quite a bit like our own. You start with one through ten and then you add 20, 30, 40 or 50 to them. For time you.
3rd Review, Vienna, 16th of April 1999 SIT-MOON ESPRIT Project Nr Siemens AG Österreich Robotiker Technische Universität Wien Politecnico di Milano.
3rd Review, Vienna, 16th of April 1999 SIT-MOON ESPRIT Project Nr Siemens AG Österreich Robotiker Technische Universität Wien Politecnico di Milano.
Berner Fachhochschule Hochschule für Agrar-, Forst- und Lebensmittelwissenschaften HAFL 95% der Ammoniakemissionen aus der Landwirtschaft Rindvieh Pflanzenbau.
Qualitätskontrolle der IPCC-AR5 Daten
Technische Implementation von CERA
Michael Lautenschlager World Data Center for Climate
M. Lautenschlager (M&D/MPIM) / / 1 WDC Konsortium Meeting Oberpfaffenhofen, 24/ )CERA-DB 2)WDCC Homepage 3)DLR EOWEB Zugang 4)Kostenmodell.
Ciiema CITEM - Dr. Siegl VU Dr. Manfred Siegl ENTWURF, ERRICHTUNG, BETRIEB VON DATENNETZEN VU Dr. Manfred Siegl
1 Intern | ST-IN/PRM-EU | | © Robert Bosch GmbH Alle Rechte vorbehalten, auch bzgl. jeder Verfügung, Verwertung, Reproduktion, Bearbeitung,
Launch ON Global.vi System ID object name classname Services to suscribe Observer Control Ref vi-path Service name Step 1 : Objects register to the Global.vi´s,
1 Stevens Direct Scaling Methods and the Uniqueness Problem: Empirical Evaluation of an Axiom fundamental to Interval Scale Level.
Lehrstuhl für Waldbau, Technische Universität MünchenBudapest, 10./11. December 2006 WP 1 Status (TUM) Bernhard Felbermeier.
How to use and facilitate an OptionFinder Audience Response System.
Technische Universität München 1 CADUI' June FUNDP Namur G B I The FUSE-System: an Integrated User Interface Design Environment Frank Lonczewski.
TUM in CrossGrid Role and Contribution Fakultät für Informatik der Technischen Universität München Informatik X: Rechnertechnik und Rechnerorganisation.
Instrumente und Unterhaltung End of Unit Assessment.
Travel with NASA from the biggest to the smallest distance of the universe.
Institut für Nachrichtentechnik U. Reimers Technische Universität Braunschweig The MultiMedia Home Platform (MHP): Hype or Reality ?
Computer Services Business challenge
 Präsentation transkript:

Technische Implementation von CERA Hannes Thiemann Max-Planck-Institut für Meteorologie Modelle und Daten zmaw.de Jena, 24. Januar 2007

Inhalt Aufgabe und Motivation Umsetzung Datenbanken Anbindung an das HSM Ausblick

Klimasystem

Klimamodell: Grid

Klimamodell: Auflösung T42 (300 km) T106 (120 km)

Datenmengen Horizontalauflösung des Klimamodells T42: 128 * 64 = 8192 Punkte pro Globalfeld T106: 160 * 320 = Punkte pro Globalfeld Erforderliche Speichereinheiten (GRIB Format) Horizontalfeld (Zugriffseinheit): 17.1 kB (T42) / kB (T106) Unix Filegröße für monatsweise akkumulierte Ergebnisse mit 6 Std. Speicherintervall und 300 2d Variablen (Physikalische Einheit): 616 MB (T42) / 3500 MB (T106) 240 Jahre Modellintegration (Logische Einheit): 1.7 TB (T42) / 10 TB (T106)

Umsetzung Datenbanken

The Winter TopTen Program identifies the worlds largest and most heavily used databases. ….. Congratulations on achieving Grand Prize award winner status (1) in Database Size, Other, All and TopTen Winner status Database Size, Other, Linux;Workload, Other, Linux in Winter Corp.'s 2005 TopTen Program! (1) Grand prizes are awarded for first place winners in the All Environments categories only. WDCC's CERA DB has been identified as the largest Linux DB.

Wintercorp (2005) - DB Size: Scientific, Archive, and other CompanySize (TB) DBMSPlatformSystem Vendor Max-Planck222OracleFederated/SMPNEC USGS/EROS17OracleCentralized/SMPSun USGS/EROS17OracleCentralized/SMPSun HP1NonStop SQLCentralized/MPPHP T-Systems1Oracle RACCentralized/ClusterSun See:

Wintercorp (2005) - DB Size: Data Warehouse CompanySize (TB) DBMSPlatformSystem Vendor Yahoo100OracleCentralized/SMPFujitsu Siemens AT&T 1) 94DaytonaFederated/SMPHP KT IT-Group50DB2Centralized/ClusterIBM LGR25OracleCentralized/SMPHP Amazon25Oracle RACCentralized/ClusterHP See: 1) 330 GB Norm. Data Volume

Oracle 9.2 single instance running on TX7 Enterprise Edition Partitioning Option Advanced Security 24 Tbyte disk attached to database nodes Database size ~260 Tbyte (logical) Database nodes connected to HSM system Data accessible on the internet 800 named users worldwide Daily access 300 GB/Day (average) New data 250 GB/Day (average) CERA: Some Facts

BLOB SX-6 AsAmA 16way AsAmA 4way DXSMDXDB Oracle DB DiskXtender Disk cache Post processing System raw META + Data GFS Environment GFS/ Server AsAmA 4way DXDB... Oracle DB AsAmA 16way GE Network Users GFS/Server DXSN BLOB DXDM Climate Model 1.Climate Model writes raw output (GFS I/O) AP GFS/ Client Post Process Application 2.PP reads raw data (GFS I/O) PP writes data (local I/O) AP OCI Application 3.OCI reads data (Local I/O) AP Local disk Migration & Staging Oracle Application Server 5.Data inquiry (OCI) Oracle AS © NEC Corporation 4.OCI writes BLOB (via networks) Oracle Instance

Level 1 - Interface: Metadata entries (XML, ASCII) + Data Files Level 2 – Interf.: Separate files containing BLOB table data in application adapted structure (time series of single variables) Experiment Description Pointer to Unix-Files Dataset 1 Description Dataset n Description BLOB Data Table BLOB Data Table WDCC Data Topology BLOB DB Table corresponds to scalable, virtual file at the operating system level.

Datenbanken: Aufteilung Metadaten Daten Enterprise User Security OID

Entry Reference Status Distribution Contact Coverage Parameter Spatial Reference Local Adm. Data Access Data Org Tabellen 800 GB

Data matrix of model experiment Model variables Model Run Time 2 D: small BLOBS (16 KB) 3 D: large BLOBS (3 MB) Raw data file: direct model output (0.7 – 16.2 GB) Each columm is one BLOB Table and one META Table in CERA-DB Raw data file inDKRZ Archive

Metadata Table Blob_id Blob_size Start_date Blob_min Blob_max Blob_mean Structure of metadata tables Informationen um Einfache Anfragen ohne Zugriff auf Daten selbst zu beantworten. Konsistenz zu den Daten selbst überprüfen zu können. Qualitätskontrollen durchzuführen. Liegen auf Disk Metadaten erlauben die Abbildung der blob_id auf die wirkliche Modellzeit

BLOB Data Table blob_id blob_data Structure of blob tables Range Partitioning Table Partition 1 Table Partition 2 Table Partition n … blob_id 1.. n blob_id n+1.. m blob_id m+1.. k … Time t 0.. t n Time t n+1.. t m Time t m+1.. t k … Datafile 1 Datafile 2 Datafile n …

Umsetzung: HSM Anbindung an das HSM

TBS - RW Tbl Partition 1 TBS - RW Tbl Partition 2 dxdb TBS - RO Tbl Partition 1 All tablespaces are moved at once to dxdb MigoutMigin

Migout / Migin Migout takes place after files havent been modified for x minutes Only one migout process per dxdb-filesystem Migin takes place immediately after a file is requested. Only parts accessed are retrieved from the backend storage. One migin process per requested file.

dxdb LWM HWM Purging

Criteria for purging Size of datafiles doesnt matter Except: small datafiles can stay on disk Time not modified (easy for read only tablespaces) Time not touched Oracle has the tendency to touch data files quite often Oracle parameter read_only_open_delayed could be an option Prerequisite: 2 copies on tape

Inside the datafile Primary Key Lob Index Table Blob data Header 128k

Frontend versus Backend Header 128k Filesystem FrontendHSM Backend Header 128k Part 1 = 512 MB Part 2 = 512 MB

Retrieving data 4 Header 128k Tape Request

Usage: Downloads

Statistics: Size

Ausblick: Globalmodell T213 (Atmosphäre) Horizontalauflösung des Klimamodells T213: 640 * 320 = Punkte pro Globalfeld T106: 160 * 320 = Punkte pro Globalfeld Erforderliche Speichereinheiten (GRIB Format) Horizontalfeld (Zugriffseinheit): kB (T213) / kB (T106) Unix Filegröße für monatsweise akkumulierte Ergebnisse mit 6 Std. Speicherintervall und 300 2d Variablen (Physikalische Einheit): 14000MB (T213) / 3500 MB (T106) 240 Jahre Modellintegration (Logische Einheit): 40 TB (T213) / 10 TB (T106)

Ausblick: Regionalmodell Auflösung und Datenmengen REMO-UBA-Modellgebiet Orography Auslösung: 10x10 km Datenmenge: 5 TB / 100 Jahre (nur Bodenfelder)

Vielen Dank!