Technische Implementation von CERA

Slides:



Advertisements
Ähnliche Präsentationen
Grenzen Kerzen 2004.
Advertisements

Service Oriented Architectures for Remote Instrumentation
E-Solutions mySchoeller.com for Felix Schoeller Imaging
Energy Supply in the Region Ulm / Neu-Ulm
DEUTSCHE INITIATIVE FÜR NETZWERKINFORMATION E.V. DINI Zertifikat 2007 Frank Scholze Universitätsbibliothek Stuttgart Erfahrungsaustausch DINI-zertifizierter.
Forschungsdatenzentrum der Bundesagentur für Arbeit im Institut für Arbeitsmarkt- und Berufsforschung Two Issues on Remote Data Access.
G20 Sales Order Processing via EDI Overview
An OGC Standards Driven Geodata Online Access for DLRs National Remote Sensing Data Library (NRSDL) Torsten Heinen German Remote Sensing Data Center (DLR/DFD)
Prof. Dr. HildebrandtFunktionale Darstellungen 1 Darstellung der Zusammenhänge Verbal Grafisch Algebraisch Minimiere die Kosten im Rahmen deiner Möglichkeiten.
Fakultät für informatik informatik 12 technische universität dortmund Optimizations Peter Marwedel TU Dortmund Informatik 12 Germany 2009/01/17 Graphics:
Peter Marwedel TU Dortmund, Informatik 12
Telling Time in German Deutsch 1 Part 1 Time in German There are two ways to tell time in German. There are two ways to tell time in German. Standard.
Who Wants to be a Millionaire
Regional Support in the context of LCG/EGEE
Installation des Add-In SOLVERSTAT
Lancing: What is the future? Lutz Heinemann Profil Institute for Clinical Research, San Diego, US Profil Institut für Stoffwechselforschung, Neuss Science.
GSI GSI Status Juni 2005 Michael Dahlinger, IT 14/6/2005.
virtPresenter „lecture recording framework“
Institut für Umweltphysik/Fernerkundung Physik/Elektrotechnik Fachbereich 1 SADDU June 2008 S. Noël, K.Bramstedt,
Institut für Umweltphysik/Fernerkundung Physik/Elektrotechnik Fachbereich 1 Pointing Meeting Nov 2006 S. Noël IFE/IUP Elevation and Azimuth Jumps during.
M A X - P L A N C K - G E S E L L S C H A F T Bericht des Partnerinstituts Sabine Krott 1.0 Pilotentreffen im Harnack-Haus, 8. Juni 2006 Distribution:
Institut für Meteorologie und Klimatologie Universität Hannover Solare Strahlung – Stand und Perspektiven ihrer Erforschung Gunther Seckmeyer Short Notice.
Institut AIFB, Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825 Towards Automatic Composition of Processes based on Semantic.
| DC-IAP/SVC3 | © Bosch Rexroth Pneumatics GmbH This document, as well as the data, specifications and other information set forth in.
Vergleich der verschiedenen kommerziellen Datenbanksysteme
3rd Review, Vienna, 16th of April 1999 SIT-MOON ESPRIT Project Nr Siemens AG Österreich Robotiker Technische Universität Wien Politecnico di Milano.
The German verb werden has many uses: Full verb (to become) Futur Passive voice Konjunktiv.
1 Ein kurzer Sprung in die tiefe Vergangenheit der Erde.
Ich möchte ein Eisberg sein. Last time … 3 icebergs Triangels Unique connections Ich möchte ein Eisberg sein
Christoph Durt: Wittgenstein on the possibility of philosophy: The importance of an intercultural approach
The free XML Editor for Windows COOKTOP Semistrukturierte Daten 1 Vortrag Semistrukturierte Daten 1 COOKTOP The free XML-Editor for Windows
Übungsaufgabe, Permissions, ACLs
Deutsch 1 G Stunde. Donnerstag, der 25. Oktober 2012 Deutsch 1, G Stunde Heute ist ein B- Tag Unit: Family & homeFamilie & Zuhause Objectives: Phrases.
Deutsch 1 G Stunde. Donnerstag, der 18. Oktober 2012 Deutsch 1, G Stunde Heute ist ein E- Tag Unit: Family & homeFamilie & Zuhause Objectives: Phrases.
G Stunde DEUTSCH 1. Unit: Family & homeFamilie & Zuhause Objectives: Phrases about date, weather and time-telling Alphabet – pronunciation and words The.
Frank Fischer + Bernhard Frank Microsoft Deutschland GmbH.
You need to use your mouse to see this presentation © Heidi Behrens.
Department of Computer Science Homepage HTML Preprocessor Perl Database Revision Control System © 1998, Leonhard Jaschke, Institut für Wissenschaftliches.
Heute nach der Stunde kannst du: verstehen, was junge Deutsche in der Freizeit machen. sagen, was DU in der Freizeit machst. die Namen der Städte der.
Algorithm Engineering Parallele Algorithmen Stefan Edelkamp.
SIT-MOON ESPRIT Project Nr st Review, Brussels, 27th of April 1998 slide 1 Siemens AG Österreich Robotiker Technische Universität Wien Politecnico.
Template v5 October 12, Copyright © Infor. All Rights Reserved.
Ein Projekt des Technischen Jugendfreizeit- und Bildungsvereins (tjfbv) e.V. kommunizieren.de Blended Learning for people with disabilities.
CERA Eine Oracle Datenbank in der Klimaforschung
Special Profile Demonstration
Design Patterns Ein Muster (pattern) ist eine Idee, die sich in einem praktischen Kontext als nützlich erwiesen hat und dies auch in anderen sein wird.
External Labels – The rules For all external labels the following rules apply (external labels are all labels which are not inside of a shape) - all labels.
By: Jade Bowerman. German numbers are quite a bit like our own. You start with one through ten and then you add 20, 30, 40 or 50 to them. For time you.
3rd Review, Vienna, 16th of April 1999 SIT-MOON ESPRIT Project Nr Siemens AG Österreich Robotiker Technische Universität Wien Politecnico di Milano.
Berner Fachhochschule Hochschule für Agrar-, Forst- und Lebensmittelwissenschaften HAFL 95% der Ammoniakemissionen aus der Landwirtschaft Rindvieh Pflanzenbau.
Relativpronomen / Relativsätze:
What comes to your mind when you think about WATERFALLS?
Ich sass und las eines Abends I sat and read one evening aus dem wachsenden Buch meines Lebens. Out of the growing book of my life. Es war eine Geschichte,
Technische Implementation von CERA Hannes Thiemann Max-Planck-Institut für Meteorologie Modelle und Daten zmaw.de Jena, 24. Januar 2007.
Qualitätskontrolle der IPCC-AR5 Daten
Michael Lautenschlager World Data Center for Climate
M. Lautenschlager (M&D/MPIM) / / 1 WDC Konsortium Meeting Oberpfaffenhofen, 24/ )CERA-DB 2)WDCC Homepage 3)DLR EOWEB Zugang 4)Kostenmodell.
Ciiema CITEM - Dr. Siegl VU Dr. Manfred Siegl ENTWURF, ERRICHTUNG, BETRIEB VON DATENNETZEN VU Dr. Manfred Siegl
Sentence Structure Subject and verb are always together. Subject and verb are always together. Subject and verb must agree Subject and verb must agree.
German Word Order explained!
DEUTSCHE VERBEN I. REGULAR VERBS.
1 Intern | ST-IN/PRM-EU | | © Robert Bosch GmbH Alle Rechte vorbehalten, auch bzgl. jeder Verfügung, Verwertung, Reproduktion, Bearbeitung,
Launch ON Global.vi System ID object name classname Services to suscribe Observer Control Ref vi-path Service name Step 1 : Objects register to the Global.vi´s,
Technische Universität München Visual Presentations Hints for media usage.
How to use and facilitate an OptionFinder Audience Response System.
TUM in CrossGrid Role and Contribution Fakultät für Informatik der Technischen Universität München Informatik X: Rechnertechnik und Rechnerorganisation.
Instrumente und Unterhaltung End of Unit Assessment.
Travel with NASA from the biggest to the smallest distance of the universe.
Kölner Dom Cologne Cathedral (Kölner Dom) is a Roman Catholic church in Cologne, Germany. It is the seat of the Archbishop of Cologne and the administration.
"MANUELLE" PHYSICAL STANDBY SYSTEME FÜR STANDARD EDITION UNTER RAC.
 Präsentation transkript:

Technische Implementation von CERA Hannes Thiemann Max-Planck-Institut für Meteorologie Modelle und Daten hannes.thiemann @ zmaw.de ULDB Wiesbaden, 28. Mai 2008

Inhalt Aufgabe und Motivation Umsetzung Datenbanken Anbindung an das HSM Ausblick

Klimasystem

Klimamodell: Grid

Klimamodell: Auflösung T42 (300 km) T106 (120 km)

Horizontalauflösung des Klimamodells Datenmengen Horizontalauflösung des Klimamodells T42: 128 * 64 = 8192 Punkte pro Globalfeld T106: 160 * 320 = 51200 Punkte pro Globalfeld Erforderliche Speichereinheiten (GRIB Format) Horizontalfeld (Zugriffseinheit): 17.1 kB (T42) / 100.1 kB (T106) Unix Filegröße für monatsweise akkumulierte Ergebnisse mit 6 Std. Speicherintervall und 300 2d Variablen (Physikalische Einheit): 616 MB (T42) / 3500 MB (T106) 240 Jahre Modellintegration (Logische Einheit): 1.7 TB (T42) / 10 TB (T106)

Umsetzung Datenbanken

WDCC's CERA DB has been identified as the largest Linux DB. The Winter TopTen Program identifies the world’s largest and most heavily used databases. ….. Congratulations on achieving Grand Prize award winner status (1) in Database Size, Other, All and TopTen Winner status Database Size, Other, Linux;Workload, Other, Linux in Winter Corp.'s 2005 TopTen Program! ....... (1) Grand prizes are  awarded for first place winners in the All Environments categories only. WDCC's CERA DB has been identified as the largest Linux DB.

Wintercorp (2005) - DB Size: Scientific, Archive, and other Company Size (TB) DBMS Platform System Vendor Max-Planck 222 Oracle Federated/SMP NEC USGS/EROS 17 Centralized/SMP Sun HP 1 NonStop SQL Centralized/MPP T-Systems Oracle RAC Centralized/Cluster See: www.wintercorp.com

Wintercorp (2005) - DB Size: Data Warehouse Company Size (TB) DBMS Platform System Vendor Yahoo 100 Oracle Centralized/SMP Fujitsu Siemens AT&T 1) 94 Daytona Federated/SMP HP KT IT-Group 50 DB2 Centralized/Cluster IBM LGR 25 Amazon Oracle RAC 1) 330 GB Norm. Data Volume See: www.wintercorp.com

Oracle 9.2 single instance running on TX7 CERA: Some Facts Oracle 9.2 single instance running on TX7 Enterprise Edition Partitioning Option Advanced Security 24 Tbyte disk attached to database nodes Database size ~450 Tbyte Database nodes connected to HSM system Data accessible on the internet 800 named users worldwide Daily access 800 GB/Day (average) New data 400 GB/Day (average)

Datenbanken: Aufteilung OID 1 2 31 4 9 10 Metadaten Daten Enterprise User Security

100.000 Tabellen 800 GB Entry Reference Status Distribution Contact Coverage Parameter Spatial Local Adm. Data Access Data Org 100.000 Tabellen 800 GB Ca. 100.000 Tabellen Ca. 800 GB

Structure of metadata tables 100.000 Tabellen 800 GB Informationen um Einfache Anfragen ohne Zugriff auf Daten selbst zu beantworten. Konsistenz zu den Daten selbst überprüfen zu können. Qualitätskontrollen durchzuführen. Liegen auf Disk

Wichtige Datenbankfeatures Nologging : Reduktion der Redo-Log Informationen => Gegenwärtig ca. 5 GB/day pro Datenbankinstanz Partitioning Read Only Tablespaces => Verringerung des Backup Nicht verwendet: Komprimierung in der Datenbank => Verwendete Datenformate sind bereits hochkomprimierend

Backup 3 Typen: “reguläre” Datenbankdateien mit konventionellem Datenbankbackup , kein „nologging“. Datenbankdateien mit „nologging“ geschrieben. Backup auf Tape nach „read only“ setzen. Datenbankdateien mit nologging geschrieben. Noch „read write“ und daher keine Sicherung. Daten müßen nach Korruption neu eingefüllt werden.

Range Partitioning Table Partition 1 Partition 2 Partition n … Structure of blob tables Range Partitioning Table Partition 1 Partition 2 Partition n … Datafile 1 Datafile 2 Datafile n … blob_id 1 .. n blob_id n+1 .. m blob_id m+1 .. k … Time t0 .. tn Time tn+1 .. tm Time tm+1 .. tk … BLOB Data Table blob_id blob_data

Umsetzung: HSM Anbindung an das HSM

All tablespaces are moved “at once” to dxdb Migout Migin TBS - RW Tbl Partition 1 dxdb TBS - RO Tbl Partition 1 All tablespaces are moved “at once” to dxdb TBS - RW Tbl Partition 2

Migout takes place after files haven’t been modified for x minutes Migout / Migin Migout takes place after files haven’t been modified for x minutes Only one migout process per dxdb-filesystem Migin takes place immediately after a file is requested. Only parts accessed are retrieved from the backend storage. One migin process per requested file.

Purging dxdb HWM LWM

Except: “small” datafiles can stay on disk Criteria for purging Size of datafiles doesn’t matter Except: “small” datafiles can stay on disk Time not modified (easy for read only tablespaces) Time not touched Oracle has the tendency to touch data files quite often Oracle parameter read_only_open_delayed could be an option Prerequisite: 2 copies on tape

Inside the datafile Header 128k Primary Key Lob Index Table Blob data

Frontend versus Backend Filesystem Frontend HSM Backend Header 128k Header 128k Part 1 = 512 MB Part 2 = 512 MB

Retrieving data Header 128k 3 1 2 5 4 Tape Request

Usage: Downloads

Statistics: Size

Ausblick: Globalmodell T213 (Atmosphäre) Horizontalauflösung des Klimamodells T213: 640 * 320 = 204800 Punkte pro Globalfeld T106: 160 * 320 = 51200 Punkte pro Globalfeld Erforderliche Speichereinheiten (GRIB Format) Horizontalfeld (Zugriffseinheit): 400.1 kB (T213) / 100.1 kB (T106) Unix Filegröße für monatsweise akkumulierte Ergebnisse mit 6 Std. Speicherintervall und 300 2d Variablen (Physikalische Einheit): 14000MB (T213) / 3500 MB (T106) 240 Jahre Modellintegration (Logische Einheit): 40 TB (T213) / 10 TB (T106)

Ausblick: Regionalmodell Auflösung und Datenmengen REMO-UBA-Modellgebiet Auslösung: 10x10 km Datenmenge: 5 TB / 100 Jahre (nur Bodenfelder) Orography

Vielen Dank!