Workflow - Diagnosetool -

Slides:



Advertisements
Ähnliche Präsentationen
Software Assurance Erweiterte Software Assurance Services
Advertisements

MIRAKEL Die Klimadatenbank des DWD
Inhaltlich orientierter Zugriff auf unstrukturierte Daten
Literaturverwaltung und Wissensorganisation
Konzeption und Realisierung eines Text- Analysesystems zur Automatisierung der Bewerberauswahl von diesem Datenformat jede beliebige Anwendung adaptieren.
Universität Stuttgart Institut für Kernenergetik und Energiesysteme LE 3.2- LM 8 - LO 9 Definitionen zu LM 8.
3.Februar 2003 SFB Seminar Kiel1 Energie- und Wasserdampftransporte in die Arktis bestimmt aus Radiosondendaten Andreas Hense, Reinhardt Hagenbrock,Martin.
Statistical-dynamical methods for scale dependent model evaluation and short term precipitation forecasting (STAMPF / FU-Berlin) Zielsetzung von STAMPF:
Modellvergleich.
Daten sichern und archivieren
Einführung in die Klimatologie
Einführung in die Klimamodellierung
Informationen ü ber den Umbau des Schulnetzes Aufgrund der Umstellung unseres Schulnetzes auf ein neues Serversystem wird Ende Juni 2010 der Zugriff auf.
Gruppe 1 Janka Bossert Sven Hilz Jan Nathem
Herzlich willkommen beim 1. Workshop der AG Methodik
Methodenmodul MT1 im WS 2008/2009
Ausblick: Rekonstruktionen und Szenarien Hans von Storch Institut für Küstenforschung GKSS Forschungszentrum Coastdat Workshop, Hamburg, 5-6 Oktober 2006.
Präsentation zum Seminarprojekt Statistik mit R Name WS 2011/12.
Präsentation zum Seminarprojekt Korpuslinguistik Name WS 2011/12.
Wolfgang Plum – InfoWeb Weiterbildung
PIGGIWIN® Version 2.0 Verband Deutscher Oelmühlen e.V.
ECMWF Analysen am DKRZ Was sind Analysen? Uwe Ulbrich, Universität zu Köln - Synoptische Stationsdaten - Radiosonden - Flugzeug-Messdaten - Bojen - Satellitendaten:
Entitäten Extraktion Wichtige Schritte Petra Maier WS 05/06.
Online-Befragung Themen: 1. Vor- und Nachteile 2. Voraussetzungen
Datagrid in Earth System Sciences (DGESS) - Status und Projektplan - Projektreffen am Max-Planck-Institut für Meteorologie Heinrich Widmann 28. November.
Datagrid in Earth System Sciences (DGESS) - Integration und Erweiterungen - Projektreffen am Max-Planck-Institut für Meteorologie Heinrich Widmann 28.
Crystal Reports 2008.
GlobalStorehouseGlobalStorehouse Institut für Modellbildung und Simulation IMS Bemerkung: Mit diesem "MB" und "WBM" lässt sich der ganze Zyklus abdecken.
Vom SAP-IDoc zum Host Die Verarbeitung und Aufbereitung von SAP Daten für die Bereitstellung auf dem HOST. M.Scheeren, Lattwein GmbH, Mai 2011.
Programmieren mit MS Small Basic
MS Excel, Open-/LibreOffice Calc Die Menüs I Office-Logo (Excel2007) bzw. Datei (andere): die Standard-Datei- und Druckoperationen; bei MS Excel hier auch.
Web-HMI einbinden SPS-Technik mit Video, Multimedia und Entertainmentsystemen kombinieren I Peter Steib.
Geo-Informations-Systeme
Maturaarbeit Erstellung von thematischen Karten technisch beschneiter Flächen mit Hilfe von GIS (Marco Steuri, 2002)
DATA WAREHOUSE Oracle Data Warehouse Mit Big Data neue Horizonte für das Data Warehouse ermöglichen Alfred Schlaucher, Detlef Schroeder DATA WAREHOUSE.
Messtechnik und Wellendatenlogger D-KRBA
Chi Quadrat Test Tamara Katschnig.
Ausgangslage Mangelhafte Führungs-kompetenz Schlechtes Betriebsklima
Abschlussvortrag zur Studienarbeit
Aufgabenzettel V Statistik I
Stationsnetz der ZAMG und Wettervorhersagemodelle Paul RAINER, ZAMG Klagenfurt.
Zankena Begriffserklärung.
Universität Zürich Informatikdienste GoKoordinatorenmeeting 27. April UZH Global Storage Projekt.
Adaption von K-Means Algorithmen an Datenbanken
WissGrid AP3: LZA Dienste
FME Server als multidimensionale Rasterdatendrehscheibe
Projekt Sensor: Tools for Environmental, Social and Economic Effects of Multifunctional Land Use in European Regions Plattform Eisenwurzen.
Virtuelle Forschungsumgebungen
CRM TimeLog… TimeLog … Wie gross ist der Anteil der Lohnkosten in Ihrem Unternehmen?
CERA Eine Oracle Datenbank in der Klimaforschung
Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? nestor und Grid Jens Ludwig Baden-Baden, 2.
Bitte username wählen Bitte jetzt Ihre Mail abrufen.
Zauberwort Metadaten Elementares Handwerkszeug des Content- und Wissensmanagement.
Q-Daten Dauer der vorhandenen Zeitreihen. Q-Daten Auftrittszeitpunkt Jahresmaxima.
M&D- Status Seminar Datenanfragen Verfügbare Datensätze Nachfrage zu den Datensätzen Metadaten Benutzer-Anfragen Information/Schulung Probleme To Do Liste.
Konsortialrechnungen: IPCC AR4 Unterstützung durch M&D Antriebsdaten Koppelungsumgebung Modelläufe Datenspeicherung Anpassung von ECHAM 4 MPI-M UBonn.
M. Lautenschlager (M&D/MPIM) / / 1 WDC Konsortium Meeting Oberpfaffenhofen, 24/ )CERA-DB 2)WDCC Homepage 3)DLR EOWEB Zugang 4)Kostenmodell.
Dr. Emanuel Ingenhoven 2010 BVASK und QUALIS ® Dr. Emanuel Ingenhoven 2010 BVASK und QUALIS ®
Webspace Stephan Herbst Christian Köhler. Themen des Vortrages Kurze Einführung ins Thema Kurze Einführung ins Thema Webspace - Was? Wozu? Wo? Wie? Webspace.
Der Begriff Grafik Computergrafik ist die Erstellung und Verarbeitung von Grafiken mit Hilfe eines Computers. Hierzu benötigt man: Eingabegeräte wie zum.
Klimadapt: Interpolation der REMO UBA Daten und Untersuchung von Kühl- und Heizgradtagen mit StartClim Daten Universität für Bodenkultur, Wien Department.
EAS II Features “Für Umsteiger”. FoE Parameter 2.
SGML, die Basis für eine optimierte Produktion von Windows-Online- Hilfen Thomas Bergerhoff, Tanner Dokuments Nürnberg.
EAS II Features “Für Umsteiger”. Überblick 2 Parameter Window Selector Terminal Nullen / Homing Recorder Tuning Wizard EAS II Einstellungen User Code.
BUNDESANSTALT FÜR WASSERBAU Karlsruhe Hamburg Ilmenau BAW - DH / NOKIS Folie-Nr. 1 NOKIS-Workshop 10. und 11. März 2004 FTZ Westküste der CAU Kiel,
Vorstellung einer Projektskizze Bitte beachten Sie zur Erstellung und Einreichung einer Projektskizze die Vorgaben und weiteren Erläuterungen aus der Information:
Präsentationsvorlage für Unternehmer (Sie können diese PPT verwenden und für Ihre Zwecke verändern) Datum, Autor/in, Thema/Thematik usw. „Herausforderungen.
Präsentationsvorlage für politische Entscheidungsträger (Sie können diese PPT verwenden und für Ihre Zwecke verändern) Datum, Autor/in, Thema/Thematik.
Aufgabenstellung  gegeben ist die zeitliche Entwicklung der global gemittelten bodennahen Temperatur im Zeitraum (Dateiname= ytemp2m.obs, ascii-
CMIP6-DICAD – FU Berlin Thomas Schartner
 Präsentation transkript:

Workflow - Diagnosetool - IGMK und ZAIK Universität zu Köln IfM Freie Universität Berlin

Workflow Intention Wissenschaftliche Zielsetzung, die Workflow erfordert: Interpretation und Vergleich von Modellexperimenten und „Beobachtungsdaten“ hinsichtlich bestimmter wiss. Fragestellungen. Dazu Standard-Berechnungen von Parametern für die Basisdaten durch Diagnosetools. Problematik der Workflows - gewöhnlich sehr große Menge an Daten, von der nur ein Teil gebraucht wird. - räumliche Datenverteilung oft unklar (gibt es Kopien, etc) - Zwischenprodukte werden nach Plattenplatz und „Gefühl“ der Bearbeiter aufgehoben. - Anforderungen und Zeit für Workflow-Abarbeitung passen nicht notwendig zu einander – Optimierung auf Basis Erfahrung.

Workflow Intention Vorstellung, wie C3-Ergebnis aussehen könnte - Benutzeroberfläche, die auf Bedürfnisse der Anwender abgestimmt ist, - Automatisierte Erkennung der Verfügbarkeit geeigneter Datensätze (auch: 90%) - Abschätzung der Realisierbarkeit und des Aufwands vor Auftragsvergabe - Automatisierte Abarbeitung, mit Möglichkeit, Replikate / Kopien / Zwischenergebnisse und bestimmte Plattformen zu erzwingen. - Eignung nicht nur für Beispielworkflows, Verfahren verallgemeinerbar!!

Beispiel: Workflow I (Baroklinitätsberechnung) Diagnosecluster Datenfluss am Beispiel eines der Diagnose-Tools (Baroklinität) Beispiel: Workflow I (Baroklinitätsberechnung) Als Berechnungsgrundlage für angegebenen Speicherplatzbedarf dient ein Konsortiallauf des Klimamodells ECHAM5: ECHAM5 A1B 1 Auflösung: horizontal: T63 (entspricht Gauss-Gitter: 192 x 96) vertikal: 13 (troposphärische) p-Level zeitlich: 4 x täglich (6h) Zeitraum: 200 Jahre für die Berechnung des Eady-Parameters werden aus zwei Niveaus je 4 Parameter verwendet.

WDC Climate / DKRZ RRZK IGM K / FU B Diagnosecluster Datenfluss am Beispiel eines der Diagnose-Tools (Baroklinität) WDC Climate / DKRZ RRZK IGM K / FU B CERA 1 DKRZ (UTF) 2 RRZK (SAN) 3 RRZK (SAN) 4 K / B (home) Speicherplatz: Monthly mean: 700 MB 1400 MB 180 MB Daily mean: 21 GB 42 GB 5,4 GB 6 hourly: 84 GB 168 GB 21,6 GB GRIB-Format GRIB-Format LOLA-Format LOLA-Format Aktueller Beispiel-Workflow (globale Daten als Ergebnis) 1 Datentransfer per jblob von der CERA-Datenbank auf die UTF-Platte des DKRZ. 2 Datentransfer per ftp vom DKRZ auf die SAN-Festplatte des RRZK. 3 Datenkonvertierung mit PINGO / CDO: vom GRIB- zum LOLA-Format. 4 Eady-Programm liest 8 Parameter ein und gibt den berechneten EADY-Parameter ins home-Verzeichnis des IGMK aus.

Bei Berechnung für eine Region (hier Atlantik-Europa 90W-50E, 80N-20N) Diagnosecluster Datenfluss am Beispiel eines der Diagnose-Tools (Baroklinität) WDC Climate / DKRZ CERA 1 DKRZ (UTF) 2 RRZK (SAN) 3 RRZK (SAN) 4 K / B (home) Speicherplatz: Monthly mean: 700 MB 1400 MB 180 MB Daily mean: 21 GB 42 GB 5,4 GB 6 hourly: 84 GB 168 GB 21,6 GB Bei Berechnung für eine Region (hier Atlantik-Europa 90W-50E, 80N-20N) deutlich reduzierte Datenmenge (57x25=1425 Gitterpunkte) Speicherplatz: reduzierter Speicherplatz Monthly mean: 700 MB 100 MB 13 MB Daily mean: 21 GB 3 GB 0,4 GB 6 hourly: 84 GB 12 GB 1,6 GB

Diagnosecluster Datenfluss für weitere Diagnose-Tools Feuchteflüsse Dateninput: Wind (zonal, meridional), spezifische Feuchte (berechnet aus rel. Feuchte, daher auch Temperatur benötigt) Druckniveaus auswählen oder integriert (falls ab Boden: Bodendruck und bodennahe Wind- und Feuchtefelder benötigt) CAPE Dateninput: Temperatur, relative Feuchte, integriert über variable Höhenbereiche Bodendruck, falls ab Boden (Evtl Flüssigwasser in einzelnen Niveaus) Stormtracks Dateninput: Geopotenzial in einem Niveau Zeitserien (tägliche oder noch höher aufgelöste Daten) Berechnungen der Stromfunktion, meridionale Ableitungen (Gradienten) besser aus KFFK statt aus Gitterpunktsdaten!

Workflow Diagnosetool -alt- CERA long term storage WORK- SHARE scratch IGMK (IGMK) b a c d d‘ e Extraktion der Daten aus Datenbank Konvertierung der Daten in anderes Datenformat Transfer der Daten ins IGMK Berechnung der gewünschten Daten mit Hilfe des Diagnosetools d‘: ggf. Statistische Analyse der Ausgangsdaten Grafische Aufbereitung der Ergebnisdaten

Workflow Diagnosetool -neu- (RRZK / IGMK) WORK- SHARE d‘ e b a c d scratch RRZK scratch IGMK CERA scratch RRZK scratch RRZK e b Extraktion der Daten aus Datenbank Transfer der Daten ins IGMK Konvertierung der Daten in anderes Datenformat Berechnung der gewünschten Daten mit Hilfe des Diagnosetools d‘: ggf. Statistische Analyse der Ausgangsdaten Grafische Aufbereitung der Ergebnisdaten long term storage

Workflow - neu - Extraktion von Daten aus dem Datenarchiv / Datenpool in Hamburg Transfer der Daten nach Köln Konvertierung / Aufbereitung der Daten für das Diagnosetool am ZAIK Berechnung der atmosphärischen Parameter mit Hilfe des Diagnosetools Ggf. weitere Datenverarbeitung / Statistische Analysen Visualisierung des Datensatzes

Workflow - aktuelle Arbeiten - Transfer des Konvertierungstools marion (Fortran-Program) von NEC SX-6 ► SUN-Opteron Cluster Transfer des Diagnosetools incl. Job-Umgebung von SUN-Workstation ► SUN-Opteron Cluster Später: Erweiterung des Diagnosetools für netCDF und Grib Daten, damit ggf. keine weitere Konvertierung mehr notwendig ist und weniger Plattenplatz benötigt wird ► weiterhin ein direkter, effektiver Nutzen der cdo‘s möglich

Workflow - alt - Extraktion von Daten aus dem Datenarchiv / Datenpool in Hamburg (long-term storage) Konvertierung und Aufbereitung der Daten für das Diagnosetool am DKRZ ► Vergrößerung des Datenvolumens Transfer der Daten nach Köln Berechnung der atmosphärischen Parameter mit Hilfe des Diagnosetools Ggf. weitere Datenverarbeitung / Statistische Analysen Visualisierung des Datensatzes