Datagrid in Earth System Sciences (DGESS) - Status und Projektplan - Projektreffen am Max-Planck-Institut für Meteorologie Heinrich Widmann 28. November.

Slides:



Advertisements
Ähnliche Präsentationen
Das Content-Management-System Sebastian Raubinger
Advertisements

V - Modell Anwendung auf große Projekte
Rechnernetze und verteilte Systeme (BSRvS II)
Daten fließen lassen XML in Microsoft Office 2003 Lorenz Goebel Frank Fischer
Einführung von Team System Ein Vorgehensvorschlag
Systemverwaltung wie es Ihnen gefällt.
PADLR Submodul Modular Content Archives Ein Content Browser für Lehr- materialien aus der Elektrotechnik Dipl.-Ing. Mark Painter Institut für Nachrichtentechnik.
Elektronisch Publizieren im Verbund: GAP – German Academic Publishers
Ulrich Kähler, DFN-Verein
Ulrich Kähler, DFN-Verein
Auswertung der Interviews
PLM Einsatzbereiche.
Universität Stuttgart Institut für Kernenergetik und Energiesysteme I nstitut für K ernenergetik und E nergiesysteme Rational Unified Process (RUP) - Definitionen.
Risiken und Chancen Risiko Beurteilung: Dazu gehört die Identifikationen von Risiken, ihre Analyse und das Ordnen nach Prioritäten. Risiko Kontrolle: Dazu.
ATHOS Benutzertreffen 27.September Report of the Lab Glashütten, 27.September 2007 HighQSoft GmbH, Karst Schaap
ASAM ODS Daten standardisiert auswerten
K-Modeler Engineering
1 NetWork File System © April 2002, G. Hellberg Network File System Konfiguration und Einsatz.
Rational Unified Process (RUP) - Definitionen
eXtreme Programming (XP)
Erfahrungsbericht Rechenzentrum der Ruhr-Universität Bochum
Vortrag III Hier in der Vorlesungszeit! Anwesenheitspflicht Jede Gruppe hat 6 Minuten! Stellt eure GUI vor –was ihr besonderes gemacht habt –Spektakuläre.
Hamburg November Computing in der CMS Gruppe der Uni Hamburg Zwei Bereiche: grid Computing Workgroup Server für Analyse.
2. IT-Klausurtagung 2. Tag Neues beginnen Oktober 2002 in Ludwigslust.
Migration von Oracle 9i auf 10g Hans Pfeiffer Talkline Data Warehouse Elmshorn,
Dokumenten- und Archivsystem auf Basis kommerzieller Software Verband der Bibliotheken des Landes Dokumenten-
Identity für GSI Michael Dahlinger, GSI
SAP R/3 Kapazitätsmanagement Erfahrungsbericht Jürgen Pfister M A P K I T.
Schulz & Löw Consulting GmbH
1 Zwischenstandsbericht III Olaf Watteroth Computer Systems and Telematics Institute of Computer Science Freie Universität Berlin
PHProjekt – eine open source Projektmanagementsoftware
LDAP Migration (Stand und Ausblick) Torsten Gosch CIS.
Datagrid in Earth System Sciences (DGESS) - Integration und Erweiterungen - Projektreffen am Max-Planck-Institut für Meteorologie Heinrich Widmann 28.
Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Anforderungen von eScience und Grid-Technologie.
Kommunikation im Team verbessern mit Mindjet MindManager
Praxisbericht über den zielgerichteten Einsatz von Marketingsystemen
Präsentiert Informationen auf den Punkt gebracht.
Thats IT!. Titelmasterformat durch Klicken bearbeiten Über uns Mit uns bekommen Sie: Beratung – Doing - Betreuung langjährige Erfahrung umfassende Beratung.
Grid applications, environments and programming models Präsentiert von: Beikircher Wolfgang Schgaguler Evelyn.
Xenario IES Information Enterprise Server. Xenario Information Enterprise Server (IES) Die neue Architektur des Sitepark Information Enterprise Servers.
Workflow - Diagnosetool -
Nicolas Frings Maximilian Bernd Stefan Piernikarcyk
Architekturen und Techniken für computergestützte Engineering Workbenches.
Deutschcenter Süd: E-Technologien und Werkzeuge des WM 1 Deutschcenter Süd Fichtner Birgit Kosz Alexander Schuster Julia Riedl Christina Szuppin Elisabeth.
HORIZONT 1 SmartJCL ® Der einfache Weg zur fehlerfreien JCL HORIZONT Software für Rechenzentren Garmischer Str. 8 D München Tel ++49(0)89 / 540.
Eidgenössisches Departement des Innern EDI Bundesamt für Statistik BFS Eidgenössisches Finanzdepartement EFD Bundesamt für Informatik und Telekommunikation.
Publikation auf Knopfdruck Judith Riegelnig Michael Grüebler 19. Oktober 2010 / Statistiktage Neuenburg.
Präsentiert Management Lösungen Value Added Software GmbH, Carl-Schurz-Str. 7, Neuss
[ Firmenlogo entfernt ]
KIT – Universität des Landes Baden-Württemberg und nationales Forschungszentrum in der Helmholtz-Gemeinschaft Steinbuch Centre for Computing (SCC)
Virtuelle Forschungsumgebungen
Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? nestor und Grid Jens Ludwig Baden-Baden, 2.
Simlab®1 Prozess-Optimierung im medizinischen Labor
Mehr Zeit für den Kunden und wirtschaftlicher Arbeiten mit BIB-Control
M&D- Status Seminar Datenanfragen Verfügbare Datensätze Nachfrage zu den Datensätzen Metadaten Benutzer-Anfragen Information/Schulung Probleme To Do Liste.
Konsortialrechnungen: IPCC AR4 Unterstützung durch M&D Antriebsdaten Koppelungsumgebung Modelläufe Datenspeicherung Anpassung von ECHAM 4 MPI-M UBonn.
Informationsdienste Torsten Rathmann (Deutsches Klimarechenzentrum, Hamburg) Workshop: Virtuelle Forschungsumgebungen aufbauen – mit D-Grid Abstract: Thema.
Masc CJD Jugenddorf Offenburg Die Installation ProfilAC … powered by Polikles ® 25. bis 27. Januar 2005 masc ag, rotkreuz
Michael Gerndt Technische Universität München Peridot Zusammenfassung des Projektplans.
WIR LÖSEN DAS PROBLEM FÜR SIE
Eike Schallehn, Martin Endig
Fachstudie: Marktanalyse Provisioning Tools
->Prinzip ->Systeme ->Peer – to – Peer
Oracle Portal think fast. think simple. think smart. Dieter Lorenz, Christian Witt.
Musterlösung IT-Struktur an Schulen © M. Stütz, F. Wrede LEU - Zentrale Planungsgruppe Netze am Kultusministerium Baden-Württemberg zwei Programme im.
Praxiserfahrungen aus Projekten
Agile Performance Tools & Information Systems -Ticket-System und Multi-Projektmanagement mit Andreas Haaken Systems Engineer Information Architect.
H. Grottenegg 1 Geodaten – zur Prüfung bitte!. H. Grottenegg2 Um welche Prüfung gehts?  Prüfung von (Geo-)Daten gegen eine Richtlinie/Vorgabe (z.B.Naturbestand,
Devops David Jaroš
 Präsentation transkript:

Datagrid in Earth System Sciences (DGESS) - Status und Projektplan - Projektreffen am Max-Planck-Institut für Meteorologie Heinrich Widmann 28. November 2005

Überblick Kooperationsprojekt DGESS : Motivation und Ziele Projektplan, Status und Entwicklung Die ersten drei Arbeitspakete im Detail Nächste Schritte

DataGrid in Earth System Sciences (DGESS) Forschungskooperation zwischen Sun GmbH und MPI-M Laufzeit : April 2005 – April 2007 Grid-Technologie ist Neuland für die Erdsystemforschung Ziele des Projekts : Erforschung und Entwicklung von Grid-Technologien für die datenintensive Erdsystemforschung Gemeinsame und effektive Nutzung der vorhandenen Ressourcen innerhalb der 'climate community' Integration in größere Grid-Initiativen wie C3Grid, EGEE

Zentrale Motivation : Exponentiell ansteigende Datenvolumen =>... Quelle: M. Böttinger / DKRZ

... => Lösungsansätze Daten (= Metadaten + Phys. Daten) direkt, gefiltert, reduziert, automatisch und strukturiert in Datenbank schreiben Postprozessing und Workflows standardisieren und vereinfachen Auslastung von vorhandener, brachliegender Ressourcen GRIDtechnologien einsetzen !?

Anforderungen und Probleme in der ESS => mögliche Grid-Lösungen Große, verteilte Datenvolumina Kostendruck Unstrukturiertes, ineffizientes Datenmanagment Vorhandene IT-Infrastruktur Benutzerspezifische Workflows und Tools Wissenschaftler mit technischen Problemen konfrontiert Interdisziplinäre, komplexe Forschungsumgebung Datenfluß optimieren, standardiseren und automatisieren Ressourcen besser nutzen Metadatenbank An Grid anpassen Standardisierung und Automatisierung der Prozesse Weniger manuelles Arbeiten, benutzerfreundliche 'Wrapperskripte' Synergien aus gruppen- und institutsübergreifender Zusammenarbeit nutzen

Projektplan Projektplan als Diskussionsgrundlage Projektplan ist überambitioniert und eher zu optimistisch Hier nur Arbeitspakete der 'Phase I' diskutieren Viele offene Baustellen Nach Prioritäten, Machbarkeit und Zuständigkeiten ordnen Konzentration auf das Machbare !! Konkrete Arbeitsaufteilung : Wer kann/macht was ? Institutionen : ZMAW (MPI-M (CIS), IfM, Uni HH), Sun, DKRZ, M&D Projekte : DGESS, C3 (Colaborative Climate -Grid, EGEE (Enable Grid E E-Science)

Projektplan – Planung Kickoff 05/05

Projektplan – Planung Status und 'Deltas' 12/05

AP I.1 Installation der N1GE6 und Testumgebung Sun Grid Engine (N1GE6) ist Job management System / Distributed Resource Management seit Oktober volle Lizenz mit Accounting (ArCO) und Monitoringsystem (GEMM) Master : yoda.zmaw.de SUNW, UltraAX-i2, Solaris 9 Execution hosts : Kursrechner kursNN.zmaw.de Meist 'idle', typische workstations, Kurszeiten => Kalenderfunktion, queues,... Shadow master : gallia.zmaw.de SUNW, Ultra-60, Solaris 10

AP I.1 Verzeichnisstruktur, NFS und NIS Sgeroot = Installations- und Software-Verzeichnis = yoda:/opt/sge per NFS ueber alle gridhosts gemounted Später aufgeteilt in Gridware = yoda:/opt/gridware : read only gemounted Gridspool = yoda:/opt/gridspool : read and write gemounted seit Oktober volle Lizenz mit Accounting (ArCO) und Monitoringsystem (GEMM) ArCO installiert, aber noch nicht eingesetzt (Accounting ueber LDAP?) GEMM nicht installiert, -> Ganglia

AP I.1 : Installation und Testumgebung : Basissystem N1GE6

AP I.1 : Installation und Testumgebung : Fail-Over+Fileserver

AP I.1 : Installation und Testumgebung : + SunFire 15k (MPI-Jobs und Parallel environement)

AP I.1 : Installation und Testumgebung : + Fileserver und 'Gridshares' auf zentralem NFS-Server

AP I.2 : Benutzer integrieren – Grid anbieten Website Anmeldeformular vorhanden Links auch an zentraler Stelle (ZMAW-site) Grid bekannt machen und Nutzen aufzeigen !! Usermanual fortsetzen, 'Feedbacks' einbauen GUI ('QMON') und Wrapper-Skripte zur Verf. stellen Tutorials anbieten, Bekanntgabe in Usermmeeting Testanwendungen anbieten (einfach und intuitiv) Kritische Szenarien testen und abfangen => 'Freigabe', wenn : Support und stabiles System gewährleistet ist !

AP I.2 : Benutzer integrieren - Testanwendungen Computeanwendungen CCDAS : CPU-intensive, unabhängige Berechnungen BETHY : Domaindecomposition Postprozessing : Afterburner : aus Fill-Skript von M&D CDOs : erste Tests, verteile monatliche Dateien Jblob-Skript : aus die Datenbank lesen Problem : Wie kommen Daten auf die worker nodes ?

AP I.2 : Benutzer integrieren - Strategien S1 : Step by step und nach Usertyp 'Poweruser' : Erfahrene Benutzer, Anwendungen vorhanden, ohne Berührungsängste CIS-Admins koennen Stabilität, Ausfallsicherheit und Belastbarkeit testen Testuser : neue C3-Kollegen (testen generische Workflows !) Neulinge : IMPRS-Studenten -> Tutorials S2 : Zuerst hoch verfügbares System schaffen => Institutsweite Freigabe Nachteil : dauert zu lange S3 : Kombination aus S1 und S2 !!

API.3 : Prozesse analysieren - Generischen Workflow abbilden 1. Datenproduktion Modelläufe auf HPC-Rechnern (hurikan) erzeugen Monatliche Output-Dateien (Rohdaten) in verschiedenen Datenformaten und Modellgittern Größenordnung von GB/Datei bzw. TB/Experiment 2. Datenreduktion und -speicherung Selektion einzelner Parameter, Regriden,... (after) Berechnung von Monatsmitteln und Integration in Zeitreihen (CDOs -> Uwe Schulzweida) Abspeichern in Archiv und Datenbank (jblob -> Hannes Thiemann) 3. Datenanalyse Statistische und sonstige Auswertung (CDOs, andere Tools) Visualisierung : Plotten, Animation etc. Schritte 2 und 3 können auf dem Grid durchgeführt werden !

AP I.3 : Prozesse analysieren - C3-Grid-Vorgabe : Generischer Workflow Collaborative Climate Community Grid Quelle : C3-Grid, R. Budich

AP I.3 : Prozesse analysieren - Workflowtabelle – aus Anwenderbefragung Metadaten !

AP I.3 : Prozesse analysieren - Workflowtabelle –> Metadaten Allgemeines Institut, Project Experiment Durchführung/ System Model : Versionskontrolle, Modelgrid, Resolution, Zeitintegration Rechenzeit, Datenformat(e) Preprocessing und Set up Input, Initialisierung, Forcing, Restart Postprocessing Ablauf, verwendete Tools Output (Size, Format): von Roh-, Basis-, Anw.- und Ergebnisdaten Datenspeicherung

Zu AP I.3 : Generischer Workflow (WF) am ZMAW - Steuerung durch den Benutzer 2. Daten- Reduktion und - Speicherung 1. Daten- produktion 3. Daten- Analyse und Diagnose Select, map, regrid and store data Wissenschaf tler Hole Daten, fuehre Experiment durch,... Analyse und Diagnose der Daten WF-Steuerung WF-Schritte CERA DB CERA DB Simulation Rohdaten bis zu 10 GB / Datei Anwendungsdaten 20 MB - 2 GB / Datei Datenflu ß Basisdaten bis zu 1 GB / Datei

AP I.3 : Generischer Workflow (WF) am ZMAW - Steuerung durch das Grid 1. Daten- produktion 2. Daten- Reduktion und - Speicherung 3. Daten- Analyse und Diagnose CERA DB CERA DB Simulation Rohdaten bis zu 10 GB / Datei Basisdaten bis zu 1 GB / Datei WF-Steuerung WF-Schritte Datenflu ß Benutzer gibt - Metadaten - Parameter ein (GUI ?) qsub jobscript Anwendungsdaten 20 MB - 2 GB / Datei

Die nächsten vier Schritte (Prio 1) Shadowmaster installieren, Failover-Szenarien Jobskript für generisches C3-Grid-Workflow erstellen MPI jobs, Pasrallel environment (yin und yang) Website, Usermanual, Tutorien, Anwendungen wrappen