Übersicht über die Wuppertaler Arbeiten im GRID-Computing Torsten Harenberg 13. Mai 2004.

Slides:



Advertisements
Ähnliche Präsentationen
Be.as WEB Technologie
Advertisements

Cloud42 Dominik Muhler Seminar StuPro cims cims.
E-Commerce Shop System
Webinterface für eingebettete Systeme in Dual-Server-Architektur
Rechnernetze und verteilte Systeme (BSRvS II)
1 Allgemeine Fragestellung Suche nach wissenschaftlicher Information im Internet Quelle wird gefunden, aber… …Zugang nur gegen Passwort oder Zahlung Wiss.
Bernd Oberknapp, UB Freiburg
Authentifizierung, Autorisierung und Rechteverwaltung Einsatz und Funktion des Rechteservers 2. Shibboleth-Workshop Freiburg, 23. März 2006 Gerald Schupfner,
Übung 5 Mehrstufige Client/Server-Systeme mit Enterprise Java Beans
Datenbankzugriff im WWW (Kommerzielle Systeme)
Erweiterung B2B Usermanagement / LDAP-Anbindung
Daniel Höfler Markus Thurner XMLApplicationPlatform Siemens OpenStage 60/80.
Pascal Busch, WWI00B – Vergleich CORBA vs. Web Services hinsichtlich der Applikationsintegration Web Services vs CORBA Web Services vs CORBA Ein Vergleich.
Microsoft Windows 2000 Terminal Services
M. Feindt, U.Kerzel, Th. Kuhr, M. Milnik, T. Müller, G. Quast Universität Karlsruhe Grid-computing bei CDF.
SciAgents - Eine agentenbasierte Umgebung für verteilte wissenschaftliche Berechnungen Alexander StarkeSeminar Software Agenten
Information und Technik Nordrhein-Westfalen Das personalisierte Portal Düsseldorf, Das personalisierte Portal.
Oracle WebServer - Einführung. © Prof. T. Kudraß, HTWK Leipzig Oracle Web Application Server HTML WebServer ® File system Static HTML PL/SQL Packages.
Struts Seminar Javabasierte Webanwendungen. Tobias Kutzler2 Überblick Historie Was ist Struts? Model Controller View Zusammenfassung.
Fachbereich Informatik Lehrgebiet Datenverwaltungssysteme Aufgabe GBIS (TPCW-Benchmark) Boris.
XML in Client-Server und GRID Architektur
7th international Bielefeld Konferenz Thinking beyond Digital Libraries Designing the Information Strategy for the next Decade Dynamische Infrastrukturen.
Treffen mit Siemens Siemens: Werner Ahrens Volkmar Morisse Projektgruppe: Ludger Lecke Christian Platta Florian Pepping Themen:
Introducing the .NET Framework
Projekt Web Engineering
Physiker Tagung Fachvortrag AKI Leipzig, 22. März 2002 Verteilte Experten-Datenbank Viele Wege – auch ein Ziel? Thomas Severiens.
Überlegungen zur Architektur eines Fachinformations-Netzwerkes am Beispiel des CeGIM Mehrwert ist es nicht nur, Daten von ihren Quellen zu den Nutzern.
1 Grid Computing Centre Karlsruhe (GridKa) Juli 2001: Anforderungspapier der 8 Nutzergruppen ATLAS, CMS, ALICE, LHCb, CDF, D0, BaBar, Compass mit Kapazitätsbedarf.
Hamburg November Computing in der CMS Gruppe der Uni Hamburg Zwei Bereiche: grid Computing Workgroup Server für Analyse.
Teil 4 Vernetzung von Computern
Seite Common Gateway Interface. Konzepte. Übersicht 1Einleitung 2Was ist CGI? 3Wozu wird CGI verwendet? 4Geschichtlicher Überblick 5Grundvoraussetzungen.
Die Bank von morgen - eine neue Welt für IT und Kunden? 23. Oktober 2001.
M A P K I T Management eines J2EE basierten eCommerce Systems am Beispiel des ATG Dynamo Applikationsservers und BMC Patrol als Managementframework.
Synergieeffekte durch softwaregestützte Prozessmodelle
Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Anforderungen von eScience und Grid-Technologie.
Jahre WorldWideWeb 13 Jahre Web-Anwendungen mit allegro.
Entwicklung verteilter Anwendungen I, WS 13/14 Prof. Dr. Herrad Schmidt WS 13/14 Kapitel 12 Folie 2 Web Services (1)
Service Location Protocol Ein Service Discovery Protokoll Patric Zbinden 20. März 2003.
1 Alexander Arimond, University of Kaiserslautern, Germany Entwicklung und Evaluation eines Raytracing-Dienstes für das Venice Service Grid Alexander Arimond.
Grid applications, environments and programming models Präsentiert von: Beikircher Wolfgang Schgaguler Evelyn.
Integration heterogener verteilter Systeme mit WS-BPEL – ein Praxisbeispiel Dr. Wolf-Dieter Heinrichs.
Tobias Kluge: FAME Middleware / Karlsruhe / The FAME project – Middleware.
Systemaufbau / Komponenten
Erstellen einer Webseitenstatistik mithilfe eines OLAP-Servers
Entwicklung verteilter Anwendungen II, SS 13 Prof. Dr. Herrad Schmidt SS 13 Kapitel 4 Folie 2 REST Web Services (1)
XML-Serverpages Vortrag im Rahmen des Seminars XML-Technologien Tobias Faessler.
ESRI EUROPEAN USER CONFERENCE
Java Server Pages Sergej Keterling
Management- und Web Services- Architekturen
Webhosting an der Universität Zürich
Rechnersysteme: Halbzeit Marcel Waldvogel. Marcel Waldvogel, IBM Zurich Research Laboratory, Universität Konstanz, , 2 Daten und Information.
Peer-to-Peer-Netzwerke
The EventCollector Concept Präsentation der Diplomarbeit von Thomas Moser und Lukas Karrer Distributed System Group,
Untersuchungen zur Erstellung eines
ATLAS2000 Modellintegration in digitalen Atlanten Konzepte und Lösungsvorschläge am Beispiel ATLAS2000.
1 Karim El Jed TECHNISCHE UNIVERSITÄT ZU BRAUNSCHWEIG CAROLO-WILHELMINA Institut für Betriebssysteme und Rechnerverbund
Online GIS Online GIS – Der Nutzer Matthias Hofschen, ESRI Germany ESRI EUROPEAN USER CONFERENCE.
->Prinzip ->Systeme ->Peer – to – Peer
Vortrag - Diplomarbeiten (HS I)
Datenbanken im Web 1.
Webserver Apache & Xampp Referenten: Elena, Luziano und Sükran
Web Services als Remote Content Provider in Portalumgebungen Vorstellung und Diskussion des Themas Präsentation des Prototypen Konzeption und prototypische.
J2EE-Motivation(I) Anforderungen an heutige Software u.a.:
2ter Review, 13. Oktober 2000, Berlin/Dortmund Pixelpark IMD 2. Review Dortmund Christoph Brandt / Torsten Prill Pixelpark AG 1 BMBF:
Generic Enabler Felix Holzäpfel-Stein, Aachen Generische Komponenten im Cloudkontext.
IT-Dienstleistungen E-Learning Systeme Content Management 1 Fallbeispiel ILIAS: Das Repository-Objekt-Plugin „Centra“
WebServices Vortrag zur Diplomarbeit WebServices Analyse und Einsatz von Thomas Graf FH Regensburg
Prof. Dr.-Ing. Franz-Josef Behr Geodaten und Datenmodell
1.
 Präsentation transkript:

Übersicht über die Wuppertaler Arbeiten im GRID-Computing Torsten Harenberg 13. Mai 2004

Gliederung Motivation Einführung in das GRID European DataGRID / LCG Wuppertaler Arbeiten D0 HEP Grid Status, Zusammenfassung

The Application Data crisis Wissenschaftliche Experimente generieren: Bio-Informatik Abfragen: 500 GByte pro Datenbank Satellitenbilder (Welt): ~ 5 TByte pro Jahr Heutige Teilchenphysik: 1 PByte pro Jahr LHC Physik (2007): PByte pro Jahr Wissenschaftler in weltweiten Kollaborationen verteilt Entweder die Daten sind an einem Ort und die Wissenschaftler verteilt (Hochenergiephysik!) Oder die Daten sind über die Erde verteilt und die Wissenschafter konzentriert (Erdbeobachtung)

Das GRID - eine Vision Forscher arbeiten über den Erdball verteilt. Sie teilen Daten und Resourcen mit Kollegen Das GRID: vernetzte Rechenzentren verbunden durch Middleware Wiss. Experimente liefern enorme Datenmengen

Rückblick Grid war der nächste logische Schritt in Ende der 1990er: Steigende Rechenleistung der Desktop-PCs 1988: Condor, später: Entropia, Distributed.NET Peer-to-peer Datenprotokolle erschienen 1999: Napster, later: Gnutella, KaZaa, BitTorrent Netzwerke wurden extrem schnell: 1997: wide area Bandbreite verdoppelt sich alle 9 Monate! 1997: Globus startet die Entwicklung grund- legender Middleware 1996: Middleware von Legion, 2000: Unicore 1999: Massives Auftreten der Grid Vision In Europa entstand das EU DataGrid Andere: NASA-IPG, CrossGrid, GridLab, PPDG, Alliance,..

European DataGRID Zielsetzung: build the next generation computing infrastructure providing intensive computation and analysis of shared large-scale databases, from hundreds of TeraBytes to PetaBytes, across widely distributed scientific communities Gestartet 2001, Ende Pilotanwender: Erdbeobachtung, Biomedizin, HEP Weitergeführt durch EGEE LCG (LHC Computing GRID) ist eine Anwendung des EDG!

Das EDG aus Benutzersicht

GridElements

Status des LCG

Wuppertal Arbeiten Wuppertal ist an 4 Fronten aktiv: Innerhalb von D0: Monte-Carlo Generierung und Reprozessierung (T. Harenberg, E. Pauna, NIKHEF) Bereitstellung von zentralen Diensten (RLS) Innerhalb HEP Grid Installationssupport für andere Institute (TH, EP) Erstellung eines graphischen Benutzerinterface (Dietrich Vogel) Erstellung eines Systems zur Lastverteilung der Resource Broker (Ralf Kahrl)

D0 in EDG/LCG D0 Software nicht für GRID- Umgebungen angepasst Datenverwaltung SAM hat einige Funktionalität des DataGRID Leichte Anpassung der D0-Software nötig (Willem van Leeuwen, NIKHEF)

Zusammenspiel SAM/EDG Replica Location Service Neu: SAM-client mode macht Hilfskonstruktion überflüssig

Status D0 in EDG/LCG MC ist in EDG lauffähig Repro war in EDG lauffähig Für LCG: MC läuft im NIKHEF-Teil des LCG Zum weltweiten Betrieb noch ein sog. RLS- Server nötig wird in Wuppertal aufgesetzt Bookkeeping soll vereinheitlicht werden (London Workshop) Datenbank-Zugriff noch zu klären

Diplomarbeit Ralf Kahrl: Resource Broker Thema: Entwicklung eines skalierbaren Ressource Broker Systems in der Programmiersprache Java Allgemeines Vorgehen: Analyse der vorhandenen Architektur Erstellung eines Konzeptes Evaluierung verschiedener Techniken Implementierung

Aufgaben des Ressource Brokers Prüfung Benutzer-VO für Rechenberechtigung Verwaltung von Benutzer Proxy-Zertifikaten Finden von passenden Ressourcen für Job-Kriterien Erzeugung einer eindeutigen JobID Übergabe des Jobs an den Job Submission Service Melden des Jobs an Logging & Bookkeeping Service

Struktur des EDG-Brokers job-submit list-job-match job-cancel get-job-output get-logging-info User Interface Ressource Broker job-submit list-job-matches job-cancel Job-get-output-sandbox notify job-submit job-cancel Job Submission Service Logging & Bookkeeping LogEvent Query JobLog JobStatus ClearJob Computing Element Workload Management

Schnittstellen

Problematik des derzeitigen Systems Das User Interface ist durch Konfiguration an einen einzigen Ressource Broker (RB) gebunden!!! Nachteile: Hohe Last des RB Lange Wartezeit für Clients Ausfall des RB es können kein Jobs mehr verschickt werden Single Point of Failure Klassischer Client/Server-Ansatz nicht skalierbar

Kurzfristige Lösung Einrichten zusätzlicher RBs für jede VO einen eigenen RB. CE RB D0 Atlas CMS UI CE

erster Ansatz Analyse der derzeitigen Implementierung und Entwicklung eines neuen RB Systems Aufgetretene Probleme: unzureichende Dokumentation… zu viele Ports und Protokolle sehr hohe Kopplung zu anderen Workload-Komponenten (nicht alle direkt identifizierbar) Implementierung ist nicht transparent Weiterentwicklung des ursprünglichen RB würde nicht berücksichtigt werden Spaghetticode

aktueller Ansatz Beibehaltung der RB-Implementierung Vorschalten eines eigenen Dienstes, der Jobs entgegennimmt und mittels Auswahlkriterien auf verschiedene Ressource Broker verteilt. Vorteil: Bestehende Infrastruktur bleibt erhalten Kommunikation läuft weiterhin über den original RB Load Balancing wird ermöglicht Ausfallsicherheit

Mögliches Szenario Client OGSI/ SOAP Container OGSI/ SOAP Container OGSI/ SOAP Container OGSI/ SOAP Container RB-Agent EDG RB EDG RB EDG RB RB Client API RB-Agent 1. Create Service 2. Put in Tuplespace 3. Free agent takes request 4. Submit job 1 Information Tuplespace {Request Tuple} {Response Tuple} Set Response Tuple 6. Available Container will get Response 7. Job Handle 8. Further Job Communication

Diplomarbeit Dietrich Vogel: GUI für das LCG-System Ziel: Erstellung einer benutzerfreundlichen grafischen Schnittstelle für DataGrid (LCG) Job Management Data Management Plug-In Möglichkeit für spezielle Aufgaben (z.B. Reprocessing)

Jobs für DataGrid werden mit Hilfe von Job Description Language beschrieben, die mit Hilfe eines Formulars automatisch erzeugt werden müssen. Jobs müssen an DataGrid geschickt werden können Jobs müssen abgebrochen werden können Status der Ausführung muss ermittelbar sein Output eines zu Ende gelaufenen Jobs muss abrufbar sein. Anforderungen an das Job Management

Anforderungen an das Data Management Die Daten müssen auf dem DataGrid ermittelt werden können Die Daten müssen auf das DataGrid transportiert werden können Die Daten müssen auf dem DataGrid gelöscht, kopiert und verschoben werden können

Realisierung Eine webbasierte Applikation mit Java Servlet Technologie Servlets generieren HTML Seiten Design der HTML Seiten wird durch Style Sheets beschrieben Benutzerhistory wird in XML abgelegt Schnittstelle zu DataGrid Globus API und WMS API Location: User Interface Webserver - Plattform: Apache Tomcat 4.1 (ist bereits installiert)

Klassendiagramm

Hierarchische Aufbau der HTML Seiten

Status Grundfunktionalität steht: Ein Job kann gestartet und ausgewertet werden Die Benutzerinformationen bleiben erhalten Die Hierarchie der HTML-Seiten ist implementiert.

TODO Authentifizierung durch im Browser installiertes Zertifikat Verwaltung der benutzerspezifischen Informationen Job- und Datenmanager entwerfen und realisieren Dokumentation

Zusammenfassung In großen GRIDs liegt die Zufunkt, LCG hat schon bedeutende Ausmaße erreicht Wuppertal von Anfang an dabei (Vorreiter in Deutschland, erste Uni nach GridKa) Innerhalb von D0 enge Zusammenarbeit mit dem NIKHEF Erste Diplomarbeiten!