Parallelising Molecular Dynamics for Message Passing Systems (complete) Martin Gerber 26.11.99.

Slides:



Advertisements
Ähnliche Präsentationen
Kurzwiederholung Informatik I, Teil I: Grundkonzepte
Advertisements

Pop Jazz C B A Jazz C A Lehrstuhl für Künstliche Intelligenz
Adaptive Systeme Prof. Rüdiger Brause WS 2011.
Das Studium der Informatik
Parallel and Cluster Computing
Strukturfunktionsgenerierung
Informatik 12 | DAES Compilerbau Wintersemester 2010 / 2011 Dr. Heiko Falk Technische Universität Dortmund Lehrstuhl Informatik 12 Entwurfsautomatisierung.
Eingebettete Systeme Qualität und Produktivität
Designing Software for Ease of Extension and Contraction
:33 Architektur Moderner Internet Applikationen – Hard- und Software Copyright ©2003 Christian Donner. Alle Rechte vorbehalten. Architektur.
ixJED ixact GmbH Dr. Karsten Wendt
PC-Cluster.
Network-on-Chip basierende Laufzeitsysteme für dynamisch rekonfigurierbare Hardware Ronald Hecht Institut für Mikroelektrotechnik und Datentechnik Universität.
Kooperierende autonome Fahrzeuge
Enno Rehling und Roger Butenuth, Uni-GH Paderborn: Arminius: Software für Linux-basierte SCI-Cluster Arminius: Software für Linux-basierte SCI-Cluster.
1 Energiebewusste Compilierung für digitale Signalprozessoren Markus Lorenz Peter Marwedel Universität Dortmund Lehrstuhl Informatik XII Projekt Prozessorarchitekturen.
0 Energieeffiziente Compilierung für Digitale Signalprozessoren Markus Lorenz Peter Marwedel Rainer Leupers Projekt Prozessorarchitekturen und Compilertechniken.
Seminar Software-Engineering für softwareintensive Systeme
Die Serielle Schnittstelle
Prof. Dr. Holger Schlingloff
Modellbasierte Software- Entwicklung eingebetteter Systeme Prof. Dr. Holger Schlingloff Institut für Informatik der Humboldt Universität und Fraunhofer.
Spezifikation, Verifikation, Testtheorie Prof. Dr. Holger Schlingloff Institut für Informatik und Fraunhofer FIRST.
Management großer Softwareprojekte Prof. Dr. Holger Schlingloff Humboldt-Universität zu Berlin, Institut für Informatik Fraunhofer Institut für Rechnerarchitektur.
Palm OS Project Martin Ochs Palm OS Project Inhalt Hardware Schnittstellen Die serielle Schnittstelle Entwicklungsumgebung Test-Programm Hardware-Test.
SciAgents - Eine agentenbasierte Umgebung für verteilte wissenschaftliche Berechnungen Alexander StarkeSeminar Software Agenten
OpenMP Präsentation im Rahmen des Seminars
Parallele Gleichungslöser für die linearen TRACE-Module
XML in Client-Server und GRID Architektur
Mambrey, P.; Pipek, V.Konzepte, Methoden und Werkzeuge zur sozialen und demokratischen Nutzung des Internets Konzepte, Methoden und Werkzeuge zur sozialen.
Experimentaufbau und -design
HPC Architekturen und Anwendungen: Anforderungen und Notwendigkeiten
2. IT-Klausurtagung 2. Tag Neues beginnen Oktober 2002 in Ludwigslust.
für biologische Anwendungen
OO Analyse und Entwurf für Anwender
Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme
Berliner Rahmenpläne Informatik für die Sekundarstufe I
INSTITUT FÜR DATENTECHNIK UND KOMMUNIKATIONS- NETZE 1 Harald Schrom ViEWcon08.
mittels Systemanalyse
Entwicklung verteilter eingebetteter Systeme - Einführung
Simulation komplexer technischer Anlagen
Vorgehensmodelle: Schwergewichtige Modelle
High Performance Fortran Seminar Parallele Programmierung von Sebastian König und Stefan Seidel.
Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Softwaretechnologie II (Teil I): Simulation und 3D Programmierung Prof.
Adaptive Systeme Prof. Rüdiger Brause WS 2013.
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Institut für Theoretische Physik
Software-Technik „Zielorientierte Bereitstellung und systematische Verwendung von Prinzipien, Methoden und Werkzeugen für die arbeitsteilige, ingenieurmäßige.
1.2 Trennung von Struktur und Inhalt
Komponenten eines Informationssystems
Enterprise Achitect (Sparx Systems) Marius Rudolf
Vienna University of Technology Pirker Simon 1. Überblick Definition Motivation Vorteile Entwurf von VP Pirker Simon 2.
Parallelising Molecular Dynamics for Message Passing Systems Martin Gerber
Boga Abschlusspräsentation
Informatik II Grundlagen der Programmierung Programmieren in C Funktionen, Adressen, Zeiger Hochschule Fulda – FB ET Sommersemester 2014
JAVA/DSM A Platform for Heterogeneous Computing Serge F. Possono M. Technische Universität Muenchen (TUM) Lehr- und Forschungseinheit Informatik X Rechnertechnik.
Magisterstudium Scientific Computing Institut für Scientific Computing Infoveranstaltung Masterstudium Scientific Computing.
VO D6/G6: Einführung in die Politikfeldanalyse
Der Design-Flow eines ASIC
2. Kommunikation und Synchronisation von Prozessen 2
Clustering Clustering mit openMosix von Christian Wiese Stefan Krause.
JABBA: Flexibles Web - Interface Semesterarbeit von Thomas Zwicker, Thomas Moser und Lukas Karrer Prof. L. Thiele Betreuung: J. Greutert TIK ETH Zürich.
Modellbasierte Software- Entwicklung eingebetteter Systeme Prof. Dr. Holger Schlingloff Institut für Informatik der Humboldt Universität und Fraunhofer.
Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Softwaretechnologie II (Teil I): Simulation und 3D Programmierung Prof.
Software Engineering SS04 Paralleles Programmieren FH Aachen, Prof. Dr.-Ing. Michael Trautwein Andrej Kühnal, Perez-Otuno Rodrigo.
Middleware in Java vieweg 2005 © Steffen Heinzl, Markus Mathes Kapitel 1: Architektur verteilter Systeme.
Copyright © 2010 ADDITIVE GmbH, Software Tel: ADDITIVE Geschäftsbereich Software präsentiert Lösungen Numerische & Computer-Algebra.
LocoMotif Professor Dr. Katharina Zweig Wolfgang Schlauch Mareike Bockholt TU Kaiserslautern.
A. Steininger TU Vienna 1 Multicore eleganter Work-Around um die Design-Crisis Problemverschiebung in die SW (= auf höhere Ebene) ABER: hohe Parallelität.
 Präsentation transkript:

Parallelising Molecular Dynamics for Message Passing Systems (complete) Martin Gerber

Molekulardynamik-Simulation Schrödinger Gleichung (quantenmechanisch) »Born-Oppenheimer Physikalische Modelle: »Van der Waals Dispersion, Coulomb-Kraft »Klassische Newton‘sche Bewegungsgleichungen »Lennard-Jones Paarpotential Charge Groups Konzept Wechselwirkungspotential von flüssigem Argon: l 2 Atome: l effektives Paarpotential:

Parallel Computing Aimed at Quantum and Classical Dynamical Molecular Simulation ETH Projekt , 830kFr. Partner »Leitung: IGC (Institut für Informatikgestützte Chemie, W.F. van Gunsteren) »IWR (Institut für Wissenschaftliches Rechnen, W. Gander) »IFE (Institut für Elektronik, G. Tröster) »TIK (Institut für Technische Informatik und Kommunikationsnetze, L. Thiele)

Inhalt MD-Algorithmen Exploration Codegenerierung Validierung Entwurf Spezifikation

kubische Randbedingungen II

Load Balancing 20 Knoten: gleich gut für kubische Box, oktaedrische Box: momentan nicht rechenbar auf 20 Knoten (Boxgrösse zu klein)

Inhalt MD-Algorithmen Exploration Codegenerierung Validierung Entwurf Spezifikation

Inhalt MD-Algorithmen Exploration Codegenerierung Validierung Entwurf Spezifikation

Exploration Analyse Systemsynthese: Heterogene Hardware/Software Systeme »Applikation eines Evolutionären Algorithmus (EA) Neue Analytische Modelle »für parallele Architekturen »für datenparallele Algorithmen »Ziel: Schätzungen (Performanz, Skalierbarkeit) è Paralleles Zielsystem (Hardware & Software)

Systemsynthese mit EA Super- Architektur Algorithmus Mappings f1: v1,v3 f2: v1,v2... KostenZeit Synthese Ablaufplan Architektur Bindung

Exploration mit System-Synthese Synthese automatisiert: »Allokation, Bindung, Ablaufplanung Nur zwei Optimierungskriterien: »Ausführungszeit, Kosten. MD Algorithmus: »Allokation und Bindung offensichtlich »Datenparallelität »Exploration für versch. molekulare Systeme è ungeeignet für MD Algorithmen

Synthese–Tool

Abhängigkeits-, Architektur- und Spezifikationsgraph

Ganttcharts

Inhalt MD-Algorithmen Exploration Codegenerierung Validierung Entwurf Spezifikation

Gromos96 SW Struktur viele Versionen derselben Funktion: »aufwendig im Unterhalt informale Spezifikation der Zielarchitektur FORTRAN: »globale Variablen (common blocks) »SMP: wie parallelisieren? Algorithmische Funktionen Mehrere Versionen für verschiedene Architekturen

Neue Programmierumgebung Trennung von Algorithmus und Zielarchitektur generische Funktionen für alle Architekturen paralleler Prototyp: »komplex »viele Abhängigkeiten im Code »sehr anfällig auf Programmierfehler è Automatisieren

Bindung

Inhalt MD-Algorithmen Exploration Codegenerierung Validierung Entwurf Spezifikation

Handcodierte Versionen asynchrone Datenkommunikation Wie implementieren? »Synchronisation: Wann? Wo? So wenig wie möglich? »Broadcast oder Punkt-zu-Punkt? mpi_reduce? Zum Beispiel so: »Punkt-zu-Punkt Datenverteilung, asynchron »Barrier Synchronisation optional »Daten sammeln mit mpi_reduce (Kommunikation + Addition) Alternativ »Broadcast Datenverteilung, asynchron »Punkt-zu-Punkt zum Daten sammeln

Generierte Version Datenkommunikation synchron Daten sammeln mit mpi_reduce Performanz/Skalierbarkeit identisch zu handcoierter synchron-Version

Speed-up

Barrier Synchronisation auf Workstation Cluster Daten asynchron, ohne Barrier pax: ohne Barrier psx: mit Barrier

Zusammenfassung