Parallelising Molecular Dynamics for Message Passing Systems Martin Gerber
Molekulardynamik-Simulation Vielteilchenwechselwirkung Summation der Teilkräfte Periodische Randbedingungen Koordinaten Wechselwirkung Integration t+t
Grössenordnungen Molekulare Systeme: »36000 Atome, cutoff 1.4nm, pro Atom ca. 500 Nachbarn Simulation 1 Zeitschritt: »real: · s »SunUltra30: 30s 1ns simulieren: 1/2 bis 2 Jahre
Motivation & Ziele Methodik und neue Verfahren für den Entwurf dedizierter paralleler Systeme è Spezialhardware? SMP? WS-Cluster? è Softwarentwicklung?
Inhalt MD-Algorithmen Exploration Codegenerierung Validierung Entwurf Spezifikation
Parallele MD Algorithmen Anwendbarkeit verschiedener Verfahren auf Gromos: »Particle Decomposition »Interaction Decomposition »Spatial Decomposition: l Domain Decomposition l Replicated Data l Systolic Loops Implementation eines Prototypen mit MPI
kubische Randbedingungen
Domain Decomposition für rechtwinklige Simulationsbox
Oktaedrische Randbedingungen è Replicated Data
Inhalt MD-Algorithmen Exploration Codegenerierung Validierung Entwurf Spezifikation
Spezifikationsmodell Kontroll-/Datenflussgraph für datenparallele Algorithmen (replicated data) Generische Modelle algorithmischer Funktionen: »Komplexität »I/O Bandbreite »Speicherbedarf Ausschnitt aus der Gromos96P Spezifikation (Pairlist Aufbau)
Gromos96P Kontrollfluss- Spezifikation (komplett)
l Punkt-zu-Punkt Kommunikation Architekturmodell Overhead Latenz Bandbreite l Performanzmodell für Rechenknoten »Rechenleistung »elementare Operationen blocking non-blocking
Inhalt MD-Algorithmen Exploration Codegenerierung Validierung Entwurf Spezifikation
Analytische Modelle Parallele Architekturen Parallele Architekturen Generische Funktionsmodelle Generische Funktionsmodelle Bindung: Quantitative Schätzung der Performanz Parallelisierungs- strategie Parallelisierungs- strategie FunktionenRechenknoten Ablaufplan Simulations- parameter Simulations- parameter
Untersuchte parallele Architekturen
Quantitative Speed-up Schätzung
Inhalt MD-Algorithmen Exploration Codegenerierung Validierung Entwurf Spezifikation
Softwarestruktur Ê viele Versionen derselben SW allgemeine SW: Ô spezialisiert zur Laufzeit Trennung von Algorithmus und Zielarchi- tektur: Ô Konfiguration zur Compile-Zeit
Neue Programmierumgebung Funktionen Interface CDFG Architektur Schedule Extraktion ausführbare Programme sequentiell & parallel
Inhalt MD-Algorithmen Exploration Codegenerierung Validierung Entwurf Spezifikation
Validierung Gromos96P Getestete Versionen: Datenkommunikation Barrier Synchronisation synchronasynchron einaus IBM SP Knoten Architekturen Workstation Cluster 1-5 Knoten Myrinet Fast Ethernet
kubische Box auf IBM SP-2 Daten asynchron, mit BarrierDaten asynchron, ohne Barrier
Workstation Cluster Skalierbarkeit par. Funktionen Daten asynchron, ohne Barrier