Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
Veröffentlicht von:Frideric Hemming Geändert vor über 10 Jahren
1
Parallelising Molecular Dynamics for Message Passing Systems Martin Gerber 26.11.99
2
Molekulardynamik-Simulation Vielteilchenwechselwirkung Summation der Teilkräfte Periodische Randbedingungen Koordinaten Wechselwirkung Integration t+t
3
Grössenordnungen Molekulare Systeme: »36000 Atome, cutoff 1.4nm, pro Atom ca. 500 Nachbarn Simulation 1 Zeitschritt: »real: 0.5-2 · 10 -15 s »SunUltra30: 30s 1ns simulieren: 1/2 bis 2 Jahre
4
Motivation & Ziele Methodik und neue Verfahren für den Entwurf dedizierter paralleler Systeme è Spezialhardware? SMP? WS-Cluster? è Softwarentwicklung?
5
Inhalt MD-Algorithmen Exploration Codegenerierung Validierung Entwurf Spezifikation
6
Parallele MD Algorithmen Anwendbarkeit verschiedener Verfahren auf Gromos: »Particle Decomposition »Interaction Decomposition »Spatial Decomposition: l Domain Decomposition l Replicated Data l Systolic Loops Implementation eines Prototypen mit MPI
7
kubische Randbedingungen
8
Domain Decomposition für rechtwinklige Simulationsbox
9
Oktaedrische Randbedingungen è Replicated Data
10
Inhalt MD-Algorithmen Exploration Codegenerierung Validierung Entwurf Spezifikation
11
Spezifikationsmodell Kontroll-/Datenflussgraph für datenparallele Algorithmen (replicated data) Generische Modelle algorithmischer Funktionen: »Komplexität »I/O Bandbreite »Speicherbedarf Ausschnitt aus der Gromos96P Spezifikation (Pairlist Aufbau)
12
Gromos96P Kontrollfluss- Spezifikation (komplett)
13
l Punkt-zu-Punkt Kommunikation Architekturmodell Overhead Latenz Bandbreite l Performanzmodell für Rechenknoten »Rechenleistung »elementare Operationen blocking non-blocking
14
Inhalt MD-Algorithmen Exploration Codegenerierung Validierung Entwurf Spezifikation
15
Analytische Modelle Parallele Architekturen Parallele Architekturen Generische Funktionsmodelle Generische Funktionsmodelle Bindung: Quantitative Schätzung der Performanz Parallelisierungs- strategie Parallelisierungs- strategie FunktionenRechenknoten Ablaufplan Simulations- parameter Simulations- parameter
16
Untersuchte parallele Architekturen
17
Quantitative Speed-up Schätzung
18
Inhalt MD-Algorithmen Exploration Codegenerierung Validierung Entwurf Spezifikation
19
Softwarestruktur Ê viele Versionen derselben SW allgemeine SW: Ô spezialisiert zur Laufzeit Trennung von Algorithmus und Zielarchi- tektur: Ô Konfiguration zur Compile-Zeit
20
Neue Programmierumgebung Funktionen Interface CDFG Architektur Schedule Extraktion ausführbare Programme sequentiell & parallel
21
Inhalt MD-Algorithmen Exploration Codegenerierung Validierung Entwurf Spezifikation
22
Validierung Gromos96P Getestete Versionen: Datenkommunikation Barrier Synchronisation synchronasynchron einaus IBM SP-2 1-44 Knoten Architekturen Workstation Cluster 1-5 Knoten Myrinet Fast Ethernet
23
kubische Box auf IBM SP-2 Daten asynchron, mit BarrierDaten asynchron, ohne Barrier
24
Workstation Cluster Skalierbarkeit par. Funktionen Daten asynchron, ohne Barrier
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.