Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
Veröffentlicht von:Friederike Krämer Geändert vor über 8 Jahren
1
Parallelising Molecular Dynamics for Message Passing Systems (complete) Martin Gerber 26.11.99
2
Molekulardynamik-Simulation Schrödinger Gleichung (quantenmechanisch) »Born-Oppenheimer Physikalische Modelle: »Van der Waals Dispersion, Coulomb-Kraft »Klassische Newton‘sche Bewegungsgleichungen »Lennard-Jones Paarpotential Charge Groups Konzept Wechselwirkungspotential von flüssigem Argon: l 2 Atome: l effektives Paarpotential:
3
Parallel Computing Aimed at Quantum and Classical Dynamical Molecular Simulation ETH Projekt 1996-99, 830kFr. Partner »Leitung: IGC (Institut für Informatikgestützte Chemie, W.F. van Gunsteren) »IWR (Institut für Wissenschaftliches Rechnen, W. Gander) »IFE (Institut für Elektronik, G. Tröster) »TIK (Institut für Technische Informatik und Kommunikationsnetze, L. Thiele)
4
Inhalt MD-Algorithmen Exploration Codegenerierung Validierung Entwurf Spezifikation
5
kubische Randbedingungen II
6
Load Balancing 20 Knoten: gleich gut für kubische Box, oktaedrische Box: momentan nicht rechenbar auf 20 Knoten (Boxgrösse zu klein)
7
Inhalt MD-Algorithmen Exploration Codegenerierung Validierung Entwurf Spezifikation
8
Inhalt MD-Algorithmen Exploration Codegenerierung Validierung Entwurf Spezifikation
9
Exploration Analyse Systemsynthese: Heterogene Hardware/Software Systeme »Applikation eines Evolutionären Algorithmus (EA) Neue Analytische Modelle »für parallele Architekturen »für datenparallele Algorithmen »Ziel: Schätzungen (Performanz, Skalierbarkeit) è Paralleles Zielsystem (Hardware & Software)
10
Systemsynthese mit EA Super- Architektur Algorithmus Mappings f1: v1,v3 f2: v1,v2... KostenZeit Synthese 1 2 3 4 5 6 7 Ablaufplan Architektur Bindung
11
Exploration mit System-Synthese Synthese automatisiert: »Allokation, Bindung, Ablaufplanung Nur zwei Optimierungskriterien: »Ausführungszeit, Kosten. MD Algorithmus: »Allokation und Bindung offensichtlich »Datenparallelität »Exploration für versch. molekulare Systeme è ungeeignet für MD Algorithmen
12
Synthese–Tool
13
Abhängigkeits-, Architektur- und Spezifikationsgraph
14
Ganttcharts
15
Inhalt MD-Algorithmen Exploration Codegenerierung Validierung Entwurf Spezifikation
16
Gromos96 SW Struktur viele Versionen derselben Funktion: »aufwendig im Unterhalt informale Spezifikation der Zielarchitektur FORTRAN: »globale Variablen (common blocks) »SMP: wie parallelisieren? Algorithmische Funktionen Mehrere Versionen für verschiedene Architekturen
17
Neue Programmierumgebung Trennung von Algorithmus und Zielarchitektur generische Funktionen für alle Architekturen paralleler Prototyp: »komplex »viele Abhängigkeiten im Code »sehr anfällig auf Programmierfehler è Automatisieren
18
Bindung
19
Inhalt MD-Algorithmen Exploration Codegenerierung Validierung Entwurf Spezifikation
20
Handcodierte Versionen asynchrone Datenkommunikation Wie implementieren? »Synchronisation: Wann? Wo? So wenig wie möglich? »Broadcast oder Punkt-zu-Punkt? mpi_reduce? Zum Beispiel so: »Punkt-zu-Punkt Datenverteilung, asynchron »Barrier Synchronisation optional »Daten sammeln mit mpi_reduce (Kommunikation + Addition) Alternativ »Broadcast Datenverteilung, asynchron »Punkt-zu-Punkt zum Daten sammeln
21
Generierte Version Datenkommunikation synchron Daten sammeln mit mpi_reduce Performanz/Skalierbarkeit identisch zu handcoierter synchron-Version
22
Speed-up
23
Barrier Synchronisation auf Workstation Cluster Daten asynchron, ohne Barrier pax: ohne Barrier psx: mit Barrier
24
Zusammenfassung
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.