Software Distributed Shared Memory Vortrag im Rahmen des Seminars Ausgewählte Themen in Hardwareentwurf und Optik Sarah Neuwirth, 05. Juli 2011.

Slides:



Advertisements
Ähnliche Präsentationen
Mobile Classroom S.OF.T – in the School of Tomorrow
Advertisements

Automated IT Change Planning
DNS-Resolver-Mechanismus
Karo IT Viehmarkt Neumarkt Karo IT Neumarkt GmbH | Tel.:
Microsoft Referenzarchitekturen- Infrastruktur für Connected Systems
Windows Vista für Entwickler
Telefonnummer.
PC-Cluster.
Dr. M. Schlottke Common Description of Web Services Source: P. Gerbert, 2002 Web Services allow to establish B2B e-commerce on the fly Web Services allow.
Fakultät für informatik informatik 12 technische universität dortmund Optimizations Peter Marwedel TU Dortmund Informatik 12 Germany 2009/01/17 Graphics:
Fakultät für informatik informatik 12 technische universität dortmund Universität Dortmund Middleware Peter Marwedel TU Dortmund, Informatik 12 Germany.
1 JIM-Studie 2010 Jugend, Information, (Multi-)Media Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.
On a Buzzword: Hierachical Structure David Parnas.
Normen für Windenergieanlagen
Studiengang Informatik FHDW
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil2.
Hier wird Wissen Wirklichkeit Computer Architecture – Part 10 – page 1 of 31 – Prof. Dr. Uwe Brinkschulte, Prof. Dr. Klaus Waldschmidt Part 10 Thread and.
Differentielles Paar UIN rds gm UIN
Datenmanagement in Sensornetzen PRESTO - Feedback gesteuertes Datenmanagement - SS 2007 Sören Wenzlaff.
Lehrstuhl Informatik III: Datenbanksysteme AstroGrid-D Meeting Heidelberg, Informationsfusion und -Integrität: Grid-Erweiterungen zum Datenmanagement.
Seite 1/21 Marcel Hoffmann 17. Mai 2001 Verteilte Kognitionen – Distributed Cognitions Systeme verteilter Kognitionen Schiffsnavigation,
n4 Streaming Media System
.NET – Quo Vadis? Dariusz Parys Developer Group Microsoft GmbH.
INSTITUT FÜR DATENTECHNIK UND KOMMUNIKATIONS- NETZE 1 Steffen Stein, TU Braunschweig, 2009 A Timing-Aware Update Mechanism for Networked Real-Time Systems.
20:00.
Performance-Steigerung durch schnelle Festplatten Ulrich Dinger.
Thin Client vs. Zero Client Key Account Government 04 / 2012 Tim Riedel Welche Vorteile bieten Thin Clients gegenüber Zero Clients?
Write the answers to these questions down on a piece of paper from your notebook. Was bedeutet Alles kann besser werden auf Engisch? What are some social.
Präsentation von Alexander Schönfeld
Institut AIFB, Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825 Towards Automatic Composition of Processes based on Semantic.
Eine Einführung in die CD-ROM
OpenSource Loadbalancer im Vergleich zu kommerziellen systemem Thomas stahl Diplomarbeit SS 2002.
ETS4 - Was ist neu? - Wie fange ich an? - Noch Fragen?
Vergleich der verschiedenen kommerziellen Datenbanksysteme
BAS5SE | Fachhochschule Hagenberg | Daniel Khan | S SPR5 MVC Plugin Development SPR6P.
3rd Review, Vienna, 16th of April 1999 SIT-MOON ESPRIT Project Nr Siemens AG Österreich Robotiker Technische Universität Wien Politecnico di Milano.
© All rights reserved. Zend Technologies, Inc. Jan Burkl System Engineer, Zend Technologies Zend Server im Cluster.
1 Ein kurzer Sprung in die tiefe Vergangenheit der Erde.
Technische Universität München Fakultät für Informatik Transactions AND Analytics OLTP AND OLAP in Main Memory Database Systems HyPer one size fits all...
The free XML Editor for Windows COOKTOP Semistrukturierte Daten 1 Vortrag Semistrukturierte Daten 1 COOKTOP The free XML-Editor for Windows
Gameplay Systems I Softwaretechnologie II (Teil 2): Simulation und 3D Programmierung SS 2012 Prof. Dr. phil. Manfred Thaller Referent: Christian Weitz.
Ressourcen in Process-Aware Information Systems Paul Hübner | | DBIS Seminar Betreuer : Andreas Lanz Quelle : Seven Fallacies.
GPU Computing Burim Kameri Fachhochschule Hannover (FHH)
Your name Bedeutung von Internet- Technologien Gruppe 1 Andreas Feuerstein Philipp Hochratner Christian Weinzinger.
Developer Day Webseiten auf Windows Azure hosten Britta Labud bbv Software Services AG Roland Krummenacher bbv Software Services AG.
Jan Hentschel Microsoft Expert Student Partner Windows Azure Windows Azure SQL Server auf IaaS How-to.
MongoDB on Linux-VM.
Mitglied der Helmholtz-Gemeinschaft Computation of Mutual Information Metric for Image Registration on Multiple GPUs Andrew V. Adinetz 1, Markus Axer 2,
XML IV: Cocoon 2.
Algorithm Engineering Parallele Algorithmen Stefan Edelkamp.
Algorithm Engineering Parallele Algorithmen Stefan Edelkamp.
Einführung in das Wissenschaftliche Arbeiten Andreas Hechenblaickner Programmiersprache Eiffel
Berner Fachhochschule Hochschule für Agrar-, Forst- und Lebensmittelwissenschaften HAFL Recent activities on ammonia emissions: Emission inventory Rindvieh.
Image Processing and Analysis Introduction. How do we see things ?
OPENTOUCH™ SUITE FOR MLE
VIRTUALISIERUNG AG-Tagung Informatik 2008.
Digital Dashboard Toolkit 2001 SharePoint Portal Server released targeting portal market SharePoint Team Services (STS) released as free add-
Ein Herz besteht aus vielen Räumen, A heart consist of many rooms, Manche groß, Andere klein, Many big, others small, aber das soll nicht heißen, dass.
Informations-Forum: SAP Interoperabilität
MINDREADER Ein magisch - interaktives Erlebnis mit ENZO PAOLO
Multiprozessoren: Herausforderung für die Software
UHZ / 2Roberto Mazzoni - Informatikdienste Geschichte MySql-Service im Portfolio der Informatikdienste seit 2000 Ablösung der Filemaker.
Cloud Your IT© «Unified Virtualization Approach»
Ressourcen in Process-Aware Information Systems Paul Hübner | | DBIS Seminar Betreuer : Andreas Lanz Quelle : Seven Fallacies.
Selectivity in the German Mobility Panel Tobias Kuhnimhof Institute for Transport Studies, University of Karlsruhe Paris, May 20th, 2005.
EN/FAD Ericsson GmbH EDD/ Information im 21. Jahrundert muss Erwünscht Relevant Erreichbar Schnell Kostenlos!?
Data Mining Spectral Clustering Junli Zhu SS 2005.
Clustering Clustering mit openMosix von Christian Wiese Stefan Krause.
1 Medienpädagogischer Forschungsverbund Südwest KIM-Studie 2014 Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.
Dr. Klaus Ruhlig Technology & Product Consulting Sun Microsystems, München Skalierbare Rechnerarchitekturen für ein DWH: Eine vergleichende Analyse.
 Präsentation transkript:

Software Distributed Shared Memory Vortrag im Rahmen des Seminars Ausgewählte Themen in Hardwareentwurf und Optik Sarah Neuwirth, 05. Juli 2011

Agenda 1. Motivation 2. Was ist Software Distributed Shared Memory? 3. Single System Images 4. Open Source Lösungen 5. Kommerzielle Lösungen 6. Beispiel: vNUMA 7. Fazit 8. Literaturverzeichnis 2Sarah Neuwirth - Software Distributed Shared Memory

Motivation Sarah Neuwirth - Software Distributed Shared Memory3 Transparentes Nutzen von verteilten Ressourcen Verteilter Speicher soll als Ganzes betrachtet und genutzt werden können Programme können effizient portiert werden Reine Softwarelösung

Performance und Speedup Sarah Neuwirth - Software Distributed Shared Memory Grafik aus [8] entnommen

Agenda 1. Motivation 2. Was ist Software Distributed Shared Memory? 3. Single System Images 4. Open Source Lösungen 5. Kommerzielle Lösungen 6. Beispiel: vNUMA 7. Fazit 8. Literaturverzeichnis 5Sarah Neuwirth - Software Distributed Shared Memory

Was ist Software DSM? (1) Sarah Neuwirth - Software Distributed Shared Memory6 Globaler, gemeinsam genutzter Speicher Gemeinsam genutzter, virtueller Speicher bietet die Abstraktion eines gemeinsam genutzten Adressraums oberhalb einer Message-Passing Architektur.

Was ist Software DSM? (3) Sarah Neuwirth - Software Distributed Shared Memory

Funktionsweise: Lesezugriff Sarah Neuwirth - Software Distributed Shared Memory Grafik aus [8] entnommen

Funktionsweise: Schreibzugriff Sarah Neuwirth - Software Distributed Shared Memory9 primary page copy of page Grafik aus [8] entnommen

Granularität Sarah Neuwirth - Software Distributed Shared Memory10 Wahl der Blockgröße hängt ab von: Kosten der Kommunikation 1 Byte Nachricht vs Byte Nachricht Lokalität der Applikation Üblicherweise wird Seiten-basierte Granularität mit 1k bis 8k Byte Größe gewählt. Größere Seitengröße => bessere Lokalität We expect that smaller page sizes (perhaps as low as 256 bytes) work well also, but we are not so confident about larger page sizes. -- Kai Li, 1989

Memory-Kohärenz Sarah Neuwirth - Software Distributed Shared Memory11 Memory-Kohärenz wird gewährleistet durch geeignete Wahl von: Konsistenz-Modell Kohärenz-Protokoll Page Synchronisation Page Ownership

Memory Konsistenz-Modelle Sarah Neuwirth - Software Distributed Shared Memory12 Vertrag zwischen Programmierer & System Falls Programmierer Regeln befolgt => Memory konsistent Ergebnis von Memory-Operationen vorhersagbar. Beispiel: Sequentielle Konsistenz (SC) Mögliche Ergebnispaare (u,v): (0,1) (1,1) (0,0) Aber: (1,0) nicht möglich P1P2 a1: A = 1;a2: u = B; b1: B = 1;b2: v = A;

Kohärenz-Protokolle Sarah Neuwirth - Software Distributed Shared Memory13 Page Synchronisation: Write-Invalidate Strategie Write-Update Strategie Page Ownership: fest dynamisch: zentral oder verteilt

Beispiel eines Kohärenz-Protokolls Sarah Neuwirth - Software Distributed Shared Memory14 schwarz:single-writer Schema violett: Ergänzung für multiple-writer Schema

Agenda 1. Motivation 2. Was ist Software Distributed Shared Memory? 3. Single System Images 4. Open Source Lösungen 5. Kommerzielle Lösungen 6. Beispiel: vNUMA 7. Fazit 8. Literaturverzeichnis 15Sarah Neuwirth - Software Distributed Shared Memory

Single System Image (1) Sarah Neuwirth - Software Distributed Shared Memory16 Simpler, offener Blick auf Systemressourcen und Aktivitäten aller Knoten Transparentes Nutzen von Clusterressourcen, unabhängig von physikalischer Lage Programme können effizient portiert werden A single system image (SSI) is the property of a system that hides the heterogeneous and distributed nature of the available resources and presents them to users and applications as a single unified computing resource. -- Buyya et al., 2001

Single System Image (2) Sarah Neuwirth - Software Distributed Shared Memory17 Hauptziele: Ein Prozessraum Ein Userinterface Ein Speicherraum Ein I/O-Raum Process Migration, falls dynamisches Load Balancing

Single System Image (3) Sarah Neuwirth - Software Distributed Shared Memory18 Nachteile: Einsatz erfolgt in eingeschränktem Gebrauch, z.B. speziell für Job Scheduling 100%ige Verteilung funktioniert nur bei gleichen Rechnern im Cluster Hardware und Software müssen kompatibel sein Aggregation nicht möglich

Agenda 1. Motivation 2. Was ist Software Distributed Shared Memory? 3. Single System Images 4. Open Source Lösungen 5. Kommerzielle Lösungen 6. Beispiel: vNUMA 7. Fazit 8. Literaturverzeichnis 19Sarah Neuwirth - Software Distributed Shared Memory

Open Source Lösungen für Software DSM Sarah Neuwirth - Software Distributed Shared Memory20 Linux-basierte Single System Images: Kerrighed openMosix OpenSSI

Vergleich der Open Source Lösungen Sarah Neuwirth - Software Distributed Shared Memory21 SSI FeatureKerrighedopenMosixOpenSSI Blick als ganze Maschine ps: lokale & entfernte Prozesse top: globale Memory-Statistiken PID: eindeutig & Cluster-weit mps: lokale Prozesse mtop: lokale Statistik PID: eindeutig, nur im lokalen Node ps: lokale & entfernte Prozesse top: nicht global PID: eindeutig & Cluster-weit globales Prozess Management dynamische Load Balancing der Cluster CPU dynimasche Load Balancing der Cluster CPU Single Process Space ja nein ja Single I/O Space unbekannt nein ja

Agenda 1. Motivation 2. Was ist Software Distributed Shared Memory? 3. Single System Images 4. Open Source Lösungen 5. Kommerzielle Lösungen 6. Beispiel: vNUMA 7. Fazit 8. Literaturverzeichnis 22Sarah Neuwirth - Software Distributed Shared Memory

vSMP Architektur von ScaleMP Sarah Neuwirth - Software Distributed Shared Memory Quelle [7]

ScaleMP Testsystem Sarah Neuwirth - Software Distributed Shared Memory24 ScaleMP: 13 Boards verbunden über Infiniband Jeweils 2 x Intel Xeon 2,5 GHz 13 x 16 = 208 GB RAM ~38 GB reserviert für vSMP = 170 GB verfügbar Tigerton (SMP Maschine als Referenz): 4 x Intel Xeon 2,93 GHz 1 x 64 GB RAM

Page Access Benchmark Sarah Neuwirth - Software Distributed Shared Memory25 Drei Benchmarks: read_from_other write_from_other write_self ScaleMPTigerton read_from_other μ s1.76 μ s write_from_other μ s2.29 μ s write_self 2.34 μ s2.10 μ s

Allocation Time Benchmark Sarah Neuwirth - Software Distributed Shared Memory26 Gemessen wurde Allocation Time für ein 15 GB Array mit Default Pages (4 kB) Großen Pages (2 MB) Default PagesGroße Pages Tigerton s27.0 s s20.3 s s15.8 s ScaleMP s196.2 s s187.4 s s179.2 s s121.7 s

Evaluation der vSMP Architektur Sarah Neuwirth - Software Distributed Shared Memory27 Aggregation von mehreren Boards => hoch akkumulierte Memory Bandweite (bis zu 95 GB/s) Hohe Remote Memory Access Zeit (20x) und Synchronisationszeit (150x) => Ausgeprägtes cc-NUMA Verhalten Applikationen von echten Usern profitieren von vSMP FIRE erreicht Speedup von ~80 SHEMAT-Suite erreicht Speedup von 41.5 Vgl. Benchmarks Schmidl et al. [6]

Lösungen von Symmetric Computing Sarah Neuwirth - Software Distributed Shared Memory28 Lösungen: Duet TM Departmental SuperComputer Trio TM Departmental SuperComputer Features: Large Single Shared Memory SSI Linux Support Distributed Symmetric Multi-Processing OpenMP, Pthreads, POSIX

Trio TM Departmental SuperComputer Sarah Neuwirth - Software Distributed Shared Memory29 Spezifikation des Testsystems: Prozessoren: 72 Cores (9x 8-Core 2.6 GHz AMD Opteron) Memory: 384 GB 1333 MHz DDR3 (4 GB DIMMs) Interconnect: 40 Gbps InfiniBand

Benchmark-Ergebnisse für Trio Sarah Neuwirth - Software Distributed Shared Memory30 TrioDepartmental SuperComputer: NCBI Blast Performance: 47-mal schneller für 64 Cores 53-mal schneller für 72 Cores HMMER3 Performance: 47-mal schneller für 64 Cores 53-mal schneller für 72 Cores NAMD Performance: 49-mal schneller für 64 Cores 55-mal schneller für 72 Cores

Agenda 1. Motivation 2. Was ist Software Distributed Shared Memory? 3. Single System Images 4. Open Source Lösungen 5. Kommerzielle Lösungen 6. Beispiel: vNUMA 7. Fazit 8. Literaturverzeichnis 31Sarah Neuwirth - Software Distributed Shared Memory

vNUMA (1) Sarah Neuwirth - Software Distributed Shared Memory Charakteristiken: DSM System integriert in Hypervisor Single-Writer/Multiple-Reader Write-Invalidate Protokoll Fixierter, dezentraler Manager Ziel: Anwenden unveränderter Binaries von SMP Architekturen

vNUMA (2) Sarah Neuwirth - Software Distributed Shared Memory33 Test-System: 8 HP rx2600 Server 900 MHz Itanium 2 Prozessoren eine CPU pro Server Gigabit Ethernet verbunden durch HP ProCurve 2780 Switch Linux kB Seiten (intern zerlegt in 4 kB Seiten)

Applikationen für Benchmarks Sarah Neuwirth - Software Distributed Shared Memory34 CG – Approximation für kleinsten Eigenwert einer großen, dünnbesetzten, symmetrischen, positiv definierten Matrix FFT – high-performance FFT Kernel. Jedem Prozessor werden n/p Zeilen einer Matrix zugeteilt. MG – vereinfachter multigrid Kernel

vNUMA: HPC Benchmarks Sarah Neuwirth - Software Distributed Shared Memory x-Achse: Anzahl an Knoten y-Achse: Speedup

vNUMA: Datenbank Benchmark Sarah Neuwirth - Software Distributed Shared Memory36 Getestete Queries: SELECT SEARCH AGGREGATE COMPLEX

Agenda 1. Motivation 2. Was ist Software Distributed Shared Memory? 3. Single System Images 4. Open Source Lösungen 5. Kommerzielle Lösungen 6. Beispiel: vNUMA 7. Fazit 8. Literaturverzeichnis 37Sarah Neuwirth - Software Distributed Shared Memory

Fazit Sarah Neuwirth - Software Distributed Shared Memory38 Reine Softwarelösung: Single System Images Art des Managers essentiell zur bestmöglichen Ausnutzung der zugrunde liegenden Prozessorarchitektur Nutzung von Common-of-the-Shelf Boards möglich Viele Ansätze, aber noch keine optimale Lösung gefunden => Alles eine Frage der Anwendung!

Agenda 1. Motivation 2. Was ist Software Distributed Shared Memory? 3. Single System Images 4. Open Source Lösungen 5. Kommerzielle Lösungen 6. Beispiel: vNUMA 7. Fazit 8. Literaturverzeichnis 39Sarah Neuwirth - Software Distributed Shared Memory

Literaturverzeichnis (1) Sarah Neuwirth - Software Distributed Shared Memory40 [1] Kai Li: Memory Coherence in Shared Virtual Memory Systems, ACM Transactions on Computer Systems, 7(4), [2] Lottiaux et al.: OpenMosix, OpenSSI and Kerrighed: A Comparative Study, [3] Zhou et al.: Relaxed Consistency and Coherence Granularity in DSM Systems: A Performance Evaluation, [4] Iftode et al.: Understanding Application Performance on Shared Virtual Memory Systems, In Proceedings of the 23rd Annual International Symposium on Computer Architecture, Mai

Literaturverzeichnis (2) Sarah Neuwirth - Software Distributed Shared Memory41 [5] Matthew Chapman: vNUMA: A Virtual Shared-Memory Multiprocessor, Proceedings of the 2009 conference on USENIX Annual technical conference, [6] Schmidl et al.: How to scale Nested OpenMP Applications on the ScaleMP vSMP Architecture, IEEE International Conference on Cluster Computing, [7] ScaleMP: Virtualization for Aggregation and The vSMP Architecture, Technical Whitepaper, [8] Vorlesungsskript zu Rechnerarchitektur II [9] Symmetric Computing,

Literaturverzeichnis (3) Sarah Neuwirth - Software Distributed Shared Memory42 [10] Buyya et al.: Single System Image, International Journal of High Performance Computing Applications, 15, 2001 [11] Bailey et al.: The NAS Parallel Benchmarks, The International Journal of Supercomputer Applications, 5(3), 1991

Ende Sarah Neuwirth - Software Distributed Shared Memory43 Vielen Dank für die Aufmerksamkeit!