Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Die SX-Series: Eine Erfolgsstory mit Fortsetzung

Ähnliche Präsentationen


Präsentation zum Thema: "Die SX-Series: Eine Erfolgsstory mit Fortsetzung"—  Präsentation transkript:

1 Die SX-Series: Eine Erfolgsstory mit Fortsetzung

2 Was bisher geschah: Ende 1994 wird die SX-4 als erste CMOS Implementierung eines PVP Supercomputers angekündigt Alle Welt glaubte, daß die Zukunft Architekturen mit Standardkomponenten gehören wird

3 Heute: Die SX-4 ist mit ca. 120 Installationen mit mehr als 900 CPUs die erfolgreichste Maschine ihrer Art PVP ist wieder auf Erfolgskurs höchste Effizienz in Anwendungen zukunftsträchtige Technologiebasis ausgewogenes, weil maßgeschneidertes Konzept

4 Effizienz & Leistung Die SX-4 demonstriert in Anwendungen bis zu 80 % und mehr Leistung im Parallelbetrieb Grundlagen ausgewogene Architektur konsequente Implementierung

5 Memory Performance STREAM Memory Bandwidth --- John D. McCalpin, Revised to Sat Jun 14 09:17:22 PDT 1997 All results are in MB/s MB=10^6 B, *not* 2^20 B Machine ID ncpus COPY SCALE ADD TRIAD NEC_SX_ NEC_SX_ NEC_SX_ NEC_SX_ NEC_SX_ NEC_SX_ Cray_T932_ E Cray_T932_ E Cray_T932_ E Cray_J Cray_J Cray_J SGI_Origin_2000_

6 Streams Benchmark TRIAD

7 Die Skalierungsperspektive
Mit der SX-4 ist der leistungsfähigste Clusteransatz verwirklicht 5 Standorte weltweit nutzen erfolgreich MultiNode Systeme mit bis zu 128 Vektor-CPUs Teraflopscomputing auf Vektorbasis ist reale Option

8 Und in Zukunft... „Vector Supercomputing has always offered the ultimate in processor performance“ SGI Website, 16. Juni 1998 aber auch: „A Supercomputer is a high performance memory with a fast CPU attached“ sinngemäß S. Cray

9 Warum eigentlich Vektor?
Leistungscharakteristik von Vektor und Skalarprozessoren Data Size Applications Vector Processing Scalar Processing Cache Size Limitation Performance

10 The System You Have Heard About

11 Welcomes You to the Future of High Performance Supercomputing

12 Das Produkt Die logische Fortführung der SX-4 Series
Setzt Renaissance des PVP Markets fort Anwender wählen PVP, weil sie JETZT funktionieren SX Systeme machen PVP Technologie erschwinglich Bietet eine brauchbare, flexible Architektur Single Node Shared Memory Modell Multi Node Distributed Memory Modell

13 Spezifikationen Single Node Multi Node
Bis zu 128 GFLOPS aus 16 x 8 GFLOPS Prozessoren Bis zu 128 GBytes Shared Main Memory Multi Node Bis zu 4 TFLOPS Bis zu 32 Nodes über SX-5 IXS Bis zu 512 Processors Bis zu 4 Tbyte Hauptspeicher

14 CMOS VLSI Technologie 0.25 Micron mit 5 Layern
Commodity, High Yield Geometry Wirtschaftliche Herstellung 64 Mbit SDRAM Memory Chips kostengünstige High-end Standardkomponenten Leistungsfähigkeit durch sehr hohe Bankzahl

15 Packaging Technologies
Chip Size Package 25 mm sq 1600+ Pinouts 0.5 mm grid Multi Chip Package 225 mm sq 11,000+ Pinouts 32 Layers

16 Single Node Processor 16 units MAX 16 CPUs STORAGE MAIN CACHE SR VR
MASK MASK LOGICAL MULT LOAD & STORE VR ADD/SHIFT DIVIDE STORAGE MAIN CACHE SCALAR SR EXECUTION UNIT XMU IOP

17 Vector Einheit: Architektur
Multiple parallele Vektor Pipelines 64 SX-4 kompatible Pipelines Add-Shift x 16 Multiply x 16 Logical x 16 Divide x 16 Jede Instruktion nutzt 16 Pipelines Automatische Hardware Parallelität Piplines arbeiten unabhängig voneinander

18 Pro Processor 8 GFLOPS Peak Vector 500 MFLOPS Peak Scalar
Mehr als 2 X SX-4 Series skalaren Durchsatz Weniger Konflikte der Skalareinheit Extra Load Path Double Issue Rate 64 GB / sec Speicherbandbreite

19 Memory Architecture Voller Non-blocking Crossbar Single Node
128 GB Kapazität 1 TB/s Bandbreite 1 CPU auf 2 MMU Einheiten Jede MMU Einheit hat 4 GB,1K Banks, 32 Gbytes/sec 64 Gbytes/second verfügbar für jede CPU Die höchste im Markt verfügbare Speicherleistung !

20 Streams Benchmark TRIAD
(SX-5 Werte extrapoliert)

21 The Single Node IOP IOP SDRAM technology 32,768 64-bit banks
32 4-GB cards 32 GB/s per card IOP IOP 3.15 GB/s x 4 IOPs 16 x 8 GF Vector Processors 1 CPU : 2 MMU (64 GB/s)

22 Multi Node Spezifikationen
Maximal 512 Prozessoren 16 Prozessoren per Node Maximum 32 Node Maximum Maximal 4 TB Hauptspeicher IXS Internode Crossbar 256 GB/s Gesamzbandbreite 8 GB/s Bandbreite Node zu Node

23 The Multi Node ....... IXS Internode Crossbar .... .... ....
Max.16 CPU CPU CPU .... CPU CPU CPU .... CPU CPU CPU .... CPU éÂãLâØ éÂãLâØ éÂãLâØ MM MM MM IOP MM •••• IOP MM •••• IOP MM •••• •••• •••• Node #1 Node #2 Node #32 8 GB/s x 2

24 Japanische Konzepte haben Zukunft
* *Aber Effizienz ist ein Muß!


Herunterladen ppt "Die SX-Series: Eine Erfolgsstory mit Fortsetzung"

Ähnliche Präsentationen


Google-Anzeigen