Harms Supercomputing Consulting

Harms Supercomputing Consulting
Höchstleistungsrechnen in Deutschland in Forschung, Hochschule und Industrie Chancen und Nutzen Uwe Harms Harms Supercomputing Consulting Munich

Themen: - warum Supercomputing ? - Gute alte Zeit
- Rechnerarchitekturen - Top500 in Deutschland - Vergleich weltweit - Deutsche Zentren - industrieller Einsatz - Chancen - Nutzen - Zusammenfassung

Supercomputing oder Höchstleistungsrechnen
Numerische Simulation versus Versuch mathematisches Modell eines technischen/physikalischen Problems numerisches Verfahren zur Lösung anwenden Änderungen am Modell und neue Rechnung -> es ist einfach, Parameterstudien durchzuführen Beispiel Optimierung eines Strömungskanals (HPSC 97) Experiment für eine Konfiguration 7000 DM, 4.5 Tage 8 Variationen: DM, 36 Tage numerische Simulation einer Konfiguration 1400 DM, 2 Tage 8 Variationen: DM, 16 Tage Kostenreduktion 79%, Zeitreduktion 66%

kommerzielle DV SAP R/3 Grossanwendungen, SD-Benchmark Bestellungen/h > Mitarbeiter, ca 200 Prozessoren Datamining in TB-Datenbanken Datawarehousing

Gute Alte Zeit 1973 - 1988/89 Cyber 76 5 MFlop/s
(64K/250K Hauptspeicher 60 bit-Worte, 05/2 MB LCM, 1.4 GB Platte) Vektorrechner 1976 Cray MFlop/s, 16 MB Hauptspeicher 1985 Fujitsu/Siemens VP MFlop/s, 64 MB 1999 Fujitsu Siemens VPP MFlop/s, 16 GB -> 512 Proz 4.8 TFlop/s, 8TB NEC SX MFlop/s, 8 GB -> 512 Proz 4 TFlop/s, 4 TB Hitachi SR /12000 MFlop/s, 16 GB

Standardprozessoren - off-the-shelf
RISC-Prozessoren Hewlett-Packard PA 86000/560 MHz MFlop/s PA 8700/800 MHz MFlop/s (2001) Compaq Alpha 720 MHz MFlop/s IBM Power MHz MFlop/s SGI R MHz MFlop/s SUN ULTRASparc MHz MFlop/s Intel Pentium III (32 Bit) MHz MFlop/s (kostet 990 US$) Itanium (Merced) MHz MFlop/s (6000 MFlop/s)

heutige Rechnerarchitekturen
massiv-parallele Systeme (MPP): Cray T3E (Alpha), SGI SN1 (MIPS), IBM RS/6000 SP PowerPC symmetrischen Multiprozessorsysteme (SMP) und Cluster: Compaq GS320 (32 Proz.), HP V-Class (32), IBM RS/6000 SP (24), SGI Origin (128), SUN E10000 (Starfire) (64) parallele Vektorprozessoren (PVP) und Cluster: Fujitsu Siemens VPP5000, Hitachi SR8000 (?), NEC SX-5, Cray Inc. T90, SV1 Cluster of Workstations (COW): Fujitsu Siemens hpcLine auf Intel Pentium Basis mit SCI Interconnect Compaq Alpha-Cluster mit Myrinet oder Quadrics Interconnect

(J. Dongarra, H. Meuer, E. Strohmaier)
Top500 (J. Dongarra, H. Meuer, E. Strohmaier) Linpack-Benchmark: LU-Faktorisierung (Strassen-Algorithm) Hersteller Rechner Linpack-Leistung Rmax in GFlop/s (Milliarden 64-Bit Rechenoperationen pro Sekunde) Land Installations Jahr Zahl der Prozessoren Rpeak Nmax N1/2

Leistungssteigerungen seit 1993 in Deutschland
June 1993 Nov. 1999 % Total Systeme 59 64 108 Rmax 69 5363 7772 Univers. Systeme 27 9 33 Rmax 34 842 2476 Forschung Systeme 18 6 78 Rmax 21 1811 8624 Industrie Systeme Rmax 10 8 46 2515 460 31438 Behörde Systeme Rmax 2 90 Hersteller Systeme Rmax 1 105

Weltweite Leistungssteigerung seit 1993
June 1993 Nov 1999 % Total Rmax 1168 50969 4364 Academia Rmax 350 7358 2102 Research Rmax 500 23420 4684 Industry Rmax 200 12741 6370 Classified Vendor Rmax 118 7451 6314 Classified 4438

Top500 Comparison world-wide
USA/CDN Japan Europe Deutschl. Total Systems 500 % % % 64 Rmax 50969 % % % 5363 Academic Systems Rmax 70 14% % % % % % % % 9 % Research Systems Rmax % % % % % % % % % % Industry Systems Rmax % % % % 7 1% % % % % % Classified Vendor Governm Systems Rmax 56 11% % % % 1 123 % % % 195

Rechnerarchitekturen in Deutschland
MPP Vector SMP Cluster Universität 4 3 3 Forschung 5 1 Industrie 21 3 22 Gov.+Herst. 1 2 IBM RS/6000 SP als MPP gezählt

Deutsche Höchstleistungsrechenzentren
1996 Wissenschaftrat: 2 bis 4 deutsche Höchstleistungsrechenzentren - Forschungszentrum Jülich, J. v. Neumann Inst. of Computing - Max-Planck-Gesellschaft (IPP Garching) - HWW Stuttgart (HLRS) - HLRB München, Leibnizrechenzentrum - in Diskussion HLRN Nord in Hannover/Berlin Forscher aus Deutschland können nach fachlicher Genehmigung die Rechner anteilig nutzen Problem der Länderhoheit beseitigt

Weltklasse Forschungszentren
Computer (Prozessoren) Rmax Total DWD Wetterdienst Cray T3E 1200 (812) 671 Max-Planck Cray T3E (812) 355 Forsch. Zentr. Jülich Cray T3E 1200 (540) 448 Cray T3E (540) 235 Cray T90 (12) 22 1709 = 94% of Research

Höchstleistungsrechenzentrum für Wissenschaft und Wirtschaft Betriebsgesellschaft in Stuttgart
Computer Rmax Shares Univ. Karlsruhe IBM SP2 (256) IBM SP (64) 44 42 16.6 Univ. Stuttgart Cray T3E (540) 341 16.6% NEC SX-4 (40) NEC SX-5e (2x16), 32/48 GB RAM 77 123 debis Systemhaus Cray SV1, IBM SP, HP N-Klasse 40% Porsche AG Cray T90 10%

HLRB am Leibnizrechenzentrum
Ausgesucht: Hitachi SR8000 F1, 1. Quartal 2000 Forderungen: Spitzenleistung TFlop/s, sustained 0.4 TFlop/s, Speicher GByte, Plattenspeicher 10 TByte, Bänder 600 TByte Kosten: Mio DM Mio DM Mio DM Betriebskosten über 6 Jahre Mio DM Wartung : 21.5 Mio DM, Energie: 5 Mio DM, Zeitpersonal: 3.5 Mio DM Finanzierung: 60 Mio DM Bayern (Privatisierungserlöse), 30 Mio Bund Installation: 1. Quartal 2000, 2. Schritt 2002, Laufzeit bis Mitte 2005

Hitachi SR8000-F1 Anfangskonf. 2000 Endausbau 2002 SMP-Knoten 112 168 Prozessor/Knoten 8 (9 physisch) 8 (9 physisch) Prozessoren 896 1344 Spitzenleistung SMP 12 GFlop/s 12 GFlop/s Spitzenleistung Syst. 1344 GFlop/s 2016 GFlop/s Rmax (Linpack) 1029 GFlop/s 1540 GFlop/s (?) LRZ-Benchmark Effizienz >400 GFlop/s >600 GFlop/s

industrielle Nutzung Banken 13 Telekom + Töchter 12 Chemie 7 Automobilindustrie 5 Mobilfunk 2 diverse 6 Filmindustrie 1

Automobilindustrie Volkswagen: 12 NEC SX-5 Prozessoren, 48 GFlop/s Spitzenleistung ->Crash 46 HP N MHZ GFlop/s -> skalare Anwendungen, Nastran, Strömungsrechnung (CFD) SGI Workstation zum Pre- und Postprocessing Crash -> 10 Stunden turnaround unterschiedliche Crash-Vorschriften in den Ländern Danner-Crash 15 km für die Versicherung Tank-Flüssigkeit beim Crash Airbag-Sensorik nur Plattform -> 3.5 Tage etwa 300 bis 400 reale Crash pro Jahr, z.T. zufallsartig aus der Produktion

Fujitsu Siemens VPP300/16 +VPP5000/4 mit je 38.4 GFlop/s
AUDI AG: Fujitsu Siemens VPP300/16 +VPP5000/4 mit je 38.4 GFlop/s SUN E Prozessoren 170 CAE sites mit SGI Octanes 1/2 Prozessoren als Arbeitsplätze 7 SGI Origin 2000 mit 40 R12000 Prozessoren Benchmark: StarCD (CFD) 16 Proz. O2000 = 1 Proz. VPP5000 (4100 Sek.) Crash 4 Proz. O = Sek 1 Proz. VPP300 = Sek (Fakt.2.5) 1 Proz. VPP5000 = Sek (Fakt. 12)

Fujitsu Siemens hpcLine 16 Knoten = 32 Prozessoren
DaimlerChrysler Fujitsu Siemens hpcLine 16 Knoten = 32 Prozessoren für elektromagnetische Verträglichkeit mit dem Programm FEKO

Cluster of Workstations und Workstation Cluster
Fujitsu Siemens hpcLine (COW): Starter Kit 8 nodes = 16 Pentium III 650 MHz, 8x512 MB RAM, 8x20 GB Platte, SCI (Scalable Coherent Interface) + Software DM MwSt Workstation Cluster: vorhandene Intel- oder RISC-Workstations als Parallelrechner nutzen wenn Applikationssoftware das ermöglicht TTN - europ. Projekt

Zugriffsmöglichkeiten auf Supercomputer
1. Hochschule/Forschung: Projekt UNICORE und UNICOREPlus gemeinsame Oberfläche zum Zugriff, Projektleitung Forschungszentrum Jülich 2. Industrie: ASP Application Service Provider - debis Systemhaus HWW-Rechner mit Zugriff über das Web NEC etwa DM pro CPU Stunde, - Work-center, Bremen (Technische Hochschule) CAD, CAE, Datenbankanwendungen und mehr HP-Rechner, z.B. SMP der V-Klasse,

Selektionsmöglichkeiten
Literatur: Top500 Liste: im Juni zur Supercomputer Tagung Mannheim im November zur IEEE Supercomputing Tagung, USA Selektionsmöglichkeiten Reports und Analysen über die Top500 in Primeur: URL: URL:

Harms Supercomputing Consulting

Ähnliche Präsentationen

Präsentation zum Thema: "Harms Supercomputing Consulting"— Präsentation transkript:

Ähnliche Präsentationen

Über Projekt

Feedback

Anmelden

Anmeldung über soziales Netzwerk:

Harms Supercomputing Consulting

Ähnliche Präsentationen

Präsentation zum Thema: "Harms Supercomputing Consulting"— Präsentation transkript:

Ähnliche Präsentationen

Über Projekt

Feedback