Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Höchstleistungsrechnen in Deutschland in Forschung, Hochschule und Industrie Chancen und Nutzen Uwe Harms Harms Supercomputing Consulting Munich

Ähnliche Präsentationen


Präsentation zum Thema: "Höchstleistungsrechnen in Deutschland in Forschung, Hochschule und Industrie Chancen und Nutzen Uwe Harms Harms Supercomputing Consulting Munich"—  Präsentation transkript:

1 Höchstleistungsrechnen in Deutschland in Forschung, Hochschule und Industrie Chancen und Nutzen Uwe Harms Harms Supercomputing Consulting Munich

2 Themen: - warum Supercomputing ? - Gute alte Zeit - Rechnerarchitekturen - Top500 in Deutschland - Vergleich weltweit - Deutsche Zentren - industrieller Einsatz - Chancen - Nutzen - Zusammenfassung

3 Supercomputing oder Höchstleistungsrechnen Numerische Simulation versus Versuch mathematisches Modell eines technischen/physikalischen Problems numerisches Verfahren zur Lösung anwenden Änderungen am Modell und neue Rechnung -> es ist einfach, Parameterstudien durchzuführen Beispiel Optimierung eines Strömungskanals (HPSC 97) Experiment für eine Konfiguration 7000 DM, 4.5 Tage 8 Variationen: DM, 36 Tage numerische Simulation einer Konfiguration 1400 DM, 2 Tage 8 Variationen: DM, 16 Tage Kostenreduktion 79%, Zeitreduktion 66%

4 kommerzielle DV SAP R/3 Grossanwendungen, SD-Benchmark Bestellungen/h > Mitarbeiter, ca 200 Prozessoren Datamining in TB-Datenbanken Datawarehousing

5 Gute Alte Zeit /89 Cyber 765 MFlop/s (64K/250K Hauptspeicher 60 bit-Worte, 05/2 MB LCM, 1.4 GB Platte) Vektorrechner 1976 Cray MFlop/s, 16 MB Hauptspeicher 1985 Fujitsu/Siemens VP MFlop/s, 64 MB 1999 Fujitsu Siemens VPP MFlop/s, 16 GB -> 512 Proz 4.8 TFlop/s, 8TB NEC SX MFlop/s, 8 GB -> 512 Proz 4 TFlop/s, 4 TB Hitachi SR /12000 MFlop/s, 16 GB

6 Standardprozessoren - off-the-shelf RISC-Prozessoren Hewlett-Packard PA 86000/560 MHz 2240 MFlop/s PA 8700/800 MHz 3200 MFlop/s (2001) Compaq Alpha 720 MHz 1440 MFlop/s IBM Power MHz 800 MFlop/s SGI R MHz 600 MFlop/s SUN ULTRASparc MHz 900 MFlop/s Intel Pentium III (32 Bit) 1000 MHz 1000 MFlop/s (kostet 990 US$) Itanium (Merced) 750 MHz 3000 MFlop/s (6000 MFlop/s)

7 heutige Rechnerarchitekturen massiv-parallele Systeme (MPP): Cray T3E (Alpha), SGI SN1 (MIPS), IBM RS/6000 SP PowerPC symmetrischen Multiprozessorsysteme (SMP) und Cluster: Compaq GS320 (32 Proz.), HP V-Class (32), IBM RS/6000 SP (24), SGI Origin (128), SUN E10000 (Starfire) (64) parallele Vektorprozessoren (PVP) und Cluster: Fujitsu Siemens VPP5000, Hitachi SR8000 (?), NEC SX-5, Cray Inc. T90, SV1 Cluster of Workstations (COW): Fujitsu Siemens hpcLine auf Intel Pentium Basis mit SCI Interconnect Compaq Alpha-Cluster mit Myrinet oder Quadrics Interconnect

8 Top500 (J. Dongarra, H. Meuer, E. Strohmaier) n Linpack-Benchmark: LU-Faktorisierung (Strassen-Algorithm) n Hersteller n Rechner n Linpack-Leistung Rmax in GFlop/s (Milliarden 64-Bit Rechenoperationen pro Sekunde) n Land n Installations Jahr n Zahl der Prozessoren n Rpeak n Nmax n N1/2

9 Leistungssteigerungen seit 1993 in Deutschland June 1993 Nov % TotalSysteme Rmax Univers.Systeme27933 Rmax ForschungSysteme18678 Rmax IndustrieSysteme Rmax BehördeSysteme Rmax 2 90 HerstellerSysteme Rmax 1 105

10 Weltweite Leistungssteigerung seit 1993 June 1993 Nov 1999 % TotalRmax Academi a Rmax Researc h Rmax IndustryRmax Classifie d Vendor Rmax Classified 4438

11 Top500 Comparison world-wide World USA/CDN Japan Europe Deutschl. TotalSyste ms % 57 11%152 30%64 Rmax % % % 5363 Academ ic Syste ms Rmax 70 14% % 22 4% % 20 4% % 27 5% % % Resear ch Syste ms Rmax % % 71 14% % 29 6% % 24 57% % 6 1% % IndustrySyste ms Rmax % % % % 7 1% 281 1% 89 18% % 46 9% % Classifi ed Vendor Govern m Syste ms Rmax 56 11% % 43 9% % % 823 2% 3 1% 195

12 Rechnerarchitekturen in Deutschland MPPVectorSMPClust er Universität43 3 Forschung5 1 Industrie21322 Gov.+Herst. 1 2 IBM RS/6000 SP als MPP gezählt

13 Deutsche Höchstleistungsrechenzentren 1996 Wissenschaftrat: 2 bis 4 deutsche Höchstleistungsrechenzentren - Forschungszentrum Jülich, J. v. Neumann Inst. of Computing - Max-Planck-Gesellschaft (IPP Garching) - HWW Stuttgart (HLRS) - HLRB München, Leibnizrechenzentrum - in Diskussion HLRN Nord in Hannover/Berlin Forscher aus Deutschland können nach fachlicher Genehmigung die Rechner anteilig nutzen Problem der Länderhoheit beseitigt

14 Weltklasse Forschungszentren Computer (Prozessoren) RmaxTotal DWD Wetterdienst Cray T3E 1200 (812) 671 Max-PlanckCray T3E (812) 355 Forsch. Zentr. Jülich Cray T3E 1200 (540) 448 Cray T3E (540) 235 Cray T90 (12) = 94% of Research

15 Höchstleistungsrechenzentrum für Wissenschaft und Wirtschaft Betriebsgesellschaft in Stuttgart ComputerRmaxShares Univ. KarlsruheIBM SP2 (256) IBM SP (64) Univ. StuttgartCray T3E (540) % NEC SX-4 (40) NEC SX-5e (2x16), 32/48 GB RAM debis SystemhausCray SV1, IBM SP, HP N-Klasse 40% Porsche AGCray T90 10%

16 HLRB am Leibnizrechenzentrum Ausgesucht: Hitachi SR8000 F1, 1. Quartal 2000 Forderungen: Spitzenleistung TFlop/s, sustained 0.4 TFlop/s, Speicher GByte, Plattenspeicher 10 TByte, Bänder 600 TByte Kosten: Mio DM Mio DM Mio DM Betriebskosten über 6 Jahre 30 Mio DM Wartung : 21.5 Mio DM, Energie: 5 Mio DM, Zeitpersonal: 3.5 Mio DM Finanzierung: 60 Mio DM Bayern (Privatisierungserlöse), 30 Mio Bund Installation: 1. Quartal 2000, 2. Schritt 2002, Laufzeit bis Mitte 2005

17 Hitachi SR8000-F1 Anfangskonf Endausbau 2002 SMP-Knoten Prozessor/Knoten 8 (9 physisch) Prozessoren Spitzenleistung SMP 12 GFlop/s Spitzenleistung Syst GFlop/s 2016 GFlop/s Rmax (Linpack) 1029 GFlop/s 1540 GFlop/s (?) LRZ-Benchmark Effizienz >400 GFlop/s >600 GFlop/s

18 industrielle Nutzung Banken13 Telekom + Töchter 12 Chemie 7 Automobilindustri e 5 Mobilfunk 2 diverse 6 Filmindustrie 1

19 Automobilindustrie Volkswagen: 12 NEC SX-5 Prozessoren, 48 GFlop/s Spitzenleistung ->Crash 46 HP N MHZ 81 GFlop/s -> skalare Anwendungen, Nastran, Strömungsrechnung (CFD) SGI Workstation zum Pre- und Postprocessing Crash -> 10 Stunden turnaround unterschiedliche Crash-Vorschriften in den Ländern Danner-Crash 15 km für die Versicherung Tank-Flüssigkeit beim Crash Airbag-Sensorik nur Plattform -> 3.5 Tage etwa 300 bis 400 reale Crash pro Jahr, z.T. zufallsartig aus der Produktion

20 AUDI AG: Fujitsu Siemens VPP300/16 +VPP5000/4 mit je 38.4 GFlop/s SUN E Prozessoren 170 CAE sites mit SGI Octanes 1/2 Prozessoren als Arbeitsplätze 7 SGI Origin 2000 mit 40 R12000 Prozessoren Benchmark: StarCD (CFD) 16 Proz. O2000 = 1 Proz. VPP5000 (4100 Sek.) Crash 4 Proz. O2000 = Sek 1 Proz. VPP300 = 5400 Sek (Fakt.2.5) 1 Proz. VPP5000 = 1100 Sek (Fakt. 12)

21 DaimlerChrysler Fujitsu Siemens hpcLine 16 Knoten = 32 Prozessoren für elektromagnetische Verträglichkeit mit dem Programm FEKO

22 Cluster of Workstations und Workstation Cluster Fujitsu Siemens hpcLine (COW): Starter Kit 8 nodes = 16 Pentium III 650 MHz, 8x512 MB RAM, 8x20 GB Platte, SCI (Scalable Coherent Interface) + Software DM MwSt Workstation Cluster: vorhandene Intel- oder RISC-Workstations als Parallelrechner nutzen wenn Applikationssoftware das ermöglicht TTN - europ. Projekt

23 Zugriffsmöglichkeiten auf Supercomputer 1. Hochschule/Forschung: Projekt UNICORE und UNICOREPlus gemeinsame Oberfläche zum Zugriff, Projektleitung Forschungszentrum Jülich 2. Industrie: ASP Application Service Provider - debis Systemhaus HWW-Rechner mit Zugriff über das Web NEC etwa DM pro CPU Stunde, - Work-center, Bremen (Technische Hochschule) CAD, CAE, Datenbankanwendungen und mehr HP-Rechner, z.B. SMP der V-Klasse,

24 Literatur: Top500 Liste: im Juni zur Supercomputer Tagung Mannheim im November zur IEEE Supercomputing Tagung, USA Selektionsmöglichkeiten Reports und Analysen über die Top500 in Primeur: URL:http://www.hoise.com/analysis URL:http://www.hoise.com/primeur


Herunterladen ppt "Höchstleistungsrechnen in Deutschland in Forschung, Hochschule und Industrie Chancen und Nutzen Uwe Harms Harms Supercomputing Consulting Munich"

Ähnliche Präsentationen


Google-Anzeigen