Linpack Benchmark Dient zur Performance Messung verschiedener Rechnerarchitekturen. Entstammt dem Linpack Projekt von 1979, der Autor Jack Dongarra ist.

Slides:



Advertisements
Ähnliche Präsentationen
Algorithmen und Datenstrukturen
Advertisements

Metriken in Netzwerken
Sicherheits-Regelungen Taschen, Mäntel, Fotoapparate etc. in die Garderobenschränke Dauer: 20 Minuten, keine Möglichkeit, vorzeitig zu verlassen Keine.
Der k-d-Baum Richard Göbel.
Christian Schindelhauer
Simulation komplexer technischer Anlagen
Schnelle Matrizenoperationen von Christian Büttner
Thema: Algorithmusdesignverfahren Vu Hoang Lam IMN04 HTWK-Leipzig Obersemminar Softwareentwicklung.
Klicke Dich mit der linken Maustaste durch das Übungsprogramm!
Sortierverfahren Richard Göbel.
Entwicklung der Programmiersprachen
Dynamische Programmierung (2) Matrixkettenprodukt
1 Vorlesung Informatik 2 Algorithmen und Datenstrukturen (02 – Funktionenklassen) Prof. Dr. Th. Ottmann.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (02 – Funktionenklassen) Tobias Lauer.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (02 – Funktionenklassen) Prof. Dr. Th. Ottmann.
WS Algorithmentheorie 08 – Dynamische Programmierung (2) Matrixkettenprodukt Prof. Dr. Th. Ottmann.
FS_Geschwindigkeitsmessung
Beispiele für Gleichungssysteme
Konzept der Residualgewinne
High Performance = Innovative Computer Systems + Efficient Algorithms Friedhelm Meyer auf der Heide 1 HEINZ NIXDORF INSTITUT Universität Paderborn Algorithmen.
Benchmark sparc vs. x86 von Axel Schmidt (94416)
III: Stochastische Modelle 18. Anwendungen von Markov-Ketten
III: Stochastische Modelle 15. Anwendungen von Markov-Ketten
Die Funktionsgleichung
Was sind Cluster und wie sind sie aufgebaut
Inhalt Der Cell Prozessor Aufbau des Cells Platine Block Diagramm
Komposition von quadratischen Formen
Kakuro Regeln und Strategien
Die Validierungsbeispiele der prEN ISO 10211
Subnetting – einfach! Die Grundlagen werden
Supercomputer FSJS-X3000 Lehrlingswettbewerb Züri Oberland 2013 Uster
Bau eines WOLKENSENSORS
Nachtragsfall 1: Leistungsänderung
Steuerung externer Komponenten über ein USB-Interface.
F.Ladstätter und R.Elsässer VP Wissenschaftliches Arbeiten und Präsentation 13. Dezember 2001.
Agenda Motivation Grundlagen der Matrix-Vektor-Multiplikation
Herzlich willkommen, zu einem kleinen Streifzug durch portier ®. In knapp 3 Minuten können Sie sich einen Überblick verschaffen.
Lizenz zum Forschen = 1 Euro Microsoft ® High Performance Computing-Programm für Bildungs- und Forschungseinrichtungen.
Wachstumsprozess Miriam Hülmbauer 3CK
INTEL Pentium 4 Prozessor
Zeit: 13h-15h Datum: Raum: IFW B42
Effiziente Algorithmen
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
Kosten / Nutzen-Optimierung komplexer Floating-Point- Berechnungen unter Ausnutzung variabler Präzision Programming Language Design and Implementation.
Parallel Matrix Multiplication
Bestimmen von Prozentwert, Grundwert und Prozentsatz
Algorithmen und Datenstrukturen SS 2005 Mag.Th. Hilpold u. Dr. A.Stritzinger Institut für Wirtschaftsinformatik- Software Engineering JKU Linz.
Lösung nichtlinear Gleichungssysteme
Anfang Präsentation 10. November, 2004 Effiziente Lösung von Gleichungssystemen In dieser Vorlesung wird die effiziente gemischt symbolisch/numerische.
Einführung ins Lösen von Textaufgaben (Textgleichungen)
Kalibrierung eines Mikrofons unter DASYLab
Algorithmen und Datenstrukturen Übungsmodul 11
Anwendung von Microcontollern
PHP: Operatoren und Kontrollstrukturen
Komplexität von Algorithmen
Einführung OpenSTA. Agenda - über OGVIT - Warum Lasttests - Was ist OpenSTA - Wie arbeitet OpenSTA - Skripte für OpenSTA - OpenSTA Collectors - Tests.
JOMP
Lineare Gleichungen mit 2 Variablen
Mehrfachausführungen Schleifen in VB 2010 ee. Programmidee: Der Anwender gibt eine Zahl ein, und das Programm gibt die Mehrfachen dieser Zahl aus (das.
Ingenieur – Erfinder - Pionier
Dr.-Ing. R. Marklein - GET I - WS 06/07 - V Grundlagen der Elektrotechnik I (GET I) Vorlesung am Fr. 08:30-10:00 Uhr; R (Hörsaal)
Anfang Präsentation 3. November, 2004 Tarjan’s Schleifenaufbrechalgorithmus In dieser Vorlesung wird ein Verfahren vorgestellt, welches in der Lage ist,
Lineare Gleichungen Allgemeine Einführung Äquivalenzumformungen
X. Übungsblatt – Aufgabe X Die Zahlendarstellung im IEEE Standard 754 (single precision): Allgemein gilt: Z = (-1) V * (1 + M) * 2 (E - BIAS) a)Welche.
Lineare Optimierung Nakkiye Günay, Jennifer Kalywas & Corina Unger Jetzt erkläre ich euch die einzelnen Schritte und gebe Tipps!
ReduSoft Ltd. Kurzbeschreibungen zu einigen Modulen, die im Programm MathProf 5.0 unter dem Themenbereich Algebra implementiert sind. Matrizen.
ReduSoft Ltd. Kurzbeschreibungen zu einigen Modulen, die im Programm MathProf 5.0 unter dem Themenbereich Algebra implementiert sind. Matrizen.
Das Vektorprodukt Wir definieren erneut eine Multiplikation zwischen zwei Vektoren, das Vektorprodukt, nicht zu verwechseln mit dem Skalarprodukt. Schreibe.
Lage, Schnitte und Schnittwinkel
 Präsentation transkript:

Linpack Benchmark Dient zur Performance Messung verschiedener Rechnerarchitekturen. Entstammt dem Linpack Projekt von 1979, der Autor Jack Dongarra ist einer der Initiatoren und Verwalter der top500 Die ursprüngliche Version ist in Fortran geschreiben. Es gibt allerdings bereits Java und C Portierungen. Ermittelt wird die Leistung der Anlage beim Lösen eines Linearen Gleichungssystems bei vorgegebener Komplexität.

Was sind Mflop/s ? „millions of floating point operations per second“ Eine Millionen Gleitpunktoperationen in der Sekunde. Gemeint sind hier 64 Bit Operationen entweder Addition oder Multiplikation. Gflop/s sind somit Eine Milliarde Operationen in der Sekunde. Tflop/s sind Eine Billionen Operationen in der Sekunde.

Wie errechnet sich die theoretische Spitzenleistung ? Die maximale Spitzenleistung kann als obere Performance Schranke betrachtet werden, sie wird nie durchbrochen. Zu Ihrer Bestimmung ermittelt man wie viele Gleitpunktoperationen ( gemeint sind Multiplikationen und Additionen ) während eines Taktzykluses durchgeführt werden können. Nun teilt man diese durch die Zyklenlänge.

Beispiel: Die Cray Y-MP/8 hat eine Zyklendauer von 6 ns. Daraus ergibt sich folgende Rechnung: Da die Cray Y-MP/8 mit 8 Prozessoren bestückt ist folgt daraus: 8 * 333 Mflop/s = 2667 Mflop/s maximale Spitzenleistung.

Linpack Benchmark Typen: Es gibt 3 Typen des Linpack Benchmarks. Typ 1 den Fortran n = 100 Benchmark. Typ 2 den n = 1000 Benchmark ( TPP, Best Effort ). Typ 3 den HPC Benchmark welcher zur Ermittlung der Top500 Werte dient.

Typ 1 oder Fortran n = 100 Benchmark Der erste Linpack Benchmark. Im Original reiner Fortran Code. Hier muss ein lineares Gleichungssystem der Ordnung n = 100 gelöst werden. Wobei bei diesem Typ lediglich mit Compiler Optimierungen ( Flags ) gearbeitet werden darf. Der Fortransourcecode darf nicht verändert werden. Nicht einmal die Kommentare.

Ausgabe des n=100 Benchmarks norm. resid resid machep x(1) x(n) E E E E E+00 times are reported for matrices of order 100 dgefa dgesl total mflops unit ratio times for array with leading dimension of E E E E E E E E E E E E times for array with leading dimension of E E E E E E E E E E E E

Typ 2 oder n = 1000 Benchmark (TPP, Best Effort) TPP ( Toward Peak Performance ) „Richtung Maximalleistung“ Diese Version arbeitet mit einer Matrix der Ordnung n = Ist im Original implementiert durch einen Fortrantreiber. Weniger strenge Regelung. Hier dürfen die Algorithmen ebenso wie die Sprache frei gewählt werden. Die verwendete Matrix muß jedoch identisch mit der Matrix des original Treibers von „netlib“ sein.

Typ 2 oder n = 1000 Benchmark (TPP, Best Effort) Die Genauigkeit muß folgenden Ansprüchen genügen: Wobei n die Problemgröße darstellt und die Maschinengenauigkeit. Die Maschinengenauigkeit bei IEEE Maschinen beträgt. Da bei bei diesem Benchmark die Problemgröße nicht verändert werden darf, muß hier mit n = 1000 gerechnet werden.

Einige Interessanten Werte der n=100 und n=1000 Benchmarks

Typ 3 oder HPC Benchmark HPC ( High Parallel Computing Benchmark ) Dieser Typus wird für den Top500 Report verwendet. Freie Wahl der Software ( Algorithmen, Sourcecode und Compiler ) und der Problemgröße. Hier muß allerdings auch die Matrix des „netlib“ Treibers verwendet werden.

Typ 3 oder HPC Benchmark Die Genauigkeit muß ebenfalls folgenden Ansprüchen genügen: Wobei n die Problemgröße darstellt und die Maschinengenauigkeit. Die Maschinengenauigkeit bei IEEE Maschinen beträgt. Der einzige Unterschied zum n=1000 Benchmark ist, daß ich die Problemgröße frei wählen darf.

Ergebnisse des HPC Benchmarks Rmax : Performance bei der größten Problemstellung Nmax : größte Problemstellung N1/2 : Größe bei der die Hälfte des Rmax erreicht wurde Rpeak : theoretische Maximalleistung

Die TOP500 Liste vom November 2000 im direktenVergleich

Interessante Links zum Thema FAQ´s und Verschiedene Benchmarks u.a Linpack Cluster in der top500 Hier kann eine individulle Liste zusammen gestellt werden.