Linpack Benchmark Dient zur Performance Messung verschiedener Rechnerarchitekturen. Entstammt dem Linpack Projekt von 1979, der Autor Jack Dongarra ist.

Slides:

Advertisements

Ähnliche Präsentationen

Algorithmen und Datenstrukturen

Advertisements

Metriken in Netzwerken

Sicherheits-Regelungen Taschen, Mäntel, Fotoapparate etc. in die Garderobenschränke Dauer: 20 Minuten, keine Möglichkeit, vorzeitig zu verlassen Keine.

Der k-d-Baum Richard Göbel.

Christian Schindelhauer

Simulation komplexer technischer Anlagen

Schnelle Matrizenoperationen von Christian Büttner

Thema: Algorithmusdesignverfahren Vu Hoang Lam IMN04 HTWK-Leipzig Obersemminar Softwareentwicklung.

Klicke Dich mit der linken Maustaste durch das Übungsprogramm!

Sortierverfahren Richard Göbel.

Entwicklung der Programmiersprachen

Dynamische Programmierung (2) Matrixkettenprodukt

1 Vorlesung Informatik 2 Algorithmen und Datenstrukturen (02 – Funktionenklassen) Prof. Dr. Th. Ottmann.

Vorlesung Informatik 2 Algorithmen und Datenstrukturen (02 – Funktionenklassen) Tobias Lauer.

Vorlesung Informatik 2 Algorithmen und Datenstrukturen (02 – Funktionenklassen) Prof. Dr. Th. Ottmann.

WS Algorithmentheorie 08 – Dynamische Programmierung (2) Matrixkettenprodukt Prof. Dr. Th. Ottmann.

FS_Geschwindigkeitsmessung

Beispiele für Gleichungssysteme

Konzept der Residualgewinne

High Performance = Innovative Computer Systems + Efficient Algorithms Friedhelm Meyer auf der Heide 1 HEINZ NIXDORF INSTITUT Universität Paderborn Algorithmen.

Benchmark sparc vs. x86 von Axel Schmidt (94416)

III: Stochastische Modelle 18. Anwendungen von Markov-Ketten

III: Stochastische Modelle 15. Anwendungen von Markov-Ketten

Die Funktionsgleichung

Was sind Cluster und wie sind sie aufgebaut

Inhalt Der Cell Prozessor Aufbau des Cells Platine Block Diagramm

Komposition von quadratischen Formen

Kakuro Regeln und Strategien

Die Validierungsbeispiele der prEN ISO 10211

Subnetting – einfach! Die Grundlagen werden

Supercomputer FSJS-X3000 Lehrlingswettbewerb Züri Oberland 2013 Uster

Bau eines WOLKENSENSORS

Nachtragsfall 1: Leistungsänderung

Steuerung externer Komponenten über ein USB-Interface.

F.Ladstätter und R.Elsässer VP Wissenschaftliches Arbeiten und Präsentation 13. Dezember 2001.

Agenda Motivation Grundlagen der Matrix-Vektor-Multiplikation

Herzlich willkommen, zu einem kleinen Streifzug durch portier ®. In knapp 3 Minuten können Sie sich einen Überblick verschaffen.

Lizenz zum Forschen = 1 Euro Microsoft ® High Performance Computing-Programm für Bildungs- und Forschungseinrichtungen.

Wachstumsprozess Miriam Hülmbauer 3CK

INTEL Pentium 4 Prozessor

Zeit: 13h-15h Datum: Raum: IFW B42

Effiziente Algorithmen

Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS

Information und Kommunikation Hartmut Klauck Universität Frankfurt SS

Kosten / Nutzen-Optimierung komplexer Floating-Point- Berechnungen unter Ausnutzung variabler Präzision Programming Language Design and Implementation.

Parallel Matrix Multiplication

Bestimmen von Prozentwert, Grundwert und Prozentsatz

Algorithmen und Datenstrukturen SS 2005 Mag.Th. Hilpold u. Dr. A.Stritzinger Institut für Wirtschaftsinformatik- Software Engineering JKU Linz.

Lösung nichtlinear Gleichungssysteme

Anfang Präsentation 10. November, 2004 Effiziente Lösung von Gleichungssystemen In dieser Vorlesung wird die effiziente gemischt symbolisch/numerische.

Einführung ins Lösen von Textaufgaben (Textgleichungen)

Kalibrierung eines Mikrofons unter DASYLab

Algorithmen und Datenstrukturen Übungsmodul 11

Anwendung von Microcontollern

PHP: Operatoren und Kontrollstrukturen

Komplexität von Algorithmen

Einführung OpenSTA. Agenda - über OGVIT - Warum Lasttests - Was ist OpenSTA - Wie arbeitet OpenSTA - Skripte für OpenSTA - OpenSTA Collectors - Tests.

Lineare Gleichungen mit 2 Variablen

Mehrfachausführungen Schleifen in VB 2010 ee. Programmidee: Der Anwender gibt eine Zahl ein, und das Programm gibt die Mehrfachen dieser Zahl aus (das.

Ingenieur – Erfinder - Pionier

Dr.-Ing. R. Marklein - GET I - WS 06/07 - V Grundlagen der Elektrotechnik I (GET I) Vorlesung am Fr. 08:30-10:00 Uhr; R (Hörsaal)

Anfang Präsentation 3. November, 2004 Tarjan’s Schleifenaufbrechalgorithmus In dieser Vorlesung wird ein Verfahren vorgestellt, welches in der Lage ist,

Lineare Gleichungen Allgemeine Einführung Äquivalenzumformungen

X. Übungsblatt – Aufgabe X Die Zahlendarstellung im IEEE Standard 754 (single precision): Allgemein gilt: Z = (-1) V * (1 + M) * 2 (E - BIAS) a)Welche.

Lineare Optimierung Nakkiye Günay, Jennifer Kalywas & Corina Unger Jetzt erkläre ich euch die einzelnen Schritte und gebe Tipps!

ReduSoft Ltd. Kurzbeschreibungen zu einigen Modulen, die im Programm MathProf 5.0 unter dem Themenbereich Algebra implementiert sind. Matrizen.

ReduSoft Ltd. Kurzbeschreibungen zu einigen Modulen, die im Programm MathProf 5.0 unter dem Themenbereich Algebra implementiert sind. Matrizen.

Das Vektorprodukt Wir definieren erneut eine Multiplikation zwischen zwei Vektoren, das Vektorprodukt, nicht zu verwechseln mit dem Skalarprodukt. Schreibe.

Lage, Schnitte und Schnittwinkel

Präsentation transkript:

Linpack Benchmark Dient zur Performance Messung verschiedener Rechnerarchitekturen. Entstammt dem Linpack Projekt von 1979, der Autor Jack Dongarra ist einer der Initiatoren und Verwalter der top500 Die ursprüngliche Version ist in Fortran geschreiben. Es gibt allerdings bereits Java und C Portierungen. Ermittelt wird die Leistung der Anlage beim Lösen eines Linearen Gleichungssystems bei vorgegebener Komplexität.

Was sind Mflop/s ? „millions of floating point operations per second“ Eine Millionen Gleitpunktoperationen in der Sekunde. Gemeint sind hier 64 Bit Operationen entweder Addition oder Multiplikation. Gflop/s sind somit Eine Milliarde Operationen in der Sekunde. Tflop/s sind Eine Billionen Operationen in der Sekunde.

Wie errechnet sich die theoretische Spitzenleistung ? Die maximale Spitzenleistung kann als obere Performance Schranke betrachtet werden, sie wird nie durchbrochen. Zu Ihrer Bestimmung ermittelt man wie viele Gleitpunktoperationen ( gemeint sind Multiplikationen und Additionen ) während eines Taktzykluses durchgeführt werden können. Nun teilt man diese durch die Zyklenlänge.

Beispiel: Die Cray Y-MP/8 hat eine Zyklendauer von 6 ns. Daraus ergibt sich folgende Rechnung: Da die Cray Y-MP/8 mit 8 Prozessoren bestückt ist folgt daraus: 8 * 333 Mflop/s = 2667 Mflop/s maximale Spitzenleistung.

Linpack Benchmark Typen: Es gibt 3 Typen des Linpack Benchmarks. Typ 1 den Fortran n = 100 Benchmark. Typ 2 den n = 1000 Benchmark ( TPP, Best Effort ). Typ 3 den HPC Benchmark welcher zur Ermittlung der Top500 Werte dient.

Typ 1 oder Fortran n = 100 Benchmark Der erste Linpack Benchmark. Im Original reiner Fortran Code. Hier muss ein lineares Gleichungssystem der Ordnung n = 100 gelöst werden. Wobei bei diesem Typ lediglich mit Compiler Optimierungen ( Flags ) gearbeitet werden darf. Der Fortransourcecode darf nicht verändert werden. Nicht einmal die Kommentare.

Ausgabe des n=100 Benchmarks norm. resid resid machep x(1) x(n) E E E E E+00 times are reported for matrices of order 100 dgefa dgesl total mflops unit ratio times for array with leading dimension of E E E E E E E E E E E E times for array with leading dimension of E E E E E E E E E E E E

Typ 2 oder n = 1000 Benchmark (TPP, Best Effort) TPP ( Toward Peak Performance ) „Richtung Maximalleistung“ Diese Version arbeitet mit einer Matrix der Ordnung n = Ist im Original implementiert durch einen Fortrantreiber. Weniger strenge Regelung. Hier dürfen die Algorithmen ebenso wie die Sprache frei gewählt werden. Die verwendete Matrix muß jedoch identisch mit der Matrix des original Treibers von „netlib“ sein.

Typ 2 oder n = 1000 Benchmark (TPP, Best Effort) Die Genauigkeit muß folgenden Ansprüchen genügen: Wobei n die Problemgröße darstellt und die Maschinengenauigkeit. Die Maschinengenauigkeit bei IEEE Maschinen beträgt. Da bei bei diesem Benchmark die Problemgröße nicht verändert werden darf, muß hier mit n = 1000 gerechnet werden.

Einige Interessanten Werte der n=100 und n=1000 Benchmarks

Typ 3 oder HPC Benchmark HPC ( High Parallel Computing Benchmark ) Dieser Typus wird für den Top500 Report verwendet. Freie Wahl der Software ( Algorithmen, Sourcecode und Compiler ) und der Problemgröße. Hier muß allerdings auch die Matrix des „netlib“ Treibers verwendet werden.

Typ 3 oder HPC Benchmark Die Genauigkeit muß ebenfalls folgenden Ansprüchen genügen: Wobei n die Problemgröße darstellt und die Maschinengenauigkeit. Die Maschinengenauigkeit bei IEEE Maschinen beträgt. Der einzige Unterschied zum n=1000 Benchmark ist, daß ich die Problemgröße frei wählen darf.

Ergebnisse des HPC Benchmarks Rmax : Performance bei der größten Problemstellung Nmax : größte Problemstellung N1/2 : Größe bei der die Hälfte des Rmax erreicht wurde Rpeak : theoretische Maximalleistung

Die TOP500 Liste vom November 2000 im direktenVergleich

Interessante Links zum Thema FAQ´s und Verschiedene Benchmarks u.a Linpack Cluster in der top500 Hier kann eine individulle Liste zusammen gestellt werden.