Software Prefetching Reduzierung der Miss-Rate Erfordert Prefetch-Instruktionen –Nicht blockierend –Erzeugen keine Ausnahmen Nicht blockierende Caches.

Slides:



Advertisements
Ähnliche Präsentationen
Fakultät für informatik informatik 12 technische universität dortmund Optimizations Peter Marwedel TU Dortmund Informatik 12 Germany 2009/01/17 Graphics:
Advertisements

Der Foliensatz ist unter einer Creative Commons-Lizenz lizenziert:
Heute Mathe, morgen DLR! Dr. Margrit Klitz
Wissenschaftliche Methodik
Umweltbezogene Entscheidungen - multidimensionale Bewertungsverfahren -
R What is this R thing, and is it worth some effort?
Stichwortverzeichnis
8 Zündung/Motormanagement
Lieber Leser, liebe Leserin,
Industrie 4.0 für die Ausbildung 4.0
Entwicklung epistemologischer Überzeugungen
Rehwild die richtige Altersbestimmung
Medientechnische Infrastrukturen für virtuelle und lokale Lernräume
Pflege & Finanzierung 01. Juni 2017 Dr. Sonja Unteregger
Das Arbeitgebermodell in Zeiten des
Microsoft® Office PowerPoint® 2007-Schulung
Neue Unterrichtsmaterialien zur Teilchenphysik Philipp Lindenau CERN | Herzlich willkommen! Präsentation mit Notizen hinterlegt!
Roomtour - Podio für Anfänger
Schulung für Microsoft® Office SharePoint® 2007
Was ist eigentlich Datenschutz?
Aktuelle Aspekte des Europäischen Zivilprozessrechts
Einführung in die Benutzung des Einkaufportals der Eckelmann AG
Wer wir sind! Ihr S-Campus-Team direkt im Campus Center. Sven Deussing
Mathematik 11 Analytische Geomerie.
Non-Standard-Datenbanken
Menger-Schwamm Ausgangsfigur in Stufe 0 ist ein Würfel
Wurzeln und Irrationalität nach U.Wagner, OHG Tuttlingen
am 09. September 2013 in Rostock
Metrik Sondermaschinenbau e. K.
Remo Zandonella Chancen und Herausforderungen der Digitalisierung auf die NRP-Zielgruppen Studie im Auftrag des SECO - Zwischenstand Fribourg, 24.
Retraite KIS August 2016 Meisterschwanden Dr. med. Stefan Roth
Morphonologie der Verben 2 Präteritum
Seh dir in Ruhe die Bilder an und lies, wie du mich erreichen kannst.
GUTES TUN IN DER WELTOING
Vorlesung 7 Themen: Geoinformationssysteme in der Wasserwirtschaft

Wie heißt du?.
JAHRESABSCHLUSS 2016 REGION NORDEN
Body-Mass-Index (BMI)
„Die richtige Fährte legen“ – zur Bedeutung der Fachkompetenz von MathematiklehrerInnen in der Sekundarstufe 1 Franz Pauer Institut für Fachdidaktik und.
Definition/Allgemeines:
Facharbeit in Klasse 5 „Der Traum vom Fliegen“
ɣ brain to write Erklärung des Rauschens Experimente
Forschungsmethoden in der Teilchenphysik
Forschungsmethoden in der Teilchenphysik
Vorlesung Eigenspannungen in Bauteilen und Werkstoffen
Studien zu Baryonen-Resonanzen in Charmonia-Zerfällen
Algorithmen und Datenstrukturen
Experimentelle Untersuchung von Hochvolt FGL-Ansteuerung
Komplexe Wechselstromrechnung
Das Standardmodell der Teilchenphysik im Schulunterricht
Bekannte Formeln aus der Mathematik
Neue Verfahren zur Messung der Fließeigenschafften von Frischbeton
Fraktale Maple D =
Christoph Lass, KN-NAS Theorie
Algorithmen und Datenstrukturen
Abiturprüfung Mathematik 2017 Baden-Württemberg Allgemeinbildende Gymnasien Pflichtteil Lösungen
Das Standardmodell der Teilchenphysik im Schulunterricht
Fraktale D =
Machine Learning mit R ist OK - aber auch mit großen Datenmengen?
Abiturprüfung Mathematik 2017 Baden-Württemberg Allgemeinbildende Gymnasien Pflichtteil Lösungen
Potenzen & Logarithmus
„DCF-Baukasten“ Lösungsvorschläge für die Praxis Forschungsinitiative Business Valuation WU Wien WP/StB MMag. Alexander Enzinger, CVA
Fraktale D =
Vernetzte IT-Systeme IT-Berufe Lernfeld 11
Weinhandlung Müller GmbH
Strecken des klassifizierten Straßennetzes
Kapitel 4 Entwicklungsunterschiede und internationaler Handel
Literatur im Dritten Reich
 Präsentation transkript:

Software Prefetching Reduzierung der Miss-Rate Erfordert Prefetch-Instruktionen –Nicht blockierend –Erzeugen keine Ausnahmen Nicht blockierende Caches Der Compiler fügt Prefetch-Instruktionen ein. Vorteil gegenüber Hardware Prefetching –Auch unregelmäßige Zugriffe können verbessert werden. Bei geringer Latenzzeit kann Unrolling verwendet werden. Bei langer Latenzzeit wird Software Pipelining eingesetzt.

Beispiel Software Prefetching Cache 8 KB direct-mapped, 16-byte cache lines Write back with write allocate Cache misses Array A exploits spatial locality: 3*100/2=150 misses Array B doesn‘t exploit spatial locality but twice temporal locality –One miss for i=0, j=0 via b[j][0] –100 misses for i=0, j=0..99 via b[j+1][0] Total of 251 cache misses real*8 a[3][100],b[101][3] for (i=0; i<3;i++) for (j=0;j<100;j++) a[i][j]=b[j][0]*b[j+1][0]

Example with Prefetching Ignoring No prefetching for first accesses Not suppressing prefetches at end of the loop real*8 a[3][100],b[101][3] for (j=0;j<100;j++) prefetch (b[j+8][0]); //b(j,0) for 7 iterations later prefetch (a[0][j+8]); //a(0,j) for 8 iterations later a[0][j]=b[j][0]*b[j+1][0]; for (i=1;i<3;i++) for (j=0;j<100;j++) prefetch (a[i][j+8]); //a(i,j) for 8 iterations later a[i][j]=b[j][0]*b[j+1][0] Misses 7 in first loop: b[0][0] … b[6][0] 4 in first loop: a[0][0],…,a[0][6] 2*4 in second loop: a[1][0],…,a[1][6],…, a[2][0],…,a[2][6]

Example: Result Instead of 251 only 19 cache misses Costs: 400 prefetch instructions Further optimization Elimination of every second prefetch for array A due to spatial locality.