EPIC, IA-64 und Itanium Eine Kurzpräsentation von Jan Hübbers bei Prof. Dr.-Ing. Risse im Fach Labor Rechnerstrukturen an der Hochschule Bremen 12.12.2002.

Slides:

Advertisements

Ähnliche Präsentationen

CPU (Central Processor Unit)

Advertisements

Intel ITX Board mit Atom CPU

Vom HW-Automaten zum Prozessor

PC-Kauf im IV. Quartal 1998 Dipl.-Ing. Jörg Dannenberg

4.5 Virtueller Speicher Problemsituation: Programme und Daten sind zu groß für den verfügbaren Arbeitsspeicher Frühere Lösung Aufspaltung der Programme.

CPI Der einzelne Befehl braucht immer noch 5 Zyklen (stimmt nicht ganz, einige brauchen weniger!) Was verbessert wird, ist der Durchsatz = #Befehle /

KA – Rechnerarchitektur I ____________________________________________________________________________________________ ____________________________________________________________________________________________.

2.4 VLIW und EPIC-Prozessoren

Technische Universität Dortmund

PentiumPro Vs. Pentium MMX

Der Crusoe-Prozessor von Transmeta

Migration Informix - MS-SQL Server FH HRZ FH Darmstadt Claus Rode

A Historical Perspective XENIX MS-DOS Windows Windows 3.0 Windows 3.1 Windows for Workgroups Windows NT 3.1 Windows NT 3.5 Windows 95 Windows NT 3.51.

Network-on-Chip basierende Laufzeitsysteme für dynamisch rekonfigurierbare Hardware Ronald Hecht Institut für Mikroelektrotechnik und Datentechnik Universität.

Entwicklungstrends bei Mikroprozessoren

2.5 Vektorrechner & Multimedia-Erweiterungen

Fakultät für informatik informatik 12 technische universität dortmund 2.4 VLIW und EPIC-Prozessoren Peter Marwedel Informatik 12 TU Dortmund 2011/04/08.

1 Energiebewusste Compilierung für digitale Signalprozessoren Markus Lorenz Peter Marwedel Universität Dortmund Lehrstuhl Informatik XII Projekt Prozessorarchitekturen.

Funktionsmerkmale und Vorteile Die Intel Core i7 Prozessoren der zweiten Generation verfügen über folgende Funktionsmerkmale: Die Intel® Turbo-Boost-Technik.

Kapitel 3 5 Rechnerorganisation

W. Oberschelp G. Vossen Kapitel 7.

© 2006 W. Oberschelp, G. Vossen Rechneraufbau & Rechnerstrukturen, Folie 8.1.

Rechneraufbau & Rechnerstrukturen, Folie 10.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 10.

ilmenau.de Exploiting Pocket PC. ilmenau.de Exploiting Pocket PC PocketPC existiert seit über 5 Jahren (Windows CE seit ca. 10)

Vorlesung 4: Memory Universität Bielefeld Technische Fakultät AG Rechnernetze und verteilte Systeme Peter B. Ladkin Wintersemester.

Vorlesung 2 Rechnerarchitektur Universität Bielefeld Technische Fakultät AG Rechnernetze und verteilte Systeme Peter B. Ladkin

Vorlesung 3: Verschiedenes Universität Bielefeld Technische Fakultät AG Rechnernetze und verteilte Systeme Peter B. Ladkin

Vorlesung 2 Rechnerarchitektur Peter B. Ladkin Wintersemester 2001/2002 Universität Bielefeld Technische Fakultät.

Rechnerarchitektur Vorlesung 2 Peter B. Ladkin

Fachgebiet Software Engineering Übersicht © Albert Zündorf, Kassel University Compilerbau und Reverse Engineering m Vorlesung im Wintersemester.

Hochperformante Mikroprozessoren - 6

Beispiele für Mikroprozessoren 9

Von: Antoni Gazali Clarkson Laryea

n4 Streaming Media System

AMDs Next Generation Die Hammer Familie Eine Kurzpräsentation von Frank Grümmert bei Herrn Prof. Dr.-Ing. Risse für das RST-Labor.

Open Source Prozessor Leon2 Peer Royla und Marco Siebert RST-Labor WS 04/05 Prof. Dr.-Ing. Thomas Risse.

Inhalt Der Cell Prozessor Aufbau des Cells Platine Block Diagramm

Matrix Multiplication on CUDA

1 Vorlesung 3 Verschiedenes Peter B. Ladkin

Duo- und Quad Prozessor-Architektur

Hauptspeicher- Datenbanksysteme

Präsentation von Alexander Schönfeld

Aufbau eines von-Neumann- Rechners Marcel Waldvogel.

INTEL Pentium 4 Prozessor

Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Softwaretechnologie II (Teil I): Simulation und 3D Programmierung Prof.

Das Betriebssystem.

DW-Architektur: Row Store vs Column Store

Service Computing Prof. Dr. Ramin Yahyapour IT & Medien Centrum 19. Januar 2010.

3.4 CPU-Chips und Busse CPU-Chips

Signal-Prozessoren DSV1, 2009, Hhrt, 1 Mikro-Prozessor Von Neumann-Architektur Daten und Programmcode im gleichen Speicher => Sequenzieller Zugriff auf.

Computerorientierte Physik VORLESUNG und Übungen Vorlesung Zeit: Di., 8.30 – Uhr Ort: Hörsaal 5.01, Institut für Experimentalphysik, Universitätsplatz.

Computerorientierte Physik VORLESUNG

Ein Vortrag von Simon Bayer

Anwendung von Microcontollern

Programmieren in Assembler

Systemsoftware und Betriebssysteme

DDR vs. RDRAM Ein Vergleich von Speichertechnologien Bernhard Fiser Stefan Schönauer.

Rechnerarchitekturen

Fingerprint Matching On Card

Moderne Rechner-Architekturen

Die Intel Architecture 64 (IA-64)

Central Processing Unit von David Kleuker und Thomas Auner

Prozessoren im Jahre 2006 von Tobias Schulz.

Geschichte der Mikroprozessoren (vom 8086 bis zum Pentium Dual Core

Rechnerstrukturen Rechnerarchitektur von Intel 8088 BIT WiSe , Referent: Euvhen Berlev.

Aktueller Stand der Technik. Auf dem Markt sind heute bereits 64-Bit Mikrocontroller. Die meiste Verwendung finden allerdings noch immer die 8-Bit Modelle.

Vom HW-Automaten zum Prozessor

מבוא למערכות מחשב ואסמבלי

Shared Memory Programmierung: Grundlagen

Präsentation transkript:

EPIC, IA-64 und Itanium Eine Kurzpräsentation von Jan Hübbers bei Prof. Dr.-Ing. Risse im Fach Labor Rechnerstrukturen an der Hochschule Bremen

Zielsetzung des Itaniums Parallelität ohne Laufzeit Overhead Minimierung von Latenzzeiten Überwindung von Ressourcenknappheit

Was ist EPIC? (1) Explicit Parallel Instruction Computing Compiler findet parallelisierbare Instruktionen (ILP, Instruction Level Parallelism) Reorganisation des Bytecodes zu parallelen Datenströmen zur Compilerzeit Hohe Ausnutzung der parallelen Funktionseinheiten Mehrere parallele Instruktionen pro Takt

Was ist EPIC? (2) Sehr starke Determinierung der Nutzung der Hardware durch den Bytecode Sehr gute Compiler nötig Sehr(!!) gute Assembler-Programmierer nötig Einsparung von komplexer Out Of Order Logik

Was ist IA-64? Neues Instuction Set (ISA) von Intel X86 (IA-32) direkt ausgeführt Very Long Instruction Word (VWLI) 128 Bit 3 Instruktionen à 41 Bit + 1 Template à 5 Bit 41 Bit 5 Bit 128 Bit Bundle Instruktion Template

IA-64 ISA 3*7 Bit Operanden = 21 Bit 14 Bit Opcode 6 Bit Prädikaten- kombinationen Insgesamt 1 Bundle Group = mehrere Bundles bis Stop-Bit

Itanium Pipeline 10-stufig In-Order-Execution 6 parallele Stränge = 2 Bundles

Itanium Daten 3 Branch Einheiten 2 Integer Einheiten 2 Integer/Load/Store Einheiten 2 FP Einheiten L1 Cache 16KB+16 KB L2 Cache 96 KB L3 Cache 2 MB / 4 MB on Module 800 MHz 25 Mio. Transistoren

Itanium Register 128 generelle Integer Register, 64 Bits breit 128 FP Register, 82 Bits breit 64 1-Bit Prädikat Register 8 Branch Register, 64 Bits breit

Itanium Übersicht

Verzweigungen Prädikate – Beide Seiten einer Verzweigung ausführen – Nacher die falsche Verwerfen – Vermeidet Misprediction Vorhersage – Statisch durch Programmierer – Dynamisch durch CPU

Hinweise & Spekulationen Vorzeitiges Laden/Speichern von Daten Vor Verzweigungen möglich Advanced Load Address Table (ALAT ) verhindert Inkonsistenzen Ebenfalls determiniert (Programmierer / Compiler) Bis hin zu Vorhaltezeit und Ort von Daten

Register Rotation (1) Software Pipelining von Schleifen – Enorme Zeitersparnis – Überlappende Schleifendurchläufe – Iteration N benutzt logisch das gleiche Register wie Iteration N+1 – Physikalisch jedoch unterschiedliche Register – Überwachung mit Prädikaten

Register Rotation (2) Effizienter Prozedur Wechsel – Rotation bildet einen Stack nach – Kein push/pop nötig Im Falle eines Register-Überlaufs – Register Save Engine (RSE) pusht/popt transparent – Aber CPU stall

Fliesskomma Einheit multiply-accumulate (MAC) Integermultiplikation in der FPU – Dedizierte Transfer/Transformationsmodi SIMD in der FPU

Speicher Anbindung/Verwaltung 2^36 Bit phys. Adressen (64 GB) 2,1 GB/s bei 2*133MHz*64 Bit

Itanium 2 Bessere Speicheanbindung 6,4 GB/s 2*200MHz*128 Bit L3 Cache on Die 8 Pipeline Stufen 2^44 Bit phys. adressierbar (18 TB)

Betriebssysteme MS.NET Server HP-UX Linux – 64 (Trillian)

Mögliche Anwendungen Wissenschaftliche Bereiche – Starke FPU Grosse Datenbanken – Grosser Speicherbereich

Betriebsarten 64-Bit Modus – Für 64-Bit OS – IA-64 Befehlssatz – IA-32 real mode, IA-32 V86 mode, IA-32 protected mode – Von IA-32 Modi kann IA-64 aufgerufen werden 32-Bit Modus – Für 32-Bit OS PA-RISC Emulation

Pro und Contra Pro – Weg von x86 – Großer adressierbarer Speicherbereich – Ausnutzung von Parallelität Contra – Zu neu – Migration nicht zwingend – 64-Bit Software nicht ausgereift – I/O Performance nicht so toll

Ausblick Itanium 1 war ein Flopp Itanium 2 tut sich schwer Opteron zZ attraktiver Allerdings ist zB HP hinter Itanium.Net Server für IA-64 Langfristig setzt sich IA-64 gegen x86-64 durch