EPIC, IA-64 und Itanium Eine Kurzpräsentation von Jan Hübbers bei Prof. Dr.-Ing. Risse im Fach Labor Rechnerstrukturen an der Hochschule Bremen 12.12.2002.

Slides:



Advertisements
Ähnliche Präsentationen
CPU (Central Processor Unit)
Advertisements

Intel ITX Board mit Atom CPU
Vom HW-Automaten zum Prozessor
PC-Kauf im IV. Quartal 1998 Dipl.-Ing. Jörg Dannenberg
4.5 Virtueller Speicher Problemsituation: Programme und Daten sind zu groß für den verfügbaren Arbeitsspeicher Frühere Lösung Aufspaltung der Programme.
CPI Der einzelne Befehl braucht immer noch 5 Zyklen (stimmt nicht ganz, einige brauchen weniger!) Was verbessert wird, ist der Durchsatz = #Befehle /
KA – Rechnerarchitektur I ____________________________________________________________________________________________ ____________________________________________________________________________________________.
2.4 VLIW und EPIC-Prozessoren
Technische Universität Dortmund
PentiumPro Vs. Pentium MMX
Der Crusoe-Prozessor von Transmeta
Migration Informix - MS-SQL Server FH HRZ FH Darmstadt Claus Rode
A Historical Perspective XENIX MS-DOS Windows Windows 3.0 Windows 3.1 Windows for Workgroups Windows NT 3.1 Windows NT 3.5 Windows 95 Windows NT 3.51.
Network-on-Chip basierende Laufzeitsysteme für dynamisch rekonfigurierbare Hardware Ronald Hecht Institut für Mikroelektrotechnik und Datentechnik Universität.
Entwicklungstrends bei Mikroprozessoren
2.5 Vektorrechner & Multimedia-Erweiterungen
Fakultät für informatik informatik 12 technische universität dortmund 2.4 VLIW und EPIC-Prozessoren Peter Marwedel Informatik 12 TU Dortmund 2011/04/08.
1 Energiebewusste Compilierung für digitale Signalprozessoren Markus Lorenz Peter Marwedel Universität Dortmund Lehrstuhl Informatik XII Projekt Prozessorarchitekturen.
Funktionsmerkmale und Vorteile Die Intel Core i7 Prozessoren der zweiten Generation verfügen über folgende Funktionsmerkmale: Die Intel® Turbo-Boost-Technik.
Kapitel 3 5 Rechnerorganisation
W. Oberschelp G. Vossen Kapitel 7.
© 2006 W. Oberschelp, G. Vossen Rechneraufbau & Rechnerstrukturen, Folie 8.1.
Rechneraufbau & Rechnerstrukturen, Folie 10.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 10.
Dateisysteme.
ilmenau.de Exploiting Pocket PC. ilmenau.de Exploiting Pocket PC PocketPC existiert seit über 5 Jahren (Windows CE seit ca. 10)
Vorlesung 4: Memory Universität Bielefeld – Technische Fakultät AG Rechnernetze und verteilte Systeme Peter B. Ladkin Wintersemester.
Vorlesung 2 Rechnerarchitektur Universität Bielefeld – Technische Fakultät AG Rechnernetze und verteilte Systeme Peter B. Ladkin
Vorlesung 3: Verschiedenes Universität Bielefeld – Technische Fakultät AG Rechnernetze und verteilte Systeme Peter B. Ladkin
Vorlesung 2 Rechnerarchitektur Peter B. Ladkin Wintersemester 2001/2002 Universität Bielefeld Technische Fakultät.
Rechnerarchitektur Vorlesung 2 Peter B. Ladkin
Fachgebiet Software Engineering Übersicht © Albert Zündorf, Kassel University Compilerbau und Reverse Engineering m Vorlesung im Wintersemester.
Hochperformante Mikroprozessoren - 6
Beispiele für Mikroprozessoren 9
Von: Antoni Gazali Clarkson Laryea
n4 Streaming Media System
AMDs Next Generation Die Hammer Familie Eine Kurzpräsentation von Frank Grümmert bei Herrn Prof. Dr.-Ing. Risse für das RST-Labor.
Open Source Prozessor Leon2 Peer Royla und Marco Siebert RST-Labor WS 04/05 Prof. Dr.-Ing. Thomas Risse.
Inhalt Der Cell Prozessor Aufbau des Cells Platine Block Diagramm
Matrix Multiplication on CUDA
1 Vorlesung 3 Verschiedenes Peter B. Ladkin
Duo- und Quad Prozessor-Architektur
Hauptspeicher- Datenbanksysteme
Präsentation von Alexander Schönfeld
Aufbau eines von-Neumann- Rechners Marcel Waldvogel.
INTEL Pentium 4 Prozessor
Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Softwaretechnologie II (Teil I): Simulation und 3D Programmierung Prof.
Das Betriebssystem.
DW-Architektur: Row Store vs Column Store
Service Computing   Prof. Dr. Ramin Yahyapour IT & Medien Centrum 19. Januar 2010.
3.4 CPU-Chips und Busse CPU-Chips
Signal-Prozessoren DSV1, 2009, Hhrt, 1 Mikro-Prozessor Von Neumann-Architektur Daten und Programmcode im gleichen Speicher => Sequenzieller Zugriff auf.
Computerorientierte Physik VORLESUNG und Übungen Vorlesung Zeit: Di., 8.30 – Uhr Ort: Hörsaal 5.01, Institut für Experimentalphysik, Universitätsplatz.
Computerorientierte Physik VORLESUNG
Ein Vortrag von Simon Bayer
Anwendung von Microcontollern
Programmieren in Assembler
Systemsoftware und Betriebssysteme
DDR vs. RDRAM Ein Vergleich von Speichertechnologien Bernhard Fiser Stefan Schönauer.
Rechnerarchitekturen
Fingerprint Matching On Card
Moderne Rechner-Architekturen
Die Intel Architecture 64 (IA-64)
Central Processing Unit von David Kleuker und Thomas Auner
Prozessoren im Jahre 2006 von Tobias Schulz.
Geschichte der Mikroprozessoren (vom 8086 bis zum Pentium Dual Core
Rechnerstrukturen Rechnerarchitektur von Intel 8088 BIT WiSe , Referent: Euvhen Berlev.
Aktueller Stand der Technik. Auf dem Markt sind heute bereits 64-Bit Mikrocontroller. Die meiste Verwendung finden allerdings noch immer die 8-Bit Modelle.
Vom HW-Automaten zum Prozessor
מבוא למערכות מחשב ואסמבלי
Shared Memory Programmierung: Grundlagen
 Präsentation transkript:

EPIC, IA-64 und Itanium Eine Kurzpräsentation von Jan Hübbers bei Prof. Dr.-Ing. Risse im Fach Labor Rechnerstrukturen an der Hochschule Bremen

Zielsetzung des Itaniums Parallelität ohne Laufzeit Overhead Minimierung von Latenzzeiten Überwindung von Ressourcenknappheit

Was ist EPIC? (1) Explicit Parallel Instruction Computing Compiler findet parallelisierbare Instruktionen (ILP, Instruction Level Parallelism) Reorganisation des Bytecodes zu parallelen Datenströmen zur Compilerzeit Hohe Ausnutzung der parallelen Funktionseinheiten Mehrere parallele Instruktionen pro Takt

Was ist EPIC? (2) Sehr starke Determinierung der Nutzung der Hardware durch den Bytecode Sehr gute Compiler nötig Sehr(!!) gute Assembler-Programmierer nötig Einsparung von komplexer Out Of Order Logik

Was ist IA-64? Neues Instuction Set (ISA) von Intel X86 (IA-32) direkt ausgeführt Very Long Instruction Word (VWLI) 128 Bit 3 Instruktionen à 41 Bit + 1 Template à 5 Bit 41 Bit 5 Bit 128 Bit Bundle Instruktion Template

IA-64 ISA 3*7 Bit Operanden = 21 Bit 14 Bit Opcode 6 Bit Prädikaten- kombinationen Insgesamt 1 Bundle Group = mehrere Bundles bis Stop-Bit

Itanium Pipeline 10-stufig In-Order-Execution 6 parallele Stränge = 2 Bundles

Itanium Daten 3 Branch Einheiten 2 Integer Einheiten 2 Integer/Load/Store Einheiten 2 FP Einheiten L1 Cache 16KB+16 KB L2 Cache 96 KB L3 Cache 2 MB / 4 MB on Module 800 MHz 25 Mio. Transistoren

Itanium Register 128 generelle Integer Register, 64 Bits breit 128 FP Register, 82 Bits breit 64 1-Bit Prädikat Register 8 Branch Register, 64 Bits breit

Itanium Übersicht

Verzweigungen Prädikate – Beide Seiten einer Verzweigung ausführen – Nacher die falsche Verwerfen – Vermeidet Misprediction Vorhersage – Statisch durch Programmierer – Dynamisch durch CPU

Hinweise & Spekulationen Vorzeitiges Laden/Speichern von Daten Vor Verzweigungen möglich Advanced Load Address Table (ALAT ) verhindert Inkonsistenzen Ebenfalls determiniert (Programmierer / Compiler) Bis hin zu Vorhaltezeit und Ort von Daten

Register Rotation (1) Software Pipelining von Schleifen – Enorme Zeitersparnis – Überlappende Schleifendurchläufe – Iteration N benutzt logisch das gleiche Register wie Iteration N+1 – Physikalisch jedoch unterschiedliche Register – Überwachung mit Prädikaten

Register Rotation (2) Effizienter Prozedur Wechsel – Rotation bildet einen Stack nach – Kein push/pop nötig Im Falle eines Register-Überlaufs – Register Save Engine (RSE) pusht/popt transparent – Aber CPU stall

Fliesskomma Einheit multiply-accumulate (MAC) Integermultiplikation in der FPU – Dedizierte Transfer/Transformationsmodi SIMD in der FPU

Speicher Anbindung/Verwaltung 2^36 Bit phys. Adressen (64 GB) 2,1 GB/s bei 2*133MHz*64 Bit

Itanium 2 Bessere Speicheanbindung 6,4 GB/s 2*200MHz*128 Bit L3 Cache on Die 8 Pipeline Stufen 2^44 Bit phys. adressierbar (18 TB)

Betriebssysteme MS.NET Server HP-UX Linux – 64 (Trillian)

Mögliche Anwendungen Wissenschaftliche Bereiche – Starke FPU Grosse Datenbanken – Grosser Speicherbereich

Betriebsarten 64-Bit Modus – Für 64-Bit OS – IA-64 Befehlssatz – IA-32 real mode, IA-32 V86 mode, IA-32 protected mode – Von IA-32 Modi kann IA-64 aufgerufen werden 32-Bit Modus – Für 32-Bit OS PA-RISC Emulation

Pro und Contra Pro – Weg von x86 – Großer adressierbarer Speicherbereich – Ausnutzung von Parallelität Contra – Zu neu – Migration nicht zwingend – 64-Bit Software nicht ausgereift – I/O Performance nicht so toll

Ausblick Itanium 1 war ein Flopp Itanium 2 tut sich schwer Opteron zZ attraktiver Allerdings ist zB HP hinter Itanium.Net Server für IA-64 Langfristig setzt sich IA-64 gegen x86-64 durch