AMDs Next Generation Die Hammer Familie Eine Kurzpräsentation von Frank Grümmert bei Herrn Prof. Dr.-Ing. Risse für das RST-Labor.

Slides:



Advertisements
Ähnliche Präsentationen
Die Entwicklungsgeschichte des PC
Advertisements

PC-Kauf im IV. Quartal 1998 Dipl.-Ing. Jörg Dannenberg
4.5 Virtueller Speicher Problemsituation: Programme und Daten sind zu groß für den verfügbaren Arbeitsspeicher Frühere Lösung Aufspaltung der Programme.
KA – Rechnerarchitektur I ____________________________________________________________________________________________ ____________________________________________________________________________________________.
Erweiterung des Opterox- Clusters Fachbereich Physik & ZIM Universität Duisburg-Essen.
Zentraleinheit CPU, Motherbord, RAM
Agenda Die Hardwearkomponenten und ihre Funktionen - Mikroprozessor
Zentraleinheit CPU, Motherbord, RAM
BUS-Systeme (PCI) Allgemeines über BUS-Systeme Allgemeines zum PCI-Bus
Funktionsmerkmale und Vorteile Die Intel Core i7 Prozessoren der zweiten Generation verfügen über folgende Funktionsmerkmale: Die Intel® Turbo-Boost-Technik.
Hardware Präsentation im Fach S&N
Basisinformationstechnologie 1 Tanja Lange WS 2003/04 am
W. Oberschelp G. Vossen Kapitel 7.
© 2006 W. Oberschelp, G. Vossen Rechneraufbau & Rechnerstrukturen, Folie 8.1.
Rechneraufbau & Rechnerstrukturen, Folie 10.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 10.
Studiengang Informatik FHDW
2.5. Mikrocontroller-Komponenten
von Dennis Braun Till Meyenburg Marvin Barghorn
Haupt- und Arbeitsspeicher
4. Mikrocontroller-Komponenten
Beispiele für Mikroprozessoren 9
Schnittstellen in der Bildverarbeitung
Von: Antoni Gazali Clarkson Laryea
Benchmark sparc vs. x86 von Axel Schmidt (94416)
Open Source Prozessor Leon2 Peer Royla und Marco Siebert RST-Labor WS 04/05 Prof. Dr.-Ing. Thomas Risse.
EPIC, IA-64 und Itanium Eine Kurzpräsentation von Jan Hübbers bei Prof. Dr.-Ing. Risse im Fach Labor Rechnerstrukturen an der Hochschule Bremen
PCI-Express als Grafikschnittstelle
Inhalt Der Cell Prozessor Aufbau des Cells Platine Block Diagramm
Matrix Multiplication on CUDA
Beschleunigung Virtueller Privater Netze durch Netzwerkprozessoren
Der Prozessor - zentraler Bestandteil eines jeden Computers
Duo- und Quad Prozessor-Architektur
Hardware - Komponenten
Präsentation von Alexander Schönfeld
INTEL Pentium 4 Prozessor
DW-Architektur: Row Store vs Column Store
Thin Clients IGEL smart-132.
3.4 CPU-Chips und Busse CPU-Chips
Embedded Systems Prof. Dr. H. Kristl
Computerorientierte Physik VORLESUNG und Übungen Vorlesung Zeit: Di., 8.30 – Uhr Ort: Hörsaal 5.01, Institut für Experimentalphysik, Universitätsplatz.
Computerorientierte Physik VORLESUNG
Computerarchitektur AMD Athlon und Multikernprozessoren
Computerarchitektur AMD Athlon und Multikernprozessoren
Die verschiedenen Schnittstellen eines Computers und ihre Verwendung
Übersicht: Hardware Zentraleinheit EVA-Prinzip
Multiprozessoren: Herausforderung für die Software
DDR vs. RDRAM Ein Vergleich von Speichertechnologien Bernhard Fiser Stefan Schönauer.
Kurzvortrag Grafikkarten
Hypertransport.
VMware® Virtual SAN™ Klassisches SAN. VMware® Virtual SAN™ Klassisches SAN.
Central Processing Unit von David Kleuker und Thomas Auner
Arbeitsspeicher Eine Präsentation von - Namen wurden entfernt -
IPv6 Von Judith Weerda Diese Vorlage kann als Ausgangspunkt für die Präsentation von Schulungsmaterialien in einer Gruppensitzung dienen. Abschnitte.
Präsentation von Nadine Hartmann und Buket Barut
Prozessoren im Jahre 2006 von Tobias Schulz.
Geschichte der Mikroprozessoren (vom 8086 bis zum Pentium Dual Core
Central Processing Unit (Zentraleinheit)
Mikrocomputertechnik Jürgen Walter
Referat von Marcel Poppen & Oliver Lennartz
AGP – Accelerated Graphics Port A. Even, M. Colloseus, K. Müller, T. Kadziela, I. Schiffler 1 Warum braucht man AGP? Höhere Geschwindigkeiten Größere Bandbreite.
AMD Serverprozessoren. Inhaltsverzeichniss Geschichtliches AMD Opteron K10AMD Opteron K10 ModellbezeichnungenModellbezeichnungen Varianten der K10-ProzessorenVarianten.
Von Marcel Poppen & Oliver Lennartz
Aktueller Stand der Technik. Auf dem Markt sind heute bereits 64-Bit Mikrocontroller. Die meiste Verwendung finden allerdings noch immer die 8-Bit Modelle.
Random-Access-Memory
SPEICHER ROM + RAM ROM RAM Arten von RAM (DDR-RAM, SDRAM) Beispiel
Entwicklungstrends der PC-Technologie
Multiprocessing mit OpenMPI Marius Albath. Vorlesung Betriebssysteme, Was ist OpenMPI Was ist OpenMPI OpenMPI Standard Setup OpenMPI Standard.
Vorgestern, gestern und heute
מבוא למערכות מחשב ואסמבלי
Shared Memory Programmierung: Grundlagen
 Präsentation transkript:

AMDs Next Generation Die Hammer Familie Eine Kurzpräsentation von Frank Grümmert bei Herrn Prof. Dr.-Ing. Risse für das RST-Labor

AMDs achte Prozessorgeneration Rechen Performance – Merkbare Leistungssteigerung auf aktuellen Entwicklungsstand durch Nutzung nichtexotischer Silizium Prozesse und allgemeiner Design Techniken Software Performance – Leistungssteigerung existierender x86-32 Software – 100% Kompatibilität Multiprocessing & High Performance Computing (HPC) – Neue Standards – ermöglicht 4P und 8P Server Kosten-Vorteile – Geringe Kosten durch Migration vorhandener Software und der Herstellung des Prozessors auf aktuellem Stand der Technik.

Auf Anwendung zugeschnitten ClawHammer – 1-2 Prozessoren – In Desktopsystemen – günstig ClawHammer-DP, SlegeHammer – Multiprozessor fähig 2-8 Prozessoren >8 über Switches – In HPC-Systemen ( High Performance Computing )

Unterschiede der Varianten 1-2 HyperTransport Ports ( 16-8 Bit ) Level2 Cache 256K K 1 DDR Chanel – 4 Dimms Sockel ( 754 Pins ) 2-3 HyperTransport Ports ( 16 Bit ) Level2 Cache >1M 2 DDR Chanels – 8 Dimms Sockel ( 940 Pins )

512k or 256K Byte L2 Cache 64k L1 Instruction Cache 64k L1 Data Cache x86-64 Processor Core DDR Memory Controller HyperTransport wide DRAM 1600MT/s Ersetzt Address, Data und Control Bus X86-64 Bit 1P Desktop Prozessor ein 72-bit DDR Kanal 200, 266, and 333 MHz 4GB DDR DRAM Zukünftige Speicher-Technologien werden unterstützt oEin 16-bit HT Port oOn chip L1 & L2 cache 64K-Byte L1 Inst. 64K-Byte L1 DATA 256/512KB ECC protected L2 754-pin mPGA Package AMD Athlon Processor

MT/s X86-64 Bit 2P Desktop Prozessoren ein 72-bit DDR Kanal 200, 266, and 333 MHz 4GB DDR DRAM Zukünftige Speicher-Technologien werden unterstützt oOder zwei 8-bit HT Ports oOn chip L1 & L2 cache 64K-Byte L1 Inst. 64K-Byte L1 DATA 256/512KB ECC protected L2 754-pin mPGA Package 512k or 256K Byte L2 Cache 64k L1 Instruction Cache 64k L1 Data Cache X86-64 Processor Core DDR Memory Controller HyperTransport wide DRAM AMD Athlon Processor

AMD Opteron Family Processors 512K or 1M Byte L2 Cache 64k L1 Instruction Cache 64k L1 Data Cache X86-64 Processor Core Dual DDR Memory Controller HyperTransport wide DRAM 1600MT/s Bit 2P Server Prozessoren zwei 72-bit DDR Kanäle 200, 266, and 333 MHz 8GB DDR DRAM Zukünftige Speicher-Technologien werden unterstützt ozwei 16-bit HT Ports oOn chip L1 & L2 cache 64K-Byte L1 Inst. 64K-Byte L1 DATA 512/1024KB ECC protected L2 940-pin mPGA Package

AMD Opteron Family Processors 1M or 2M Byte L2 Cache 64k L1 Instruction Cache 64k L1 Data Cache X86-64 Processor Core Dual DDR Memory Controller HyperTransport wide DRAM 1600MT/s Bit 8P Server Prozessoren zwei 72-bit DDR Kanäle 200, 266, and 333 MHz 8GB DDR DRAM Zukünftige Speicher-Technologien werden unterstützt odrei 16-bit HT Ports oOn chip L1 & L2 cache 64K-Byte L1 Inst. 64K-Byte L1 DATA 1M/2MB ECC protected L2 940-pin mPGA Package

Core Architektur 5 Funktionsblöcke – Prozessor-Core, L1-Daten- und Befehls-Cache, L2-Cache, DDR-Memory-Controller und HyperTransport-Interface HyperTransport 9 Ausführungseinheiten für Integer- und Floating-Point-Operationen

Core Architektur

Pipeline 32 Stufen sehr tief ausgeführte Pipeline – Stufe 1 bis 7: Fetch-Vorgang und Befehlsdekodierung – Stufe 8 bis 12: Befehlsausführung – Stufe 13 bis 19: L2-Pipeline – Stufe 20 bis 32: DRAM - Zugriffe Hohe Taktfrequenz >2GHz Probleme bei zb. bei Misprediciton (branch prediction) Zeit – SOI ( silicon on isolator )silicon on isolator

Operating Modes 64-Bit-Modus in 64-Bit-Betriebssystem 32-Bit-Modus (Compatibility Mode) in 64-Bit- Betriebssystem 32-Bit-Modus (Legacy Mode) in 32-Bit- Betriebssystem

Operating Modes

Long Mode Über Kontroll-Bit LMA (Long Mode Active) – 0 wie x86 Prozessor – 1 im 64 Bit Modus ( siehe Vorherige Folie ) Im 64-Bit-Mode folgende neue Features: – 64-Bit-Adressraum – Register-Erweiterung der acht GPRs auf 64 Bit durch das Präfix R – Zusätzlich acht neue GPRs R8 bis R15 – Acht neue 128-Bit-SSE-Register XMM8 bis XMM15 – 64-Bit-Befehlszeiger (RIP) – Relative Datenadressierung mit 64-Bit-Offset

x86-64 vs. x86-32 Register Unterschiede Register-Ausbau: Die x86-64-Architektur des Hammer erweitert die 32-Bit-Register der IA32-Prozessoren auf 64 Bit.

Register x86-64 – 64-bit integer registers – 48-bit Virtual Address – 40-bit Physical Address REX - Register Extensions – bit integer registers – bit SSE registers SSE2 Instruction Set – New Double precision scalar and vector operations 16*8, 8*16 way vector MMX operations – SSE1 already added with AMD Athlon XP

Speicherinterface Durch integrierte Northbridge geringe Latenz Maximaler Speicherausbau steigt in Multiprozessorsystemen In MPS untereinander Austausch der Inhalte durch HyperTransport Schnittstellen – Bsp Opteron Speicherbandbreite von 5,3 GByte/s Xfire beträgt zusätzlich 3,53 GByte/s ( HTT zum anderem Speicher ) ~ bei 2P = Speicherbandbreite 8,83 GByte/s (lokal + XFire) Zusammenarbeit im NUMA Verband ( non uniform memory access ) – Kaum Unterschiede zwischen Near- und Far Memory Zugriff dank geringer Latenz

HyperTransport-Interface Vereinheitlichtes Bussystem

HyperTransport-Interface Hohe Bandbreite bei niedriger Latenzzeit Einheitlicher Bus und gemeinsames Protokoll für alle Verbindungen auf dem Mainboard. Flexible Geschwindigkeiten und variable Busbreite. Unterschiedliche Geschwindigkeit je nach Richtung. Möglichst wenige Leitungen und preiswertes Chip-Interface. Geringer Energieverbrauch und Stromsparmechanismen. Unterstützung von Multiprozessor-Systemen und "System Network Architecture - Bussen

Prozessoren mit mehreren HyperTransport Ports Datentransfer über den HyperTransport Bus benötigt keine CPU Zeit. Externe Betriebsmittel können zu jeder Adresse innerhalb des 40 Bit Adressraums des Prozessors schreiben ohne jegliche CPU Intervention. Im Fall mehrerer HyperTransport Ports können die Daten auch ohne Intervention der CPU passieren.

Zusammenfassung 20-25% mehr Geschwindigkeit zum AMD Athlon XP (32 bit Mode) Integration der nächsten Generation von intelligenten Cache Integrierter DDR Controller Integration von HyperTransport Abwärtskompatibilität Kostenersparniss