PentiumPro Vs. Pentium MMX

Slides:



Advertisements
Ähnliche Präsentationen
Intel ITX Board mit Atom CPU
Advertisements

Programmierung: Einführung
Bauteile des PC´c Werden vorgestellt: PC-Gehäuse Prozessor Tastatur
PC-Kauf im IV. Quartal 1998 Dipl.-Ing. Jörg Dannenberg
CPI Der einzelne Befehl braucht immer noch 5 Zyklen (stimmt nicht ganz, einige brauchen weniger!) Was verbessert wird, ist der Durchsatz = #Befehle /
KA – Rechnerarchitektur I ____________________________________________________________________________________________ ____________________________________________________________________________________________.
Vom Steinzeitmonitor bis
Institut für Angewandte Mikroelektronik und Datentechnik Fachbereich Elektrotechnik und Informationstechnik, Universität Rostock Holger Harms, Harald Widiger,
1 Technische Universität Darmstadt FG Mikroelektronische Systeme Prof. Dr. Dr. h.c. mult. Manfred Glesner Resonantes Umladen von Taktnetzwerken Clemens.
Name des Vortragenden Klasse Ort / tt.mm.jjjj Beschreibung Zentraleinheit CPU, Motherbord, RAM.
Name des Vortragenden Klasse Ort / tt.mm.jjjj Beschreibung Zentraleinheit CPU, Motherbord, RAM.
Name des Vortragenden Klasse Ort / tt.mm.jjjj Beschreibung Zentraleinheit CPU, Motherbord, RAM.
Neumannrechner.
© 2006 W. Oberschelp, G. Vossen Rechneraufbau & Rechnerstrukturen, Folie 8.1.
© 2006 W. Oberschelp, G. Vossen Rechneraufbau & Rechnerstrukturen, Folie 12.1.
von Dennis Braun Till Meyenburg Marvin Barghorn
ilmenau.de Exploiting Pocket PC. ilmenau.de Exploiting Pocket PC PocketPC existiert seit über 5 Jahren (Windows CE seit ca. 10)
Vorlesung 2 Rechnerarchitektur Universität Bielefeld – Technische Fakultät AG Rechnernetze und verteilte Systeme Peter B. Ladkin
Vorlesung 5: Interrupts Universität Bielefeld – Technische Fakultät AG Rechnernetze und verteilte Systeme Peter B. Ladkin Wintersemester.
Vorlesung 5 Interrupts Peter B. Ladkin
Vorlesung 2 Rechnerarchitektur Peter B. Ladkin Wintersemester 2001/2002 Universität Bielefeld Technische Fakultät.
Rechnerarchitektur Vorlesung 2 Peter B. Ladkin
Beispiele für Mikroprozessoren 9
Webstreaming Grundlagen
1 Der Zusammenbau der Azubirechner des 1. Lehrjahres Von Thomas Kaiser.
Schnittstellen in der Bildverarbeitung
Von: Antoni Gazali Clarkson Laryea
Benchmark sparc vs. x86 von Axel Schmidt (94416)
AMDs Next Generation Die Hammer Familie Eine Kurzpräsentation von Frank Grümmert bei Herrn Prof. Dr.-Ing. Risse für das RST-Labor.
Open Source Prozessor Leon2 Peer Royla und Marco Siebert RST-Labor WS 04/05 Prof. Dr.-Ing. Thomas Risse.
EPIC, IA-64 und Itanium Eine Kurzpräsentation von Jan Hübbers bei Prof. Dr.-Ing. Risse im Fach Labor Rechnerstrukturen an der Hochschule Bremen
Medien- Technik Grafikkarten Makroaufnahme Monitor mit Ordner-Icon Löcher, die meistens leuchten Hier einmal nicht...
Grafikkarten Makroaufnahme Monitor mit Ordner-Icon
Inhalt Der Cell Prozessor Aufbau des Cells Platine Block Diagramm
Matrix Multiplication on CUDA
Der Prozessor - zentraler Bestandteil eines jeden Computers
Rechneraufbau & Rechnerstrukturen, Folie 12.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 12.
Duo- und Quad Prozessor-Architektur
Performance-Steigerung durch schnelle Festplatten Ulrich Dinger.
Name des Vortragenden Klasse Ort / tt.mm.jjjj Beschreibung Zentraleinheit CPU, Motherbord, RAM.
Aufbau eines von-Neumann- Rechners Marcel Waldvogel.
INTEL Pentium 4 Prozessor
DW-Architektur: Row Store vs Column Store
3.4 CPU-Chips und Busse CPU-Chips
Signal-Prozessoren DSV1, 2009, Hhrt, 1 Mikro-Prozessor Von Neumann-Architektur Daten und Programmcode im gleichen Speicher => Sequenzieller Zugriff auf.
Embedded Systems Prof. Dr. H. Kristl
Computerarchitektur AMD Athlon und Multikernprozessoren
Anwendung von Microcontollern
Eine Übersicht von Margarete Streitwieser
DDR vs. RDRAM Ein Vergleich von Speichertechnologien Bernhard Fiser Stefan Schönauer.
Rechnerarchitekturen
Kurzvortrag Grafikkarten
Hypertransport.
Johann Baron von Neumann
Central Processing Unit von David Kleuker und Thomas Auner
Prozessoren im Jahre 2006 von Tobias Schulz.
Geschichte der Mikroprozessoren (vom 8086 bis zum Pentium Dual Core
System zur Videokompression Simone Buzzi Simon Häne Giuseppe Schiavello.
Directors Prof. Dr.-Ing. K.D. Müller-Glaser Prof. Dr.-Ing. J. Becker Prof. Dr. rer. nat. W. Stork Institute for Information Processing Technology.
Mikrocomputertechnik Jürgen Walter
Funktionsweise und Aufbau einer CPU & der zeitliche Ablauf des x86

AMD Serverprozessoren. Inhaltsverzeichniss Geschichtliches AMD Opteron K10AMD Opteron K10 ModellbezeichnungenModellbezeichnungen Varianten der K10-ProzessorenVarianten.
Lernfeld 4: Informationstechnische Systeme Bereitstellen
Aktueller Stand der Technik. Auf dem Markt sind heute bereits 64-Bit Mikrocontroller. Die meiste Verwendung finden allerdings noch immer die 8-Bit Modelle.
© Andreas Dirnberger Referat Intel-Prozessoren Intel-Prozessoren Gliederung: Prozessoren: CentrinoCentrino, CeleronCeleron, Pentium 44, Pentium.
oder: wie Computer die Welt sehen
Aufbau und Funktionsweise einer CPU
VHDL-Modellierung der Pipeline eines DLX-Prozessors
Vom HW-Automaten zum Prozessor
 Präsentation transkript:

PentiumPro Vs. Pentium MMX Namik P. Ley André El-Ama

Die Probanden: Das Ziel: System A: PentiumPro 200MHz 64MB RAM System B: PentiumMMX 233MHz 64MB RAM Verglichen werden soll nur die Prozessorperformance! Andere Leistungsunterschiede wie etwa unterschiede der Grafikkarte werden von uns weitest gehend ausgeglichen. Das Ziel: Der Ansatz zum Vergleich der beiden Prozessoren liegt in Ihrer Architektur. Es sollen hier also die Besonderheiten des Designs heraus gestellt werden, so daß etwa die um 33MHz geringere Taktfrequenz des PentiumPro nur sekundäre Relevanz hat. Insbesondere liegt unser Augenmerk auf den zwei primären Unterschieden. Der PentiumMMX hat durch die MMX-Erweiterung die Möglichkeit, Daten im SIMD Verfahren zu bearbeiten, während der PentiumPro einen im Prozessortakt arbeitenden L2 Cache besitzt.

Der PentiumPro:  dynamische Befehlsausführung  drei zwölfstufige Pipelines  On-Chip-FPU  getrennte L1-Befehls- und Daten-Caches mit Write-Back-Strategie  „Out of order“ Abschluß der Befehle  Register-Rennaming mit 40 Registern  Data Forwarding  dynamische Verzweigungsvorhersage  spekulative Ausführung von Befehlen  Multiprozessing mit bis zu vier PPro ohne zusätzliche Logik  auf 36-Bit erweiterter Adressbus für einen physikalischen Adressraum von 64 GByte.  neue Funktionen CMOVcc für bedingte MOV-Operationen  im selben Gehäuse intergrierter L2-Cache, der über einen dedizierten Bus mit vollem CPU-Takt angesprochen wird

Die Besonderheiten der MMX-Technologie SIMD Technologie 24 entsprechend neue Befehle (mit allen Variation sind es 57) 8 getarnte 64-Bit MMX Register 4 neue Datentypen 100% Abwärtskompatibel Doppelte 1‘st Level Größe (16KB/16KB) Wurde um eine Pipline-Stufe um höhere Taktfrequenzen zu erzielen Wurde um 1,2 Mio. Transistoren ergänzt

SIMD Technologoe

Mappen der MMX-Register auf die FP-Register

Neue Datentypen

FP und MMX in einer Applikation FP_code : ..... ..... /* FP-Stack leeren MMX_code : EMMS FP_code2 :

Bug im Pentium-MMX und PII Umschaltung von MMX nach FP per EMMS MMX : ca. 1458 Taktzyklen PII : ca. 5287 Taktzyklen Normalerweise war vorgesehen, daß diese Umschaltung drei Taktzyklen verbraucht

Pipeline der MMX CPU

Block-Diagramm des Pentium MMX Prozessors

Beispiel einer SIMD-Addition

Beispiel einer Vektor-Multiplikation

Addition ohne Überlaufschutz (Wrap-Arround)

Addition mit Überlaufschutz (saturation)

iComp Index 2.0 CPUmark32 Norton SI-32 SPECint_base95 SPECfp_base95 Intel Media Benchmark

iComp Index 2.0 PPro-200 (256 KB) 220 P-MMX-233 203 P-MMX-200 182 Pentium 200 142

MPEG Benchmark Quelle AVI Video Länge : 40sek (ca. 200MB) Auflösung : 352*288 Ziel MPEG Video (ca. 4MB) Benutzte Software Xing-Encoder 2.2 (MMX-optimiert) Konvertierungzeit MMX-233 : 155 Sek MMX-200 : 180 Sek (umgerechnet) PPro-200 : 271 Sek

MP3 Benchmark Quelle WAV-Sounddatei Länge : 16Min 12Sek (ca. 170MB) Auflösung : 16-Bit; Stereo; 44kHz Ziel MP3-Datei (ca. 15MB) Benutzte Software Audio Catalyst 2.0 (nicht MMX optimiert) Konvertierungzeit MMX-233 : 5Min 49Sek MMX-200 : 6Min 46Sek(umgerechnet) PPro-200 : 4Min 30Sek

Spiele Benchmark PPro-200 MMX-233 320*200 29,8 32,1 640*480 12,9 13,1 Hexen II (ohne 3D-Karten Unterstützung) Nicht MMX optimiert PPro-200 MMX-233 320*200 29,8 32,1 640*480 12,9 13,1

MMX-Befehle : Datentransfer Typ Kommentar MOV D,Q Laden oder Speichern der MMX-Register

MMX-Befehle : Packen Befehl Typ Kommentar PACKUS WB Words zu Bytes, mit unsigned Saturation PACKSS WB,DW Words zu Bytes, Words zu Dwords,Dwords zu Qwords, mit signed Saturation

MMX-Befehle : Entpacken Typ Kommentar PUNPCKH BW, WD, DQ Byte zu Words, Words zu DWords, DWords zu QWords, High Order PUNPCKL Byte zu Words, Words zu DWords, DWords zu QWords, Low Order

MMX-Befehle : Arithmetik Typ Kommentar PADD B,W,D Addieren mit Wrap-Around PADDS B,W Addieren mit signed Saturation PADDUS Addieren mit unsigned Saturation PSUB Subtrahieren mit Wrap Around PSUBS Subtrahieren mit signed Saturation PSUBUS Subtrahieren mit unsigned Saturation PMULH W Multiplizieren, Ergebnis = HighWord PMULL Multiplizieren, Ergebnis = LowWord PMADD WD Multiplizieren und Addieren, Ergebnis = Dword

MMX-Befehle : Schieben Typ Kommentar PSLL W,D,Q Logisch nach links schieben PSRL Logisch nach rechts schieben PSRA W,D Arithmetisch nach rechts schieben

MMX-Befehle : Vergleichen Typ Kommentar PCMPEQ B,W,D Ergibt $FF bei gleich, sonst 0 PCMPGT Ergibt $FF bei größer, sonst 0

MMX-Befehle : Logik Befehl Typ Kommentar PAND Bitweise logisches AND PANDN Bitweise logisches NAND POR Bitweise logisches OR PXOR Bitweise logisches XOR

MMX-Befehle : Sonstiges Typ Kommentar EMMS Löscht den MMX-Zustand