Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
1
Performancevergleich DSP vs. FPGA
Werner FRIESENBICHLER
2
Aufgabenstellung Wählen Sie (begründet) einzelne Benchmark-Applikationen und diskutieren Sie Hinweise dafür, warum diese auf einem FPGA bzw. auf einem DSP bessere Performance erreichen können. Wie sieht das für ASIC bzw. Standard-Prozessor aus? Lassen sich allgemeine Schlüsse für einen Performance-Vergleich HW/SW ziehen?
3
Benchmarks für digitale Signalverarbeitung
Einfache Operationen der digitalen Signalverarbeitung MAC/s (Mutliply and Accumulate), einfach aber ungenau Volle Applikation – System Performance Modem, Decoder, zu aufwendig, für DSPs alleine ungeeignet Kernels FFT, FIR, IIR, Viterbi-Decoder, optimal für DSPs aber auch für FPGAs? Für FPGAs sind solche Kernels ungeeignet Nicht nur dezidierte DSP-Einheiten sondern auch verteilte Ressourcen Unterschiedliche Realisierungsmöglichkeiten Was geben nun die Hersteller an?
4
Benchmark Vergleich DSP FPGA … bis zu 40x schneller als DSPs
Texas Instruments, C6x Serie, 1 GHz, 8 GMAC/s, 1.65 W, $100, (Fixed P.) Analog Devices, TigerSharc, 600 MHz, 4.8 GMAC/s, 1.5 W, $177, (Floating P.) FPGA Altera Stratix II: x18-bit Mult., 450 MHz, 346 GMAC/s, z.B mW/MHz pro Mult., $200 - $10.000 Xilinx Virtex-5 SXT, 550 MHz, 350 GMAC/s, >$300 Xilinx Spartan-3A DSP, 30 GMAC/s, $30 (!) (Xilinx Feb 2007) … bis zu 40x schneller als DSPs Stimmt das auch in der Realität?
5
DSP-Benchmarks für FPGAs
Berkley Design Technology Inc. (BDTI) => einzelne Algorithmen sind ungeeignet für einen echten Performance-Vergleich DSP vs. FPGA Betrachtung einer kompletten Applikation Beispiel: OFDM-Empfänger (
6
Vergleichsparameter & Ergebnisse
Zwei Ziele festgelegt: 1) Maximierung der Anzahl der Kanäle 2) Minimierung der Kosten pro Kanal Ergebnisse (2006) Sind FPGAs daher besser ? 20 x
7
Resümee des BDTI-Benchmarks
FPGAs zeigen höhere Performance als DSPs, aber ... FPGA schlägt DSP in Kosten / Kanal (Faktor 10-20) Höhere Gesamtkosten Komplexerer Designprozess (VHDL, Verilog, Synthese, Hardwarekenntnisse) Softwaretechniker haben oftmals keine adequate Ausbildung in Hardware-Entwicklung und Hardware-Entwurfssprachen Nicht so ausgereifte Design-Tools wie für DSPs (trotz IP-Cores)
8
Gründe für unterschiedliche Performance
DSP 1 oder 2 Rechenwerke Optimaler Zugriff auf Befehls- und Datenspeicher Effizienter Befehlssatz (VLIW) Serieller Algorithmus auf Geschwindigkeit optimiert FPGA „Sea of Gates“ hohe Anzahl von DSP-Funktionen (Multiplizierer) = viele Rechenwerke Paralleler Algorithmus Probleme bei Speicherzugriff, variable Koeffizienten Performance hängt stark von der Applikation ab
9
Performance-Vergleich HW/SW Stärken
Hardware (FPGA) Repetitive Algorithmen Hohe Rechenleistung durch Parallelisierung Unterschiedliche Bit-Breiten in einem System (Resolution Optimization) Physikalische Layer-Implementierung (Ethernet) Validation / Verifikation nicht so aufwendig wie in SW Software (DSP) Adaptive Algorithmen, Verzweigungen Billig – Consumer Products Kurze Entwicklungszeiten Timinganalyse unkritischer (vgl. SPEAR) Floating Point Units bereits vorhanden Protokoll-Stacks (TCP, UDP) Pre-Processing Post-Processing
10
Schlussfolgerung: Warum nicht beides nutzen...
FPGA als Co-Prozessor eines DSP Bildverarbeitung FPGA übernimmt repetitiven Aufgaben (Filter, Maskierung, etc.), DSP kümmert sich um Objekterkennung und Programmfluss JPEG2000 (10x höhere Performance mit Co-Prozessor, Kommunikation, Netzwerk Navigationsempfänger, Radar, Aerospace, Military
11
ASIC & Standardprozessor
höhere Packungsdichte, mehr Performance, geringe Verlustleistung, billiger bei hohen Stückzahlen nicht rekonfigurierbar, hohe Einmalkosten Standardprozessor (Pentium, PowerPC) 64-bit Architektur (4 x Standard DSP), SIMD Instruction Sets, höhere Peak-Performance als DSPs höhere Leistung, teurer, Probleme beim Handling großer Datenmengen, Ausführungszeiten schwierig vorhersagbar – Probleme bei Echtzeitanwendungen (
12
DSP vs Standardprozessor (1)
FIR Filter (Clockzyklen)
13
DSP vs Standardprozessor (2)
FIR Filter (Ausführungszeit in Mikrosekunden)
14
DSP vs Standardprozessor (3)
Leistungseffizienz
15
Quellen http://www.xilinx.com http://www.altera.com
The Art Of Processor Benchmarking: What makes a good benchmark, and why you should care ( Altera FPGA Replaces 64 DSP Devices in Fairlight's New Media Processing Engine (
Ähnliche Präsentationen
© 2025 SlidePlayer.org Inc.
All rights reserved.