Fakultät für informatik informatik 12 technische universität dortmund Mapping of Applications to Multi-Processor Systems Peter Marwedel Informatik 12 TU.

Slides:



Advertisements
Ähnliche Präsentationen
Cadastre for the 21st Century – The German Way
Advertisements

Service Oriented Architectures for Remote Instrumentation
Vernetzung von Repositorien : DRIVER Guidelines Dr Dale Peters, SUB Goettingen 4. Helmholtz Open Access Workshop Potsdam, 17 Juni 2008.
Finding the Pattern You Need: The Design Pattern Intent Ontology
E-Solutions mySchoeller.com for Felix Schoeller Imaging
SION Vacuum Circuit-Breakers 3AE5 and 3AE1
H - A - M - L - E - IC T Teachers Acting Patterns while Teaching with New Media in the Subjects German, Mathematics and Computer Science Prof. S. Blömeke,
Embedded System Hardware
P. Marwedel Informatik 12, U. Dortmund
Finite state machines & message passing: SDL
Mapping of Applications to Multi-Processor Systems
R. Zankl – Ch. Oelschlegel – M. Schüler – M. Karg – H. Obermayer R. Gottanka – F. Rösch – P. Keidler – A. Spangler th Expert Meeting Business.
© 2006 Open Grid Forum OGF26 - Chapel Hill, May 2009 Addressing Metadata Challenges OGF Digital Repositories RG.
Steinbeis Forschungsinstitut für solare und zukunftsfähige thermische Energiesysteme Nobelstr. 15 D Stuttgart WP 4 Developing SEC.
Institut für Softwaresysteme in Wirtschaft, Umwelt und Verwaltung Folie 1 DER UMWELT CAMPUS BIRKENFELD ISS Institut für Softwaresysteme in Wirtschaft,
Dr. M. Schlottke Common Description of Web Services Source: P. Gerbert, 2002 Web Services allow to establish B2B e-commerce on the fly Web Services allow.
Modulare Aufbereitung von Lehr-/Lerninhalten Khaldoun Ateyeh Peter C. Lockemann Jutta Mülle Universität Karlsruhe.
Informatik 12, TU Dortmund
Embedded & Real-time Operating Systems
Fakultät für informatik informatik 12 technische universität dortmund Optimizations Peter Marwedel TU Dortmund Informatik 12 Germany 2009/01/17 Graphics:
fakultät für informatik informatik 12 technische universität dortmund Optimizations Peter Marwedel TU Dortmund Informatik 12 Germany 2009/01/10 Graphics:
Fakultät für informatik informatik 12 technische universität dortmund Mapping of Applications to Platforms Peter Marwedel TU Dortmund, Informatik 12 Germany.
Fakultät für informatik informatik 12 technische universität dortmund Optimizations Peter Marwedel TU Dortmund Informatik 12 Germany 2010/01/13 Graphics:
Embedded System Hardware - Processing -
Fakultät für informatik informatik 12 technische universität dortmund Universität Dortmund Middleware Peter Marwedel TU Dortmund, Informatik 12 Germany.
Fakultät für informatik informatik 12 technische universität dortmund Specifications Peter Marwedel TU Dortmund, Informatik 12 Graphics: © Alexandra Nolte,
Peter Marwedel TU Dortmund, Informatik 12
Fakultät für informatik informatik 12 technische universität dortmund Embedded System Hardware Peter Marwedel Informatik 12 TU Dortmund Germany 2011/03/09.
Fakultät für informatik informatik 12 technische universität dortmund Hardware/Software Partitioning Peter Marwedel Informatik 12 TU Dortmund Germany Chapter.
Fakult ä t f ü r informatik informatik 12 technische universit ä t dortmund Data flow models Peter Marwedel TU Dortmund, Informatik 12 Graphics: © Alexandra.
Fakultät für informatik informatik 12 technische universität dortmund Optimizations - Compilation for Embedded Processors - Peter Marwedel TU Dortmund.
Technische universität dortmund fakultät für informatik informatik 12 Embedded System Hardware Peter Marwedel Informatik 12 TU Dortmund Germany
Fakultät für informatik informatik 12 technische universität dortmund Optimizations - Compilation for Embedded Processors - Peter Marwedel TU Dortmund.
Technische universität dortmund fakultät für informatik informatik 12 Embedded System Hardware - Processing - Peter Marwedel Informatik 12 TU Dortmund.
Hier wird Wissen Wirklichkeit Computer Architecture – Part 10 – page 1 of 31 – Prof. Dr. Uwe Brinkschulte, Prof. Dr. Klaus Waldschmidt Part 10 Thread and.
Hier wird Wissen Wirklichkeit Computer Architecture – Part 5 – page 1 of 25 – Prof. Dr. Uwe Brinkschulte, M.Sc. Benjamin Betting Part 5 Fundamentals in.
Lehrstuhl Informatik III: Datenbanksysteme AstroGrid-D Meeting Heidelberg, Informationsfusion und -Integrität: Grid-Erweiterungen zum Datenmanagement.
Deutsche Gesellschaft für Technische Zusammenarbeit GmbH Integrated Experts as interface between technical cooperation and the private sector – An Example.
1 IDA, TU Braunschweig SuReal – Sicherheitsgarantien unter Realzeitanforderungen Jonas Rox Braunschweig, Jonas Rox Braunschweig,
INSTITUT FÜR DATENTECHNIK UND KOMMUNIKATIONS- NETZE 1 Steffen Stein, TU Braunschweig, 2009 A Timing-Aware Update Mechanism for Networked Real-Time Systems.
Status eSciDoc Malte Dreyer eSciDoc Hauptaktivitäten in 2006 Abstimmung mit den Zielgruppen Funktionale Anforderungserhebung mit.
5 Jahre Semantic Network Service (SNS) Aktueller Stand und Ausblick Maria Rüther, Thomas Bandholtz,
Integration of renewable energies: competition between storage, the power grid and flexible demand Thomas Hamacher.
Case Study Session in 9th GCSM: NEGA-Resources-Approach
Institut AIFB, Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825 Towards Automatic Composition of Processes based on Semantic.
Lehrstuhl Technische Informatik - Computer Engineering Brandenburgische Technische Universität Cottbus 1 Hierarchical Test Technology for Systems on a.
Sanjay Patil Standards Architect – SAP AG April 2008
BAS5SE | Fachhochschule Hagenberg | Daniel Khan | S SPR5 MVC Plugin Development SPR6P.
Neno Loje Berater & MVP für Visual Studio ALM und TFS (ehemals VSTS) Hochqualitative Produkte mit Visual Studio & TFS 2010.
SIT-MOON ESPRIT Project Nr st Review, Brussels, 27th of April 1998 slide 1 Siemens AG Österreich Robotiker Technische Universität Wien Politecnico.
Faculty of Public Health Department of Health Economics and Management University of Bielefeld WP 3.1 and WP 4.1: Macrocost EUprimecare Plenary Meeting.
Berner Fachhochschule Hochschule für Agrar-, Forst- und Lebensmittelwissenschaften HAFL Recent activities on ammonia emissions: Emission inventory Rindvieh.
4th Symposium on Lidar Atmospheric Applications
Ein Projekt des Technischen Jugendfreizeit- und Bildungsvereins (tjfbv) e.V. kommunizieren.de Blended Learning for people with disabilities.
Fakultät für informatik informatik 12 technische universität dortmund Memory-architecture aware compilation - Sessions Peter Marwedel TU Dortmund.
ESSnet Workshop Conclusions.
3rd Review, Vienna, 16th of April 1999 SIT-MOON ESPRIT Project Nr Siemens AG Österreich Robotiker Technische Universität Wien Politecnico di Milano.
Wind Energy in Germany 2004 Ralf Christmann, BMU Joachim Kutscher, PTJ
RZPD Deutsches Ressourcenzentrum für Genomforschung GmbH DESPRAD-Meeting 02/09/2003 Steffen Schulze-Kremer (until 7/2003) Bernd Drescher (since 8/2003)
KIT – die Kooperation von Forschungszentrum Karlsruhe GmbH und Universität Karlsruhe (TH) Vorlesung Knowledge Discovery - Institut AIFB Tempus fugit Towards.
1 Intern | ST-IN/PRM-EU | | © Robert Bosch GmbH Alle Rechte vorbehalten, auch bzgl. jeder Verfügung, Verwertung, Reproduktion, Bearbeitung,
Fakultät für informatik informatik 12 technische universität dortmund Standard Optimization Techniques 2010/12/20 Peter Marwedel TU Dortmund, Informatik.
Fakultät für informatik informatik 12 technische universität dortmund Memory architecture description languages - Session 20 - Peter Marwedel TU Dortmund.
1 Stevens Direct Scaling Methods and the Uniqueness Problem: Empirical Evaluation of an Axiom fundamental to Interval Scale Level.
Lehrstuhl für Waldbau, Technische Universität MünchenBudapest, 10./11. December 2006 WP 1 Status (TUM) Bernhard Felbermeier.
Technische Universität München 1 CADUI' June FUNDP Namur G B I The FUSE-System: an Integrated User Interface Design Environment Frank Lonczewski.
TUM in CrossGrid Role and Contribution Fakultät für Informatik der Technischen Universität München Informatik X: Rechnertechnik und Rechnerorganisation.
Fakultät für informatik informatik 12 technische universität dortmund Memory-architecture aware compilation - Session 13 - Peter Marwedel TU Dortmund Informatik.
Technische Universität München Fakultät für Informatik Computer Graphics SS 2014 Rüdiger Westermann Lehrstuhl für Computer Graphik und Visualisierung.
Fakultät für informatik informatik 12 technische universität dortmund Lab 2: Heterogeneous System Modeling in Ptolemy - Session 6 - Peter Marwedel Heiko.
 Präsentation transkript:

fakultät für informatik informatik 12 technische universität dortmund Mapping of Applications to Multi-Processor Systems Peter Marwedel Informatik 12 TU Dortmund Germany Graphics: © Alexandra Nolte, Gesine Marwedel, /12/17 © These slides use Microsoft cliparts. All Microsoft restrictions apply.

- 2 - technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 Structure of this course 2: Specification 3: ES-hardware 4: system software (RTOS, middleware, …) 8: Test 5: Validation & Evaluation (energy, cost, performance, …) 7: Optimization 6: Application mapping Application Knowledge Design repository Design Numbers denote sequence of chapters

- 3 - technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 The need to support heterogeneous architectures Energy efficiency a key constraint, e.g. for mobile systems © Hugo De Man/Philips, 2007 inherent power efficiency (IPE) Unconventional architectures close to IPE Efficiency required for smart assistants How to map to these architectures ? © Renesas, MPSoC07

- 4 - technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 Practical problem in automotive design Which processor should run the software?

- 5 - technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 A Simple Classification Architecture fixed/ Auto-parallelizing Fixed ArchitectureArchitecture to be designed Starting from given task graph Map to CELL, Hopes, Qiang XU (HK) Simunic (UCSD) COOL codesign tool; EXPO/SPEA2 SystemCodesigner Auto-parallelizing Mnemee (Dortmund) Franke (Edinburgh) Daedalus MAPS

- 6 - technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 Example: System Synthesis © L. Thiele, ETHZ

- 7 - technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 Basic Model – Problem Graph © L. Thiele, ETHZ

- 8 - technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 Basic Model: Specification Graph © L. Thiele, ETHZ

- 9 - technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 Design Space Scheduling/Arbitration proportional share WFQ staticdynamic fixed priority EDF TDMA FCFS Communication Templates Architecture # 1 Architecture # 2 Computation Templates DSP E Cipher SDRAM RISC FPGA LookUp DSP TDMA Priority EDF WFQ RISC DSP LookUp Cipher E E E E E E static Which architecture is better suited for our application? © L. Thiele, ETHZ

technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 Evolutionary Algorithms for Design Space Exploration (DSE) © L. Thiele, ETHZ

technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 Challenges © L. Thiele, ETHZ

technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 Exploration Cycle EXPO – Tool architecture (1) MOSES EXPOSPEA 2 selection of good architectures system architecture performance values task graph, scenario graph, flows & resources © L. Thiele, ETHZ

technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 EXPO – Tool architecture (2) Tool available online: ee.ethz.ch/ex po/expo.html Tool available online: ee.ethz.ch/ex po/expo.html © L. Thiele, ETHZ

technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 EXPO – Tool (3) © L. Thiele, ETHZ

technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 Application Model Example of a simple stream processing task structure: © L. Thiele, ETHZ

technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 Exploration – Case Study (1) © L. Thiele, ETHZ

technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 Exploration – Case Study (2) © L. Thiele, ETHZ

technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 Exploration – Case Study (3) © L. Thiele, ETHZ

technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 More Results Performance for encryption/decryption Performance for RT voice processing © L. Thiele, ETHZ

technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 Design Space Exploration with SystemCoDesigner (Teich, Erlangen) System Synthesis comprises: Resource allocation Actor binding Channel mapping Transaction modeling Idea: Formulate synthesis problem as 0-1 ILP Use Pseudo-Boolean (PB) solver to find feasible solution Use multi-objective Evolutionary algorithm (MOEA) to optimize Decision Strategy of the PB solver © J. Teich, U. Erlangen-Nürnberg

technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 A 3rd approach based on evolutionary algorithms: SYMTA/S: [R. Ernst et al.: A framework for modular analysis and exploration of heteterogenous embedded systems, Real-time Systems, 2006, p. 124]

technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 A Simple Classification Architecture fixed/ Auto-parallelizing Fixed ArchitectureArchitecture to be designed Starting from given task graph Map to CELL, Hopes Qiang XU (HK) Simunic (UCSD) COOL codesign tool; EXPO/SPEA2 SystemCodesigner Auto-parallelizing Mnemee (Dortmund) Franke (Edinburgh) Daedalus MAPS

technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 A fixed architecture approach: Map CELL Martino Ruggiero, Luca Benini: Mapping task graphs to the CELL BE processor, 1st Workshop on Mapping of Applications to MPSoCs, Rheinfels Castle, 2008

technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 Partitioning into Allocation and Scheduling R © Ruggiero, Benini, 2008

technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009

technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 A Simple Classification Architecture fixed/ Auto-parallelizing Fixed ArchitectureArchitecture to be designed Starting from given task graph Map to CELL, Hopes, Qiang XU (HK) Simunic (UCSD) COOL codesign tool; EXPO/SPEA2 SystemCodesigner Auto-parallelizing Mnemee (Dortmund) Franke (Edinburgh) Daedalus MAPS

technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 Daedalus Design-flow System-level synthesis Library of IP cores Platform specification Sequential application Parallel application specification Automatic Parallelization High-level Models Mapping specification System-level design space exploration Explore, modify, select instances Multi-processor System on Chip (Synthesizable VHDL and C/C++ code for processors) RTL-level Models Common XML Interface Library of IP cores KPNgen Sesame ESPAM Xilinx Platform Studio (XPS) RTL-Level Specification System-Level Specification Synthesizable VHDL C/C++ code for processors MP-SoC Kahn Process Network Sequential application © E. Deprettere, U. Leiden Ed Deprettere et al.: Toward Composable Multimedia MP-SoC Design,1st Workshop on Mapping of Applications to MPSoCs, Rheinfels Castle, 2008

technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 Example architecture instances for a single-tile JPEG encoder: JPEG/JPEG2000 case study 2 MicroBlaze processors (50KB)1 MicroBlaze, 1HW DCT (36KB) 6 MicroBlaze processors (120KB) 4 MicroBlaze, 2HW DCT (68KB) Vin 8KB 4x2KB 4x16KB 32KB 16KB32KB 2KB 32KB 2KB 8KB 32KB 4KB VLE, Vout DCT, Q Vin,DCTQ,VLE,VoutVin,Q,VLE,Vout Vin Q Q VLE, Vout DCT © E. Deprettere, U. Leiden

technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 Sesame DSE results: Single JPEG encoder DSE © E. Deprettere, U. Leiden

technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 A Simple Classification Architecture fixed/ Auto-parallelizing Fixed ArchitectureArchitecture to be designed Starting from given task graph Map to CELL, Hopes, Qiang XU (HK) Simunic (UCSD) COOL codesign tool; EXPO/SPEA2 SystemCodesigner Auto-parallelizing Mnemee (Dortmund) Franke (Edinburgh) Daedalus MAPS

technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 Auto-Parallelizing Compilers Discipline High Performance Computing: Research on vectorizing compilers for more than 25 years. Traditionally: Fortran compilers. Such vectorizing compilers usually inappropriate for Multi- DSPs, since assumptions on memory model unrealistic: Communication between processors via shared memory Memory has only one single common address space De Facto no auto-parallelizing compiler for Multi-DSPs! Work of Franke, OBoyle (Edinburgh) © Falk

technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 MACC_System Introduction of Memory Architecture-Aware Optimization The MACC PMS (Processor/Memory/Switch) Model CPU1 SPM MM2 CPU2 SPM L1$ BRI CPU3 SPM L1$ L2$ MM3 BUS1 BUS2 MM1 Explicit memory architecture API provides access to memory information C code

technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 MaCC Modeling Example via GUI

technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 Page 34 Toolflow Detailed View 1.Optimization of dynamic data structures 2.Extraction of potential parallelism 3.Implementation of parallelism; placement of static data 4.Placement of dynamic data (1) Dynamic Data Type Optimizations (2) Map source code to task graphs (3) Parallelization Implem. Memory Hierarchy (MH) MPSoC Parallelization Assistant (MPA) MACC Eco-System MNEMEE Toolflow (Sequential C Source Code) START (4) Dynamic Memory Management Optimizations

technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 Page 35 Toolflow Detailed View MNEMEE Toolflow (7) Scratchpad Memory Optimizations per PE END (Optimized Source Code) Platform DB (6) RTLIB Mapping (5) Scenario Based Mapping (5) Memory Aware Mapping 5.Perform mapping to processing elements Scenario based Memory aware 6.Transform the code to implement the mapping 7.Perform scratchpad memory optimizations for each processing element

technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 MAPS-TCT Framework Rainer Leupers, Weihua Sheng: MAPS: An Integrated Framework for MPSoC Application Parallelization, 1st Workshop on Mapping of Applications to MPSoCs, Rheinfels Castle, 2008 © Leupers, Sheng, 2008

technische universität dortmund fakultät für informatik p. marwedel, informatik 12, 2009 Summary Clear trend toward multi-processor systems for embedded systems, there exists a large design space Using architecture crucially depends on mapping tools Mapping applications onto heterogeneous MP systems needs allocation (if hardware is not fixed), binding of tasks to resources, scheduling Two criteria for classification Fixed / flexible architecture Auto parallelizing / non-parallelizing Introduction to proposed Mnemee tool chain Evolutionary algorithms currently the best choice