GPU Computing Burim Kameri Fachhochschule Hannover (FHH)

Slides:



Advertisements
Ähnliche Präsentationen
Forschungsfrage – Zielvereinbarung mit SMART
Advertisements


Automated IT Change Planning
Übersicht Anzeigegeräte Framebuffer Grundlagen 3D Computergrafik
< CUDA implementation>
Constantin Timm Informatik 12 TU Dortmund
Agenda Sitzung 2 für den Programmaufbau
Strukturierter Text.
Die SkIDentity-Referenzarchitektur für die starke Authentisierung in der Cloud Dr. Detlef Hühnlein (ecsec GmbH)
6. Der OpenMP Standard Direktiven-basiertes API zur Programmierung von Parallelrechnern mit gemeinsamem Speicher für FORTRAN, C und C++
FOR Anweisung.
1 Named Pipes alias FIFO Haben einen Eintrag im Dateisystem und sind somit durch Zugriffsrechte identifizierbar Ermöglichen die Kommunikation zwischen.
Random Heightmap on GPU
Matrix Multiplication on CUDA
< Best practices >
Leitfaden Motivation Was ist CUDA ? NVIDIA Grafikkarte Programmierung
Virtuelle Fachhochschule Technische Fachhochschule Berlin University of Applied Sciences Project "Virtuelle Fachhochschule" (guiding project) State of.
BIBFRAME Julia Hauser und Reinhold Heuvelmann 1
Informatik I for D-MAVT
Supercomputer FSJS-X3000 Lehrlingswettbewerb Züri Oberland 2013 Uster
Parallel Programming 0024 Matrix Multiplication Spring Semester 2010.
Einführung in die Programmierung Wintersemester 2010/11 Prof. Dr. Günter Rudolph Lehrstuhl für Algorithm Engineering Fakultät für Informatik TU Dortmund.
Bessere Lehre? Mehr Flexibilität beim Lernen? MOOC Fellowship – Wettbewerb für besseres Lehren & Lernen! Stimmt dafür auf
OpenSource Loadbalancer im Vergleich zu kommerziellen systemem Thomas stahl Diplomarbeit SS 2002.
Martin LöfflerMurat Yilmaz Labor Informationstechnologie.
Clustering mittels Grafikprozessor
China mit Hauptstadt Peking Olympiade in Beijing 2008 Olympic Games
GPU Computing Burim Kameri Fachhochschule Hannover (FHH)
Mitglied der Helmholtz-Gemeinschaft Computation of Mutual Information Metric for Image Registration on Multiple GPUs Andrew V. Adinetz 1, Markus Axer 2,
Die Zählschleife int s = 0 for (int k=1; k
Einführung in die Programmiersprache C 4
Parallel Programming Proofs ( yay !)
Parallel Programming Parallel Matrix Multiplication
Algorithm Engineering Parallele Algorithmen Stefan Edelkamp.
Algorithm Engineering „GPU Algorithmen“
eine Präsentation von Rahel Tokalakis G1E
Von Oliver Richard. Video aussuchen Video Tag Video Pfad angeben Höhe, Breite angeben Optional Buttons für play und pause, definiert mit einer ID.
Ein Vortrag von Simon Bayer
Refactoring the UrQMD Model for Many- Core Architectures Mathias Radtke Semiar: Softwaretechnologie (WS 2013/2014 Goethe-Universität Frankfurt.
AIRBNB Sibylle Frey und Alisa Zaugg
Inhalt Motivation Hardware Design aktueller GPUs
Datensicherheit.
Javelin Internet-based parallel computing using Java.
Hauptseminar 2001 „Parallele Programmierung in Java“ - JPVM- Java Parallel Virtual Machine Referent: Sebastian Steininger.
Betriebssysteme: Mac OS
Central Processing Unit von David Kleuker und Thomas Auner
Von Alexander Röhr Booten.
prof. dr. dieter steinmann fachhochschule trier © prof. dr. dieter steinmann Folie 1 vom Standardisierung.
VILVITE Isa Ottesen, Hans Jørgen Jacobsen und Victoria Vestrheim.
Studiumbereich: Informatik
Das Client-Server-Prinzip und TCP/IP
Teil I: Sprache im Kontext
Architektur Dora Sotirova.
Der Verbrennungsmotor speziell: der 2-Takter
Proseminar – Computer Graphics Nikolaos Tsanakas computer graphics & visualization OpenGL Shading Language.
Zielvereinbarung mit SMART
Wissenschaftliches Programmieren „CUDA“ Achim Grolms Buyu Xiao Guanhua Bai Betreuer: Dipl.-Ing. Bastian Bandlow.

Aachen, Seminarvortrag Von: Lukas Abels-Vehns OpenCL mit Aparapi.
Vergleich der Frameworks OpenCL und CUDA zur GPGPU- gestützten Datenverarbeitung Leonid Kostrykin Matr.Nr.: Lehrstuhl.
Paralleleles Rechnen auf Grafikkarten Einführung Christian Schwarz.
Marcus Schaber 1 /33 Seminar - Paralleles Rechnen auf Grafikkarten Seminarvortrag: Übersicht über die Programmierung von Grafikkarten Marcus.
Lineare Algebra Softwareprojekt: Anwendung von Algorithmen Sebastian Kürten, Philipp Borgers SoSe 2010.
Blowfish mit CUDA Dominik Oepen Inhalt ● Blowfish Grundlagen ● Implementierungsdetails ● Performance ● Fazit.
WiSe 2016/17 | Institut für Sportwissenschaft | Name | 1 Titel der Veranstaltung Name(n) der Vortragenden Thema des Vortrages 1 ggf. Bild zum Thema.
Ultrakurzeinführung OpenCV
OAI Protocol for Metadata Harvesting
ТАРИХ, ФИЛОЛОГИЯ ЖӘНЕ ХАЛЫҚАРАЛЫҚ ҚАТЫНАСТАР ФАКУЛЬТЕТІ
Definition Felder Konstruktor Methoden Beispiel
Shared Memory Programmierung: Grundlagen
 Präsentation transkript:

GPU Computing Burim Kameri Fachhochschule Hannover (FHH) Institut für Solarforschung Hameln (ISFH)

Inhalt Sequentielle vs. parallele Programmierung GPU GPGPU CUDA, OpenCL, etc. Problemstellung Beispiele Optimierung GPU - Computing

Motivation GPU - Computing

Motivation: Beispiel

Sequentielle vs. parallele Programmierung Sequentielle Programmierung Quelle: https://computing.llnl.gov/tutorials/parallel_comp/ GPU - Computing

Sequentielle vs. parallele Programmierung Quelle: https://computing.llnl.gov/tutorials/parallel_comp/ GPU - Computing

GPGPU - OpenCL Zusätzliche Verwendung der GPU für allgemeine Aufgaben Quelle: CUDA C Programming Guide Quelle: http://de.wikipedia.org/wiki/OpenCL GPU - Computing

Beispiel (Matrix-Skalar-Multiplikation) CPU GPU (OpenCL) void multMatrix(float* A, float c, float* B) { for( i = 0;i < 225;i++ ) { B[i] = A[i] * c; } __kernel__ void multMatrix(float* A, float c, float* B) { int idx = get_global_id(0); B[idx] = A[idx] * c; } GPU - Computing

Optimierung GPU - Computing

Optimierung

Zusammenfassung Aufteilung des Domänenproblems Tieferes Verständnis des Domänenproblems nötig Wissen über das Programmiermodell work-items, work-groups, Kernels, Speicherhirachien, etc. Synchronisierung Tiefes Wissen über die GPU-Architektur Shared Memory Kontrollstrukturen mit bedingten Verzweigungen vermeiden GPU - Computing

Dankeschön! Fragen? GPU - Computing