Dennis Kempin, Peter Schumacher, Gernot Ziegler, Tobias Rick

Slides:



Advertisements
Ähnliche Präsentationen
Bauteile des PC´c Werden vorgestellt: PC-Gehäuse Prozessor Tastatur
Advertisements

< CUDA implementation>
Constantin Timm Informatik 12 TU Dortmund
Computeria Zürich Treff vom 4. Oktober 2006 Microsoft Vista (RC1) der Nachfolger von Windows XP Ein Vortrag von René Brückner.
Mobile Lernende in verteilten Umgebungen (dSpace) Oliver Brand Learning Lab Lower Saxony (L3S) Hannover.
VR Framework mit Gestenerkennung
PC-Cluster.
GeForce 8800 GT Testberichte Deutschland. NVIDIA Confidential D ie Karte liegt in puncto Rechenleistung.
Terra Workstation. Terra Workstation Unterschied Workstation PC Lösungen an Fallbeispielen einer fiktiven Firma Fallbeispiele aus den Abteilungen.
Art der Arbeit (Projekt-/Studien-/Diplomarbeit/
Genetische Algorithmen
Institut für Angewandte Mikroelektronik und Datentechnik Fachbereich Elektrotechnik und Informationstechnik, Universität Rostock Spezielle Anwendungen.
Inhalt Der Cell Prozessor Aufbau des Cells Platine Block Diagramm
GPU Architectures: GeForce 8, GeForce 9 and Future
Random Heightmap on GPU
Matrix Multiplication on CUDA
< Best practices >
Beschleunigung Virtueller Privater Netze durch Netzwerkprozessoren
Leitfaden Motivation Was ist CUDA ? NVIDIA Grafikkarte Programmierung
Supercomputer FSJS-X3000 Lehrlingswettbewerb Züri Oberland 2013 Uster
Integration virtueller und realer Objekte Proseminar: Anwendungen für Augmented Reality.
Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Anforderungen von eScience und Grid-Technologie.
Schultasche Digitale Schultasche Schilw KS Alpenquai
Clustering mittels Grafikprozessor
Die Finalisten für den Advanced Encryption Standard Advanced Encryption Standard Herbert Frohner Sebastian Hegenbart Joachim Kerschbaumer.
Lizenz zum Forschen = 1 Euro Microsoft ® High Performance Computing-Programm für Bildungs- und Forschungseinrichtungen.
Grafikkarten.
INTEL Pentium 4 Prozessor
Signal-Prozessoren DSV1, 2009, Hhrt, 1 Mikro-Prozessor Von Neumann-Architektur Daten und Programmcode im gleichen Speicher => Sequenzieller Zugriff auf.
Algorithm Engineering „GPU Algorithmen“
Copyright 2009 FUJITSU TECHNOLOGY SOLUTIONS Virtual Workplace Elevator Pitch Gernot Fels Mai 2009.
Ein Vortrag von Simon Bayer
Verarbeitung und Computerinneres
VMware® Virtual SAN™ Klassisches SAN. VMware® Virtual SAN™ Klassisches SAN.
Directors Prof. Dr.-Ing. K.D. Müller-Glaser Prof. Dr.-Ing. J. Becker Prof. Dr. rer. nat. W. Stork Institute for Information Processing Technology.
Energie Wie man richtig viel Energie im alltäglichen Leben sparen kann
Central Processing Unit (Zentraleinheit)
Institut für Angewandte Mikroelektronik und Datentechnik Phase 5 Architectural impact on ASIC and FPGA Nils Büscher Selected Topics in VLSI Design (Module.
PhysX auf der GPU in Batman: Arkham Asylum & bei Fluid Simulations Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Softwaretechnologie.
Arbeiten in einem agilen Team mit VS & TFS 11
Institut für Angewandte Mikroelektronik und Datentechnik Results of Phase 4: Layout for ST65 technology by Christoph Niemann Selected Topics.
Gruppe2: Noémi, Blerta, Ariane und Lea ‌ HG13 ‌‌‌ Koeln / Externe Speichermedien Hardware Projekt.
XML Seminar: XP und XML 1 XP and XML Gregor Zeitlinger.
IT LAN Infrastruktur Für den Campus und Schulbereich
KLIMA SUCHT SCHUTZ EINE KAMPAGNE GEFÖRDERT VOM BUNDESUMWELTMINISTERIUM Co2 online.
Wissenschaftliches Rechnen auf Grafikkarten Achim Grolms Buyu Xiao Guanhua Bai Betreuer: Dipl.-Ing. Bastian Bandlow.
Wissenschaftliches Programmieren „CUDA“ Achim Grolms Buyu Xiao Guanhua Bai Betreuer: Dipl.-Ing. Bastian Bandlow.
Darmstadt | TT.MM.JJJJ Titel Folienpräsentation Untertitel Name Logo optional.
NEYCONSULT Profile Adalbert Ney. NEYCONSULT Consulting Profile: Sucessfull track story since 2003 in the areas of procurement and supply chain management.
FAU Erlangen-Nürnberg Schülerkontaktstudium
Pion-Photon Reactions and Chiral Dynamics in Primakoff Processes at COMPASS Markus Krämer on behalf of the COMPASS collaboration supported by: Maier-Leibnitz-Labor.
Dr. Klaus Ruhlig Technology & Product Consulting Sun Microsystems, München Skalierbare Rechnerarchitekturen für ein DWH: Eine vergleichende Analyse.
1 of EndSeitenzahl title MASTER OF ARTS IN GENERAL MANAGEMENT I course: MAMBA01 Max Mustermann I date: xx.xx.xxxx © 2015 School of International Business.
Money rules the medicine?! A presentation by Jan Peter Hoffmann European healthcare systems in comparison.
Ein großer Schritt in die Welt der kleinen Dimensionen Nano LC heute LC-MS/MS-Treffen der DGKL 24. September in Tutzing Steffen Liedtke, Dionex GmbH, Idstein.
Paralleleles Rechnen auf Grafikkarten Einführung Christian Schwarz.
SE: Systementwurf, © Till Hänisch 2003 Systemarchitektur nach Sommerville, Software Engineering, Addison Wesley.
Tobias Sammet 8DY1 Programmieren Tobias Sammet 8DY2 Programmierung ● = das Schreiben eines Computerprogramms ● Dient zur Lösung eines.
PlayStation 4 vs. Xbox one
PC Aufrüsten, Auftrag 1 Systemtools, Benchmark
Android Apps selbst gemacht
Graphik, Doku und Monitor für TWS
Vorlesung AVL-Bäume/Algorithmen-
Sichtbar – Mit den Augen wahrnehmbar.
Vorlesung AVL-Bäume/Algorithmen-
Electronic Measurements and Signal Processing (EMS)
Einsatz interaktiver Whiteboards
Official Statistics Web Cartography in Germany − Regional Statistics, Federal and European Elections, Future Activities − Joint Working Party meeting.
J. Fluck, J. Lüscher, N. Lüscher, P. Rolli, S. Schleuniger
 Präsentation transkript:

Dennis Kempin, Peter Schumacher, Gernot Ziegler, Tobias Rick Interactive Particle Tracing with Cumulative Blood Damage Computation for Ventricular Assist Devices Dennis Kempin, Peter Schumacher, Gernot Ziegler, Tobias Rick Bedanken und Begrüßung Hiwi Projekt vorstellen Kurzen prägnanten Namen

Abstract Worum geht es? Particle Tracing - kein Fremdwort Visualisieren von Strömungsfeldern

DeBakey Ventricular Assist Device Anwendung: Projekt vom VR DeBakey Ventricular Assist Device. Turbine = Blutpumpe

Ans Herz anfügen Herz unterstützen Wartezeit überbrücken

Hydraulik Hematologie Zwei Designaspekte Hydraulisch: Geschwindigkeit Hematologisch: Blut ist nicht irgend eine flüssigkeit Rote Blutzellen sind empfindlich Krafteinwirkung = Schädigung = Hämolyse = Vergiftung/Herzversagen Will man vermeiden -> Optimieren mit Modellen

Motivation? Warum arbeiten wir an diesem Projekt? Interessante Anwendung -> Hiwi Projekt Technische Motivation

Hydraulik -> einfach Problematisch: Hämatologischen Eigenschaften Wegen: komplexe Berechnungen

Arora et al Hentschel et al A Tensor-Based Measure for Estimating Blood Damage Hentschel et al Interactive blood damage analysis for ventricular assist devices Zwei Veröffentlichungen Arora et al: Blutschädigungsmodell Heentschel et al: VAD Software Nachteil: Offline Vorberechnungen -> Kein interaktives Einfügen von Partikeln.

Fully interactive particle seeding Goal: Fully interactive particle seeding Ziel:Interaktives einfügen von Partikeln Nicht nur auf HPC Hardware, sondern auch skalierbar auf Desktop PCs. Problem: Echtzeitberechnung Blutschädigung -> Keine klassische Visualisierung

Technology Anderer Ansatz: Statt CPU

NVidia CUDA. GPUs in C programmieren GPUs eignen sich für das Problem hervoragend

Nicht nur Desktop PCs Auch: VR Hardware Vista Transparente Behandlung Ein/Ausgabe

Implementation Paar Worte zur Art der Implementierung

Traditional SV Ablauf einer klassische Visualisierung: Links Host, Rechts Device Kritischer Bereich: Renderschleife Zwei Probleme: - Data processing: Zeitintensiv mit Blutschädigung - Data transfer der Partikeldaten

GPU based SV GPU basierte Visualisierung Probleme gelöst: Datentransfer verschoben, bleiben auf GPU Data processing ausgelagert GPU kann 100te Partikel parallel verarbeiten

Hemolysis Velocity Gradient Tensor Hemolysis Eigenvectors Kurzer Überblick Position: Geschwindigkeitsfeld schrittweise integrieren Hämolyse: Braucht Tensor Wird ebenfalls schrittweise aktualisiert Benötigt viele Matrixopperationen und die Eigenvektoren -> Nicht schwierig, aber teuer wenn echtzeit Aus Tensor -> Hämolyse Hemolysis

Reduce Complexity Cartesian Grid Lower level Integration Frameskipping Single-precision float Specialized Eigensolver Damit echtzeittauglich: Komplexität reduziert Kartesisches Gitter Euler Integration Überspringen von Frames Single-precision floats Specialized Eigensolver

Results Was konnten wir mit den Ansätzen erreichen? Benchmark auf Low End Computer

G96b = $50 My Home Computer: Zu Hause steht so einer. Grafikkarte mit G96b Chip: $50. G96b = $50

65.000 particles In realtime 65.000 Partikel in Echtzeit bei 30 fps darstellbar. Inkl Blutschädigungsmodell. Doch: Ziemlich gravierendes Problem!

Numeric Instabilities! Ergebnisse nahezu unbrauchbar Zu Ungenau Kein Wunder: Zu viel Genauigkeit gegen Performance eingetauscht Doch: Optimistisch was erhöhen der Genauigkeit angeht. Warum:

(million)Integrations per second Integrationen pro Sekunde bei verschiedenen Partikelanzahlen. Orange ohne Blutschädigung – sehr simple Berechnung Rot mit komplexem Blutschädigungsmodell Kaum Geschwindigkeit eingebüßt -> Skaliert sehr gut.

GPU Peak Performance Gflops 67 Getestete Grafikkarte: 67 GFlops 9500GT

GPU Peak Performance 67 1700 Gflops 9500GT GTX 295 Aktuelle Grafikkarte: GTX 295 2 Kerne Zusammen: 1700 GFlops. Also: Massig Raum für Verbesserung der Genauigkeit 9500GT GTX 295

Improve Accuracy Tetraedal Grid Higher level Integration Memory Streaming Double-precision float More accurate eigensolver Aufgaben für die Zukunft: Tetraeder Gitter Integrationsmethoden höherer level Speicher Streaming bei zu kleinem Speicher Neue Karten: Double precision Fließkommazahlen Genauerere Egensolver Algorithmen

Thank you for your attention! Any Questions? Damit bin ich am Ende. Vielen Dank für Ihre Aufmerksamkeit