Clustering mittels Grafikprozessor

Slides:



Advertisements
Ähnliche Präsentationen
Vom HW-Automaten zum Prozessor
Advertisements

Übersicht Anzeigegeräte Framebuffer Grundlagen 3D Computergrafik
4.5 Virtueller Speicher Problemsituation: Programme und Daten sind zu groß für den verfügbaren Arbeitsspeicher Frühere Lösung Aufspaltung der Programme.
CPI Der einzelne Befehl braucht immer noch 5 Zyklen (stimmt nicht ganz, einige brauchen weniger!) Was verbessert wird, ist der Durchsatz = #Befehle /
KA – Rechnerarchitektur I ____________________________________________________________________________________________ ____________________________________________________________________________________________.
Constantin Timm Informatik 12 TU Dortmund
Claas J. Cornelius - Ogg-on-a-chip - MDCT MDCT Funktionsweise und Limitierende Faktoren.
BUS-Systeme (PCI) Allgemeines über BUS-Systeme Allgemeines zum PCI-Bus
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (15 Hashverfahren: Verkettung der Überläufer) Prof. Th. Ottmann.
1 Named Pipes alias FIFO Haben einen Eintrag im Dateisystem und sind somit durch Zugriffsrechte identifizierbar Ermöglichen die Kommunikation zwischen.
Studiengang Informatik FHDW
2.5. Mikrocontroller-Komponenten
Vorlesung 2 Rechnerarchitektur Universität Bielefeld – Technische Fakultät AG Rechnernetze und verteilte Systeme Peter B. Ladkin
Rechnerarchitektur Vorlesung 2 Peter B. Ladkin
4. Mikrocontroller-Komponenten
Von: Antoni Gazali Clarkson Laryea
Inhalt Der Cell Prozessor Aufbau des Cells Platine Block Diagramm
GPU Architectures: GeForce 8, GeForce 9 and Future
Random Heightmap on GPU
Matrix Multiplication on CUDA
< Best practices >
Leitfaden Motivation Was ist CUDA ? NVIDIA Grafikkarte Programmierung
Supercomputer FSJS-X3000 Lehrlingswettbewerb Züri Oberland 2013 Uster
Duo- und Quad Prozessor-Architektur
Clustered Neuronal Network A C#.NET project for Compute Cluster Server 2003.
Clustered Neuronal Network A C#.NET project for Compute Cluster Server 2003.
Aufbau eines von-Neumann- Rechners Marcel Waldvogel.
…ein Service der Basisdienste. Fabio Consani, windows based services
INTEL Pentium 4 Prozessor
Thema: Grafikkarten.
Zuordnung CacheHauptspeicher
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Geoinformation I Vorlesung 11 WS 2000/2001 Gerhard Gröger Einführung in ArcInfo 8 -
GPU Computing Burim Kameri Fachhochschule Hannover (FHH)
GPU Computing Burim Kameri Fachhochschule Hannover (FHH)
Shader.
Parallel Matrix Multiplication
Parallel Programming Parallel Matrix Multiplication
Adaption von K-Means Algorithmen an Datenbanken
Ein Vortrag von Simon Bayer
Philip Bargiel 8DY Informatik
LOD Levels of Detail Oliver Gassner Christian Troger.
0 Univ. Paderborn, FG Theoretische Elektrotechnik 0 Übersicht Motivation und Zielsetzung Grundlagen Funktionsprinzip einer Grafikarter.
Betriebssysteme Übung Tutorium „TLB & Virtual Memory“
Hypertransport.
Central Processing Unit von David Kleuker und Thomas Auner
Directors Prof. Dr.-Ing. K.D. Müller-Glaser Prof. Dr.-Ing. J. Becker Prof. Dr. rer. nat. W. Stork Institute for Information Processing Technology.
Gaming-Computer-Aufbau
Central Processing Unit (Zentraleinheit)
Die Welt der Shader Universität zu Köln WS 14/15 Softwaretechnologie II (Teil 1) Prof. Dr. Manfred Thaller Referent: Lukas Kley Fortgeschrittene Techniken.
Software Engineering SS04 Paralleles Programmieren FH Aachen, Prof. Dr.-Ing. Michael Trautwein Andrej Kühnal, Perez-Otuno Rodrigo.
AGP, PCIE Bus im Vergleich AGP: Accelerated Graphic Port 1997 von Intel entwickelt. Ab 1998 AGP dann in großem Stil in PCs als Grafikkartensteckplatz verwendet.
PhysX auf der GPU in Batman: Arkham Asylum & bei Fluid Simulations Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Softwaretechnologie.
AGP – Accelerated Graphics Port A. Even, M. Colloseus, K. Müller, T. Kadziela, I. Schiffler 1 Warum braucht man AGP? Höhere Geschwindigkeiten Größere Bandbreite.
Beispiel Cache-Architektur
Lernfeld 4: Informationstechnische Systeme Bereitstellen
Aktueller Stand der Technik. Auf dem Markt sind heute bereits 64-Bit Mikrocontroller. Die meiste Verwendung finden allerdings noch immer die 8-Bit Modelle.
Wissenschaftliches Rechnen auf Grafikkarten Achim Grolms Buyu Xiao Guanhua Bai Betreuer: Dipl.-Ing. Bastian Bandlow.
Wissenschaftliches Programmieren „CUDA“ Achim Grolms Buyu Xiao Guanhua Bai Betreuer: Dipl.-Ing. Bastian Bandlow.
Paralleleles Rechnen auf Grafikkarten Einführung Christian Schwarz.
TECHNIK ZUM ANFASSEN [Designentwurf] Intel 4004 mit Goldcap Die klassische i386-Drei, von Links nach Rechts: Cachecontroller, i386-Prozessor, FPU AMD Am486Intel.
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Radio Frequency Identification Datenmanagement Odyssee.
Lineare Algebra Softwareprojekt: Anwendung von Algorithmen Sebastian Kürten, Philipp Borgers SoSe 2010.
Blowfish mit CUDA Dominik Oepen Inhalt ● Blowfish Grundlagen ● Implementierungsdetails ● Performance ● Fazit.
Präsentation von Markus Lugbauer
VHDL-Modellierung der Pipeline eines DLX-Prozessors
Vom HW-Automaten zum Prozessor
Die Komponenten Von einem PC.
Shared Memory Programmierung: Grundlagen
 Präsentation transkript:

Clustering mittels Grafikprozessor Diplomarbeit Clustering mittels Grafikprozessor Robert Noll betreut von Prof. Dr. Christian Böhm Bianca Wackersreuther

Clustering mittels Grafikprozessor Grafikkarten : Computerspiele mit realistischer 3D-Grafik viel Leistung, geringe Preise rasante Weiterentwicklung programmierbare Shader

Clustering mittels Grafikprozessor Floating Point Operations Per Second

Clustering mittels Grafikprozessor Memory Bandwidth

Clustering mittels Grafikprozessor Massiv Parallel (hunderte von Threads)‏ Daten-Parallel, SIMD simple Befehle, aber schnell

Clustering mittels Grafikprozessor NVIDIA CUDA SDK: Direkter Speicherzugriff (statt Texturen)‏ Scatter-Write (keine Adress-Beschränkung)‏ Atomare Operationen Shared Memory Cache (Register)‏ erweiterte C Syntax Emulator funktioniert ohne Grafik-Karte

Clustering mittels Grafikprozessor K-Means Clustering 1 Thread pro Datenpunkt GPU berechnet Zuordnung und Abstand

Clustering mittels Grafikprozessor K-Means 8D k=1024 CPU GPU um Faktor 5-8 schneller

Clustering mittels Grafikprozessor DBScan Clustering density-based Clustering Nachbarn im ℰ Radius Kernpunkt wenn ≥ minPts Cluster ausbreiten

Clustering mittels Grafikprozessor DBScan Variante auf GPU mehrere Seeds parallel Nachbar-Markierung Kollisionen

Clustering mittels Grafikprozessor GPU-DBScan Kollisionsbehandlung Erkennung durch AtomicOps old := AtomicMax(addr,new); Eintrag in Connection Matrix

Clustering mittels Grafikprozessor GPU-DBScan Connection Matrix Finale Cluster ID erst bei Abschluss einer Kette Tabelle mit Finalen Cluster ID's für Seeds Abschluss 1, neue ID ID ausbreiten neuer Seed Connection Matrix (Bits)‏ Finale Cluser ID Tabelle

Clustering mittels Grafikprozessor DBScan 8D minPts=4 ℰ=0.01 CPU GPU um Faktor 5-7 schneller

Clustering mittels Grafikprozessor Zusammenfassung viel Leistung, niedrige Preise massiv Parallel technische Einschränkungen Vielen Dank für die Aufmerksamkeit !