GPU, a @lobal processing unit?? Ein Projekt, das die Welt hätte verändern sollen, und eine kurze Einführung in einem spannenden Forschungsgebiet.

Slides:

Advertisements

Ähnliche Präsentationen

Copyright © The OWASP Foundation Permission is granted to copy, distribute and/or modify this document under the terms of the OWASP License. The OWASP.

Advertisements

Peer-to-Peer Tauschbörsen

Übung 5 Mehrstufige Client/Server-Systeme mit Enterprise Java Beans

Informatik Studieren in Freiberg

/TU Freiberg/ Institut für Informatik /Konrad Froitzheim

Anwendungsverteilung und räumliche Ausdehnung

Enno Rehling und Roger Butenuth, Uni-GH Paderborn: Arminius: Software für Linux-basierte SCI-Cluster Arminius: Software für Linux-basierte SCI-Cluster.

Name des Vortragenden Klasse Ort / tt.mm.jjjj Beschreibung Zentraleinheit CPU, Motherbord, RAM.

Zentraleinheit CPU, Motherbord, RAM

Name des Vortragenden Klasse Ort / tt.mm.jjjj Beschreibung Zentraleinheit CPU, Motherbord, RAM.

Zentraleinheit CPU, Motherbord, RAM

Name des Vortragenden Klasse Ort / tt.mm.jjjj Beschreibung Zentraleinheit CPU, Motherbord, RAM.

Vorlesung Informatik 2 Algorithmen und Datenstrukturen (27 – Kürzeste Wege) Prof. Th. Ottmann.

Universität zu Köln IT – Zertifikat der Philosophischen Fakultät / Blockseminar Allgemeine Technologien II mit Patrick Sahle M. A. Online-Datenbanken am.

OpenMP Präsentation im Rahmen des Seminars

Technik Gestaltung Navigation Daten. Übersicht Client Webbrowser InternetServer.

Vorlesung 2 Rechnerarchitektur Universität Bielefeld Technische Fakultät AG Rechnernetze und verteilte Systeme Peter B. Ladkin

Rechnerarchitektur Vorlesung 2 Peter B. Ladkin

1.WICHTIG: Bringen Sie Ihr Betriebssystem möglichst "offline" auf den aktuellen Stand. Insbesondere sollten Sie bei Verwendung von Windows XP nicht ohne.

Windows Vista Felix Lutz 14. August 2007.

Linux-HA-Cluster – Heartbeat mit DRBD

Hamburg November Computing in der CMS Gruppe der Uni Hamburg Zwei Bereiche: grid Computing Workgroup Server für Analyse.

Distributed Multimedia Control Steuerung und Überwachung von Präsentationen in Netzwerken.

Typo3 Eine Einführung.

PHProjekt – eine open source Projektmanagementsoftware

Netzwerke Peer-to-Peer-Netz Client-Server Alleinstehende Server

Netzwerkkomponenten (Hardware)

Supercomputer FSJS-X3000 Lehrlingswettbewerb Züri Oberland 2013 Uster

Duo- und Quad Prozessor-Architektur

Stand: November Anforderungen an Systemumgebung und Hardware Anmerkung Gollas, Schulamt Freising: Für unsere Schulen kommt eine Mehrplatz Installation.

Entwicklung verteilter Anwendungen I, WS 13/14 Prof. Dr. Herrad Schmidt WS 13/14 Kapitel 4 Folie 2 Message Passing mittels Sockets (1) s.a.

Name des Vortragenden Klasse Ort / tt.mm.jjjj Beschreibung Zentraleinheit CPU, Motherbord, RAM.

University of Applied Sciences Übung Objektorientierte Programmierung II Dipl.-Inf. (FH) Markus Vogler.

? Was ist Informatik? Was ist Informatik? Alexander Lange

F.Ladstätter und R.Elsässer VP Wissenschaftliches Arbeiten und Präsentation 13. Dezember 2001.

Programmierung paralleler Algorithmen mit MPI

Systeme 1 Kapitel 4 Prozesse WS 2009/10.

Entwicklung verteilter Anwendungen I, WS 13/14 Prof. Dr. Herrad Schmidt WS 13/14 Kapitel 12 Folie 2 Web Services (1)

Präsentation von Alexander Schönfeld

Julia Grabsch Florian Hillnhütter Fabian Riebschläger

1 Peer to Peer – GNUTELLA Seminar Innovative Netztechnologien Christophe LE ROQUAIS, den 17. Juni 2002.

Ein Vortrag von Simon Bayer

Grundlagen der Informatik - Prof. Slany 1 Grundlagen der Informatik Prof. Wolfgang SLANY.

Vienna University of Technology Pirker Simon 1. Überblick Definition Motivation Vorteile Entwurf von VP Pirker Simon 2.

Wissen praktisch ablegen

Rechnersysteme: Halbzeit Marcel Waldvogel. Marcel Waldvogel, IBM Zurich Research Laboratory, Universität Konstanz, , 2 Daten und Information.

Peer-to-Peer-Netzwerke

Verarbeitung und Computerinneres

Parallelisierung für Multiprozessor-Maschinen

Gruppe 1 – Linux Server Maxim Mozgovoi Patrick Preidel

5. April 2006Autor: Walter Leuenberger Computeria Urdorf Treff vom 5. April 2006 Surf-Tipps & -Tricks für den Internet Explorer und Firefox.

Grundlagen, Prinzipien und Aufgaben eines Betriebssystems

->Prinzip ->Systeme ->Peer – to – Peer

Clustering Clustering mit openMosix von Christian Wiese Stefan Krause.

Swai Melissa, Vögele Nelly und Hörner Sabrina Präsentieren

Software Engineering SS04 Paralleles Programmieren FH Aachen, Prof. Dr.-Ing. Michael Trautwein Andrej Kühnal, Perez-Otuno Rodrigo.

Digitale Annotationen. Grundlage: John Bradley “Towards a Richer Sense of Digital Annotation: Moving Beyond a Media Orientation of the Annotation of Digital.

Webserver, Apache und XAMPP

ROS – Robot Operating System

Open Source und Open Office Referenten: Anja Stadler & Fabian Gebauer.

Microsoft.NET - Plattform Kurzer Überblick Vergleich mit Java Von Thomas Zahn Januar 2001.

Windows und LINUX Linux für Windows Nutzer. Übersicht Warum Windows, warum Linux ? Welches Linux für wen ? Windows und Linux gemeinsam Beispiel ct 2005/2,

Prozessoren (CPU) Ahmet Aktas, HWI I.

Multiprocessing mit OpenMPI Marius Albath. Vorlesung Betriebssysteme, Was ist OpenMPI Was ist OpenMPI OpenMPI Standard Setup OpenMPI Standard.

Die Komponenten Von einem PC.

Präsentation transkript:

GPU, a @lobal processing unit?? Ein Projekt, das die Welt hätte verändern sollen, und eine kurze Einführung in einem spannenden Forschungsgebiet

Parallelisieren ist schwierig!! Im realen Leben, z.B. gleichzeitig Zähne putzen, Mickey Mouse lesen und sich anziehen Spätenstens in der Schule merkt man, dass der Kleiderhaken in der Jacke geblieben ist Auf einem Supercomputer: man löse die Laplace-PDE auf einem Polygon, in parallel, mit einem iterativen Jacobi-Verfahren Kommunikation zwischen den Knoten so klein wie möglich halten!! Ansonsten je mehr Prozessoren, desto langsamer…

Wie wird heutzutage parallel programmiert?? Man definiert eine fixe Anzahl (=p) Prozessoren, bevor das Programm auf dem Supercomputer ausgeführt wird. OpenMP: Compiler übernimmt die gesamte Aufgabe der Parallelisierung (Der Programmierer muss nur Direktiven angeben) MPI (Message Passing Interface): Der Programmierer muss die Kommunikation zwischen den Knoten selbst definieren. Meistens wird aber ein Programm geschrieben, und das Programm wird mehrmals mit verschiedenen Anfangsparametern gestartet!!

Vergleich von Supercomputer - Anordnungen Dieser Laptop führt etwa eine halbe Milliarde Operationen pro Sekunde aus = ½ GigaFlop, das war die Leistung eines Supercomputers vor 10 Jahren Ein Supercomputer mit Shared Memory (= alle Prozesse greifen auf dem gleichen Speicher zu), etwa 470 Gigaflops (HP Superdome) Linux Beowulf Cluster mit Distributed Memory und 502 Prozessoren (jeder Prozess hat eigenen Speicher), etwa 266 Gigaflops

Vergleiche von Supercomputer-Anordnungen Der japanische Supercomputer Earth Simulator rechnet mit 35 Teraflops (=35000 Gigaflops) Das Projekt Seti@home, der erste erfolgreiche Grid - Computing Projekt rechnet mit 43 Teraflops

Heutige CPUs sind fast arbeitslos!! Mehr als 80% der Rechenzeit einer CPU besteht aus dem Warten von Benutzereingaben… Heutige Betriebssysteme können in dieser Zeit Prozesse im Hintergrund laufen lassen, ohne dass der Anwender etwas merkt

Internet - Supercomputer Wenn alle Computer auf der Welt in einem Cluster zusammengefügt würden, welche Leistung könnte man dann teoretisch erreichen?? 400 Millionen Rechner à ½ Gigaflop = 200 Millionen Gigaflop = 200 000 Teraflop = etwa 2000 Supercomputer!

Vergleich von Supercomputer - Anordnungen

Seti@home, Jagd auf E.T.!! Ein alter Supercomputer verteilt Datensätze eines Radioteleskopes an normale Rechner. Auf diese Rechner ist ein kleines Programm installiert, das die Datensätze im Hintergrund analysiert Die Analyse erfolgt mit einer langwierigen Fouriertransformation, das Ergebnis der Analyse wird dann an den alten Supercomputer zurückgeschickt Alle können beim Projekt mitmachen! Sogar ein 80486!

Krebsforschung United Devices, wie Seti@home, verteilt Datensätze, die von normalen Rechnern im Hintergrund verarbeitet werden.

Achtung! Bei diesen beiden Projekten, Seti@home und Krebsforschung, die über Internet laufen, ist die Anzahl beteiligter Prozessoren (=p) am Anfang nicht im voraus bestimmt… Rechner können vom Projekt ein und aussteigen… Unterschied gegenüber MPI und OpenMP!!

Eine Erweiterung des Client / Server Modells?? Peer to peer Node Client / Server Beispiele: Seti@home, Krebsforschung Peer to peer Netwerk Beispiele: Kazaa, Gnutella, GPU, a @lobal processing unit??

Wie funktioniert (sehr grob) ein Peer to Peer – Netwerk?? Node A An incoming packet… … is forwarded through all other connections Problem des geometrischen Wachstums der Pakete! Duplikate müssen weggeworfen werden.

Wie könnte man das verbessern?? Idee aus Simulationen eines Teams der Princeton University Node A An incoming packet… … is forwarded through only one randomly chosen connection and not through all connections as before

Die Idee von GPU Rechner im Internet lassen GPU laufen. GPU verbindet sich automatisch zu einem Peer to Peer – Netzwerk GPU stellt wissenschaftliche Bibliotheken zur Verfügung Jeder, der GPU installiert hat, kann auch mal andere Rechner verwenden, um eine eigene verteilte Berechnung auszuführen

Die Idee von GPU (2) GPU ist in 3 Teile gegliedert Der Routing Layer leitet Berechnungspakete weiter Eine virtuelle Maschine interpretiert die Berechnungspakete mit Hilfe einer Bibliothek von Plugins Plugins sind kompilierte DLLs, die die Funktionalität des Knotens erweitern

Die Idee von GPU (3) Die polnische Notation wird eingeführt, um die virtuelle Maschine zu vereinfachen 1 + 1 wird zu 1,1,+ Berechnungspakete werden als Dateisuche getarnt, z.B eine Dateisuche für „GPU:1,1,+“ wird als Berechnungsaufgabe interpretiert

GPU in der Praxis Zwei Bibliotheken (Pi – Berechnung und verteilte Berechnung des diskreten Logarithmus) Weiterentwicklung als Open Source Projekt an der Komplexität der Aufgabe gescheitert Prototyp kann man von Internet herunterladen http://sourceforge.net/projects/gpu

GPU in der Praxis (2) Version 0.688 implementiert alles, was in der Dokumentation beschrieben wird… ist aber sehr instabil Version 0.768 ist sehr stabil (dank dem Komponenten TGnutella von Kamil Pogorzelski), Ergebnisse werden (noch) nicht zurückgesandt.

Screenshots

http://gpu.sourceforge.net

Screenshots (2)

Links Global Grid Forum www.gridforum.org EU Grid: http://eu-datagrid.web.cern.ch Top 500 Supercomputer: http://www.top500.org Seti@home http://setiathome.berkeley.edu Krebsforschung http://members.ud.com/projects/cancer