DV-Treffen, 20.11.98Folie 1 Renate Dohmen PC-Cluster für trivial-parallele Applikationen Renate Dohmen MPI für Plasmaphysik, Rechenzentrum Motivation Hardware,

Slides:



Advertisements
Ähnliche Präsentationen
Intel ITX Board mit Atom CPU
Advertisements

Software Assurance Erweiterte Software Assurance Services
Anbindung mobiler Endgeräte über den Terminal Service
Methoden und Möglichkeiten der PC - Fernsteuerung
PC-Kauf im IV. Quartal 1998 Dipl.-Ing. Jörg Dannenberg
Linux – Drucken mit CUPS DV-Fachseminar 2004 Linux – Drucken mit CUPS Andrea Lorenz Rechen- und Kommunikationszentrum RWTH Aachen.
Nov. 2001Reinhard Ries AFS-Workshop 2001 Statusbericht Rechenzentrum TU Braunschweig Reinhard Ries
Vom Steinzeitmonitor bis
Informatik Tagesprotokoll vom
HMI / HMI-SPS XV400 HMI oder HMI-PLC – die CompactFlashTM entscheidet
Computeria Zürich Treff vom 4. Oktober 2006 Microsoft Vista (RC1) der Nachfolger von Windows XP Ein Vortrag von René Brückner.
PC-Cluster.
Front-End Rechner: Alternativen zum Desktop (S. Herb, Mai 2004)
Neuerungen in PalmOS® 5 Florian Schulze (SS 2003).
Enno Rehling und Roger Butenuth, Uni-GH Paderborn: Arminius: Software für Linux-basierte SCI-Cluster Arminius: Software für Linux-basierte SCI-Cluster.
SAP R/3 - Speichermanagement
1 Energiebewusste Compilierung für digitale Signalprozessoren Markus Lorenz Peter Marwedel Universität Dortmund Lehrstuhl Informatik XII Projekt Prozessorarchitekturen.
Microsoft Windows 2000 Terminal Services
Windows Universität zu Köln
Einsatz des Level-1-Kalorimeter-Trigger Jet/Energiesummen-Moduls bei ATLAS Teststrahlmessungen am CERN.
Kap.6 Datenstruktur für Peripheriespeicher Kap.6.0 Plattenspeicher
APIs für Computerunterstützte Telefonie - Gliederung
Softwareverteilung mit Tivoli Erfahrungen, Lösungen, Probleme und offene Fragen Rolf Bogus Gerhard Rathmann Witten
1.WICHTIG: Bringen Sie Ihr Betriebssystem möglichst "offline" auf den aktuellen Stand. Insbesondere sollten Sie bei Verwendung von Windows XP nicht ohne.
AFS-Workshop 2005 Statusbericht Rechenzentrum TU Braunschweig
Datenmanagement in Sensornetzen PRESTO - Feedback gesteuertes Datenmanagement - SS 2007 Sören Wenzlaff.
Webstreaming Grundlagen
Redundanter Fileserver mit Heartbeat2 und DRBD - Linux-HA-Cluster
Portierung von Java nach C
Schnittstellen in der Bildverarbeitung
EPIC, IA-64 und Itanium Eine Kurzpräsentation von Jan Hübbers bei Prof. Dr.-Ing. Risse im Fach Labor Rechnerstrukturen an der Hochschule Bremen
LINUX&NT/ Konkurrenz &Kooperation Dürrenweid Professur systeme Betriebs- CheOpS 1 LINUX & Windows NT - Konkurrenz & Kooperation Historie Konfiguration.
Beschleunigung Virtueller Privater Netze durch Netzwerkprozessoren
PowerPoint Präsentation
Geschichte von Windows Die Basis vieler Windowsbetriebssysteme, sei es Betriebsystemgrundlage (Windows 1-3) oder integriert (Windows 95-ME)´ist MS DOS.
Duo- und Quad Prozessor-Architektur
Computer Networks Group Universität Paderborn Studieren bei ESS – Eingebettete Systeme und Systemsoftware II. Studienabschnitt Frey/Karl/Platzner/Plessl/Rammig/Sorge.
Herzlich Willkommen Zu Meiner PowerPoint
Performance-Steigerung durch schnelle Festplatten Ulrich Dinger.
EDV Grundlagen Willkommen
F.Ladstätter und R.Elsässer VP Wissenschaftliches Arbeiten und Präsentation 13. Dezember 2001.
Betriebssystem Linux Von Sofia & Yasemin WG 12/3.
Präsentation von Alexander Schönfeld
Proof of Concept (POC) oder DeskTop Virtualisierung mit XenApp von Citrix Erziehungsdepartement Th. Anliker.
Erstellen einer Webseitenstatistik mithilfe eines OLAP-Servers
Erstellen einer Webseitenstatistik mithilfe eines OLAP-Servers
DOD Document Order and Delivery Document Order and Delivery.
Computational Thinking Online Algorithmen [Was ist es wert, die Zukunft zu kennen?] Kurt Mehlhorn Konstantinos Panagiotou.
Betriebssysteme & BIOS
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Adaption von K-Means Algorithmen an Datenbanken
Präsentation von Lukas Sulzer
Embedded Linux Portierung auf mobiles Datenerfassungsterminal
Kassensysteme.
Verarbeitung und Computerinneres
WIR LÖSEN DAS PROBLEM FÜR SIE
SFZ FN Sj. 13/14 Python 3 Rekursion Inf K1/2 Sj 13/14
xRM1 Pilot Implementierung
Open Office Org Produkt-Information Direkte Konkurrenz zu Microsoft OFFICE Im Gegensatz zum recht teuren MS-Office ist OOo gratis Hersteller von OOo ist.
Grundlagen, Prinzipien und Aufgaben eines Betriebssystems
Webspace Stephan Herbst Christian Köhler. Themen des Vortrages Kurze Einführung ins Thema Kurze Einführung ins Thema Webspace - Was? Wozu? Wo? Wie? Webspace.
Microsoft-Office versus OpenOffice © Walter Riedle, Computeria-Urdorf, 2008 Walter Thomi stellte an der Computeria vom 5. November 2008 Linux als alternatives.
Analyse und Umsetzung einer Filter-basierten Paketverarbeitungsmaschine für IP-Netzwerke Lehrstuhl für Systemarchitektur und Betriebssysteme Forschungs-
Max. HWR DECISION TREE Max Jakisch Tobias Lentz Michael Berth Sebastian Möller Christian Güthling.
Betriebssysteme Was ist ein BS?
© Andreas Dirnberger Referat Intel-Prozessoren Intel-Prozessoren Gliederung: Prozessoren: CentrinoCentrino, CeleronCeleron, Pentium 44, Pentium.
Dr. Klaus Ruhlig Technology & Product Consulting Sun Microsystems, München Skalierbare Rechnerarchitekturen für ein DWH: Eine vergleichende Analyse.
Multiprocessing mit OpenMPI Marius Albath. Vorlesung Betriebssysteme, Was ist OpenMPI Was ist OpenMPI OpenMPI Standard Setup OpenMPI Standard.
ein kurze Geschichte über Linux
Google App Engine - Technische Stärken und Schwächen
 Präsentation transkript:

DV-Treffen, Folie 1 Renate Dohmen PC-Cluster für trivial-parallele Applikationen Renate Dohmen MPI für Plasmaphysik, Rechenzentrum Motivation Hardware, Software, Administration 2 trivial parallele Applikationen im Test Zusammenfassung, Bewertung

Renate Dohmen Folie 2 DV-Treffen, Motivation Höchstleistungsrechner im IPP: – Cray T3E: massiv paralleler Rechner mit verteiltem Speicher und schnellem, teurem Kommunikationsnetzwerk – NEC SX4: schneller Vektorrechner trivial parallele Applikationen: – viel Rechnung – wenig Kommunikation – konzentrierte Kommunikationsphase

Renate Dohmen Folie 3 DV-Treffen, Hardware, Software, Administration Hardware: – 4 Pentium-II-Maschinen mit 233 MHz Taktrate und 128 MB Hauptspeicher – Fast Ethernet Netzwerktopologie Adminstration: – halbautomatische Installationssoftware (erstellt von K. Lehnberger, RZG) – Installation, Booten und Verteilungen übers Netz Software: – Betriebssystem: Red Hat Linux – Compiler: Nag f90, Portland Group pgf90, Gnu cc und f77 – Kommunikationsbibliothek: public domain mpich

Renate Dohmen Folie 4 DV-Treffen, Hardware, Software, Administration Test verschiedener Compiler anhand einer ausgewählten sequentiellen F90-Applikation System, CompilerZeit Leistung Prozessor rel. zur T3E Cray T3E:52.1 s1.0(Alpha 21164,300 MHz) Portland Group f90 + Linux:70.2 s0.7(Pentium II,233 MHz) Nag f90 + Linux:82.2 s0.6(Pentium II,233 MHz) Digital F90 + Windows NT: s0.5(Pentium Pro,200 MHz) Digital F90 + Windows 95:224.6 s0.2(Pentium,166 MHz)

Renate Dohmen Folie 5 DV-Treffen, trivial parallele Testapplikationen 1. Monte-Carlo-Code TRIM: Targetsputtering an Oberflächen (W. Eckstein, IPP) – Verteilung einfallender Ionen zu Beginn – parallele Berechnung unabhängiger Teilchenschauer – Einsammeln der Ergebnisse am Ende 2. Maximum-Entropy-Code SKYMOS: Berechnung von Himmelskarten (A. Strong, MPE) – Verteilung voneinander unabhängiger Beobachtungen – iterative Berechnung von Näherungslösungen – 20 Iterationen von 1 Stunde Dauer auf 200 T3E-Prozessoren – 1 Kommunikationsphase pro Iteration

Renate Dohmen Folie 6 DV-Treffen, trivial parallele Testapplikationen Vergleich PC-Cluster / T3E Laufzeit TRIM auf np = 1, 2 und 4 Prozessoren: np = 1np = 2np = 4 T3E s s s PC-Cluster (pgf90) s s s 50% Performance-Einbuße, Skalierung bleibt erhalten.

Renate Dohmen Folie 7 DV-Treffen, trivial parallele Testapplikationen Vergleich PC-Cluster / T3E Laufzeit SKYMOS auf 4 Prozessoren für 2 Datensätze: Datensatz 1 Datensatz 2 gesamt Komm.gesamtKomm. T3E66.2 s2.5 s919.2 s3.0 s PC-Cluster (pgf90)222.4 s121.6 s s159.0 s Netzleistung: Broadcast: – T3E: 600 MByte/s peak MByte/s – Fast Ethernet: 12 MByte/s peak 3.3 Mbyte/s

Renate Dohmen Folie 8 DV-Treffen, trivial parallele Testapplikationen Performance eines parallelen Programms auf dem PC-Cluster im Vergleich zur T3E kann man bei gleicher Prozessorzahl abschätzen: – c = Kommunikationsanteil im parallelen Programm auf der T3E – Einzelprozessorleistung des benutzten PCs um Faktor 2 schlechter als auf T3E – Kommunikationsnetz beim PC-Cluster um Faktor 50 langsamer als auf T3E Angenommen, ein PC kostet n-mal weniger als ein T3E-Prozessor. Dann lohnt sich der Einsatz des PC-Clusters für Programme, bei denen der Kommunikations- anteil so klein ist, daß folgende Bedingung erfüllt ist.

Renate Dohmen Folie 9 DV-Treffen, Hardware, Software, Administration Güte der Software: 1. Die Compiler weisen einige Besonderheiten auf, die Codeänderungen erforderlich machen können: NAG: --strikte Einhaltung des F90-Standards --Größe des Output-Buffers 64 kB --alloc / dealloc funktioniert nicht in allen Optimierungsstufen PGf90:--internal subroutines nicht richtig implementiert 2.Die frei zugängliche MPI-Bibliothek mpich machte keine Probleme. 3. Bibliotheken:Nag-Bibliothek ist verfügbar, andere numerische Standardbibliotheken fehlen

Renate Dohmen Folie 10 DV-Treffen, Zusammenfassung, Bewertung Erfahrungen mit dem PC-Cluster – Einzelprozessorleistung des PCs durchaus attraktiv – administrativer Aufwand nicht vernachlässigbar – bei Verwendung von Fast Ethernet nur für Applikationen mit sehr geringem Kommunikationsaufwand geeignet – Fortran-90-Compiler noch nicht sehr ausgereift, eingeschränkte Verfügbarkeit numerischer Bibliotheken Fazit Ein PC-Cluster sollte als Alternative zur T3E erst dann ins Auge gefaßt werden, – wenn die Preise für PCs so weit sinken, daß der zusätzliche administrative Aufwand von etwa 1/2 Personalstelle im RZG gerechtfertigt scheint, – wenn die Ressourcen auf der T3E so knapp werden, daß die Benutzer zu der nötigen Mehrarbeit bei der Portierung trivial paralleler Codes bereit sind.