ALICE GSI 13.06.2016 identified TOdos. ALICE T2 TODOs * - Skript zur automatischen Fehlersuche – in Arbeit (S. Fleischer) – MasterJobs in Vergleich.

Slides:



Advertisements
Ähnliche Präsentationen
Die Installation von Windows 95 erfordert etwas Vorarbeit: Als erstes müssen Sie mit einer Windows 95 Startdiskette den Computer booten.... Dabei wird.
Advertisements

PC-Senioren Ludwigsburg
Vorgehensweise Website Besprechung am 11. Februar 2008 Gründung und Partnerunternehmen der Wirtschaftsuniversität Wien.
paedML – Pädagogisches Netzwerk für den Unterricht
Die Firewall Was versteht man unter dem Begriff „Firewall“?
Dateihandles Um in Perl eine bestimmte Datei zum Lesen, Schreiben oder Anhängen zu öffnen, benötigt man so genannte Dateihandles. Ein Dateihandle ist der.
ATHOS Benutzertreffen 12. November Archivierung Glashütten, 12. November 2008 HighQSoft GmbH, Karst Schaap
Komponentenbasierter Taschenrechner mit CORBA
Vorlesung 2 Rechnerarchitektur Universität Bielefeld – Technische Fakultät AG Rechnernetze und verteilte Systeme Peter B. Ladkin
1.WICHTIG: Bringen Sie Ihr Betriebssystem möglichst "offline" auf den aktuellen Stand. Insbesondere sollten Sie bei Verwendung von Windows XP nicht ohne.
1.WICHTIG: Bringen Sie Ihr Betriebssystem möglichst "offline" auf den aktuellen Stand. Insbesondere sollten Sie bei Verwendung von Windows XP nicht ohne.
Projekt Web Engineering
Vortrag III Hier in der Vorlesungszeit! Anwesenheitspflicht Jede Gruppe hat 6 Minuten! Stellt eure GUI vor –was ihr besonderes gemacht habt –Spektakuläre.
Linux-HA-Cluster – Heartbeat mit DRBD
Präsentation zum Seminarprojekt Statistik mit R Name WS 2011/12.
Daten auf den Server Wie bekomme ich die Daten zum ersten Mal auf den Server, wenn ich für meine Anwender die Vereinsdaten zum gemeinsamen Arbeiten bereitstellen.
Ehrenmedaillen ermitteln
Bidirektionales VFX-XML-Interface für Daten-Import/Export Visual Extend Anwendertreffen 2009 Rainer Becker, Frank Kropp deutschsprachige FoxPro User Group.
Der VFP Debugger - Coverage und Profiling. © 1999 TMN-Systemberatung GmbH Der VFP Debugger n Neues Aussehen, eigene Task n Erweiterte Möglichkeiten n.
Kurzanleitung für Laptop-Zugang 1. WICHTIG: Bringen Sie Ihr Betriebssystem möglichst "offline" auf den aktuellsten Stand. 2. WICHTIG: Installieren Sie.
Kurzanleitung für Laptop-Zugang 1. WICHTIG: Bringen Sie Ihr Betriebssystem möglichst "offline" auf den aktuellsten Stand. Entsprechende CDs finden Sie.
1.WICHTIG: oBringen Sie Ihr Betriebssystem möglichst "offline" auf den aktuellen Stand. Insbesondere sollten Sie bei Verwendung von Windows XP nicht ohne.
GIT und Redmine Übung.
Generelles POVs müssen immer lizenziert werden
Aus dem Leben eines Hotline-Mitarbeiters
Aus dem Leben eines Hotline- Mitarbeiters Begriffe: HLM:Hotline-Mitarbeiter DAU:dümmster anzunehmender User.
DNS Domain Name System oder Domain Name Service
1-2-3 Videoanleitung Download Installieren Sie die Software einfach und bequem über den zugesandten Link direkt auf Ihrem Mobiltelefon.
Auf Wunsch einer einzelnen Dame
COPYTEST FÜR NEU_ZWANZIGER
1 Workshop Service Inbetriebnahme und Rücksicherung Saia Service an PCD's Inbetriebnahme und Rücksicherung III. Workshop Inbetriebnahme und Laden der Datensicherung.
DYNTEST –Control Systems -Probleme beim Auslesen-
2.3 Medien löschen1 MEDIEN LÖSCHEN Vorarbeit: Medium im PC aufrufen Zuerst muss das zu löschende Medium am PC aufgerufen werden. Hierzu am besten die Katalogrecherche.
Präsentation von Sonja Pathe
UND NOCH EIN PAAR BEGRIFFE…
Hallo Ich möchte einen Text einer Folie nicht einfach nur einfliegen lassen, sondern genau diesen Text, der schon an einer bestimmten Stelle steht, vergrößern.
Autor: Peter Pfeiffer Seite: Peter Pfeiffer Memeler Str Bad Oeynhausen Datentransfer Zwischen dem Eingabemodul und den mitgelieferten.
Ehrennadeln ermitteln Wenn Sie diese Präsentation im Internet-Explorer ablaufen lassen wollen, so klicken Sie bitte auf das Leinwandsymbol unten rechts.
Saia Service an PCD's Wartung
Aufzeichnung von Usability-Daten im www. Client-Side Log : automatisch (maschinell) generiertes Protokoll Client : Rechner mit dem Browser des Users Server:
Listening Activity Deutsch 3
Backup der FTP-Daten mit BYSU (Back Your Space Up von George Ruinelli) Eine mögliche Variante, um FTP- Daten bei dem Provider „All-Inkl“ zu sichern.
Anna Steinke‌ WG13 ‌‌‌ Köln, Wie sichere ich meine Daten? Wie mache ich meinen PC sicher?
CODA - Installation Installation der Binärdateien –Venus: Client-Programm –Vice: Server-Programm –Für Windows existiert eine Alpha-Version (Coda Client.
Software-RAID-5 mit Windows 2000 Professional Projektarbeit 2003.
Webserver Apache & Xampp Referenten: Elena, Luziano und Sükran
DataGround UG (haftungsbeschränk). DataGround UG (haftungsbeschränk) IST - Status: In der Produktion tritt an einem Arbeitsplatz ein Problem auf. Der.
Die Verbundzentrale des GBV (VZG) betreibt seit Ende Mai 2003 einen SFX-Linkserver für alle GBV-Bibliotheken als zentrale SFX-Instanz Diese zentrale Instanz.
Schritt für Schritt-Anleitung
Drei Möglichkeiten zum Betrieb von DPV über das Internet Dr. Matthias Grabert und Walter Geiselmann Uni Ulm.
von Doris, Fabienne, Patricia und Katrin
Eindeutige Personenzuordnung mit lokalen Identifiern via ODATA/LDAP
1 SAP Learning Hub: Wie kommen Sie an erste Informationen?
Abstürze bei Win XP. Gliederung Allgemeines über Abstürze bei XP Bluescreen Allgemeine Vorgehensweise bei Abstürzen Beispiele von Abstürzen und deren.
ALICE GSI identified TOdos. ALICE T2 TODOs * - Skript zur automatischen Fehlersuche – in Arbeit (S. Fleischer) – MasterJobs in Vergleich.
ALICE T2 KPI Status GSI ALICE T2 KPI Woche KPI SE Availability Job Efficiency Wall Time Delivered Error Rate GSIReferenceRel. Diff GSIReferenceRel.
Installation und Nutzung des Eyeblaster Workshops und Hochladen in MediaMind.
ALICE GSI identified TOdos. ALICE T2 TODOs - Skript zur automatischen Fehlersuche – in Arbeit (S. Fleischer) – MasterJobs in Vergleich.
Webdeployment auf Cluster Seminarvortrag von Lukas Bonzelett.
ALICE GSI identified TOdos. ALICE T2 TODOs - Skript zur automatischen Fehlersuche – in Arbeit (S. Fleischer) – MasterJobs in Vergleich zu anderen.
ALICE GSI identified TOdos. ALICE T2 TODOs Skript zur automatischen Fehlersuche – in Arbeit (S. Fleischer)  Info in 2 Wochen beim nächsten Meeting.
ALICE GSI identified TOdos. ALICE T2 TODOs Skript zur automatischen Fehlersuche – in Arbeit (S. Fleischer)  Info in 2 Wochen beim nächsten Meeting.
ALICE T2 Performance 08/02/2016 Kilian Schwarz. KPI -Compute Efficiency und SE- Verfügbarkeit: ok -seit letztem Meeting: -DONE: ERROR: RUNNING:
ALICE GSI identified TOdos. ALICE T2 TODOs alle T2 Services „chefisieren“ – alle SE – Dienste wurden mit Chef und Überwachung versehen – Vobox-Dienste.
Herzlich Willkommen zu der Präsentation zur. Samsung SPF 72-V Kodak Easyshare W1020 Nextbase Gallery 15p Software Design.
Der Einsatz von stunnel in den Verbund- Bibliotheken Seite 1 Der Einsatz von stunnel in den Verbund- Bibliotheken Von Frank Dietz (BVB/A)
ALICE GSI identified TOdos. ALICE T2 TODOs - Skript zur automatischen Fehlersuche – in Arbeit (S. Fleischer) – MasterJobs in Vergleich.
ALICE GSI identified TOdos. ALICE T2 TODOs* - Skript zur automatischen Fehlersuche – in Arbeit (S. Fleischer) – MasterJobs in Vergleich.
ALICE T2 KPI Status GSI ALICE T2 KPI ALICE T2 KPI - Vergleich direkter Vergleich der KPI-Werte mit – Wall time delivered: nun konstant.
Datenbanken online sowie offline verfügbar machen
 Präsentation transkript:

ALICE GSI identified TOdos

ALICE T2 TODOs * - Skript zur automatischen Fehlersuche – in Arbeit (S. Fleischer) – MasterJobs in Vergleich zu anderen Sites können investigiert werden – Scraping funktioniert, auch stdout/stderr/sim.log, – Visualisierung (Jona) – Workflow aller Softwarekomponenten inklusive aller verwendeten Ports verstehen und dokumentieren – identisch mit „Chefisierung“ - ALICE T2-Dienste müssen gemonitort werden (inklusive History) (R. Grosso) - Methode: MonaLisa - /hera – Sensor muss auch überleben, wenn Lustre stirbt - /hera OSTs sollten gemonitort werden (bei /lustre - /nyx – SE – Datenvergleich wurden oft fehlende OSTs fest gestellt. Grund für ERROR_V ?

ALICE T2- Todos ALICE T2 – Umzug auf das neue Cluster neue vobox wurde beantragt. Implementieren und Testen bis , ca. 100 Jobs ==> DONE, 100 Jobs laufen stabil sync /hera - /nyx zur Vorbereitung von neuem SE RUNNING ==> alle Daten kopiert, nun in sync halten -kurz vor fertig SE auf readonly setzen, nochmal rsyncen. Am Ende Auschalten und rysncen, dann neues SE auf Nyx einschalten, wenn alles in Sync -neue SE-Frontend – Kisten bei HPC beantragen, stehen im GreenCube, GreenCube hat noch kein Netz, in Betrieb nehmen und testen seit laufen Jobs erfolgreich auf Kronos, seit ca auf Kronos im GC !!! - AliEn Job laufen lassen und Netzverbindungen protokollieren, unter Annahme, dass ev. kein NAT im GreenCube. Welche Verbindungen baut ein Job auf und was kann man proxien ?  strace –e connect

ALICE T2- Todos ALICE T2 – Umzug auf das neue Cluster -Slurm.pm anpassen -getNumberRunning, getNumberQueued -hardcoded Directories durch Umgebungsvariablen ersetzen -nur aufräumen was gewünscht -korrektes Submit-Kommando -Testen in lokaler Umgebung  KS

ALICE T2 – Umzug in GC * -Grober md5-Vergleich SE content /hera vs /nyx (finaler Vergleich steht aus) -Aufsetzen Data Mover (HPC) (noch 1 Woche, wenn Thomas wieder da) -xrootd (latest) für Jessie kompilieren -10 Gb Ethernet für se2, se4, proxy2, pandase2 -se2, se4, proxy2 Hardware bis OS-Ebene partitionieren & installieren (FAI & Chef) -lxalise2, lxalise4 sind installiert und sind pingbar -/nyx verfügbar (noch ein paar Bugs im Rezept  Thomas) -software Raid vs. hardware Raid -se2 und se4 mit Chef (eigenen Rezepten) hochziehen ohne Produktivbetrieb -lxalise2, lxalise4, lxaliproxy2/int, lxpandase2 in ONA eintragen -Firewall-Regeln für se2, se4, proxy2, pandase2 -proxy2 mit Chef hochziehen -Storage Downtime abschätzen und an ALICE kommunizieren -Grobe funktionale xrootd-Tests mit se2 und se4 und proxy2 -se1 & se3 abschalten -lxaliproxy2 bei ALICE eintragen lassen -finaler rsync /hera => /nyx (Data mover notwendig) -lxalise2, lxalise4, lxaliproxy2 produktiv gehen lassen -Jobszahl GSI_2 langsam erhöhen -lxalise1 umziehen und produktiv gehen lassen

ALICE T3 TODOs - ALICE T3 – transfers (I) – Transfer – Einstellung, Wiki, configs, etc. automatisieren, auch via GUI – Action Items: (gemäß Meeting mit ALICE) – lxalitransfer6: direkter Transfer auf Kronos » Transfers laufen erfolgreich – Größe des Datensatzes vorher abschätzen und dokumentieren » funktioniert, ist aber zeitfressend, kann daher ausgeschaltet werden geplant: find XML – automatischer Aufruf von Listenerzeugungsskript von J. Wiechula – automatische -Notifkation nach Ende des Transfers einbauen – Option einbauen, den selben Transfer mehrfach auszuführen  nicht mehr benötigt – zusätzlichen Check, dass transferierte Dateien ungleich null einbauen » zu löschende Files via verschicken – Dokumentation zur Bedienung und Erstellung der Transfer Config – Files erstellen – Meeting mit P. Malzacher zur Post-Processing der Daten fand statt

ALICE T3 TODOs - ALICE T3 – transfers (II) * – Meeting mit P. Malzacher zur Post-Processing der Daten fand statt – Todo-Liste: – -notification – cron-job sollen nicht nach alice-data schicken – Info bei Start und Stop von Transfer – statistische Info: – Jobs sollen sagen, wieviel Prozent transferiert wurde – nicht gewollte MC-Directories sollen nicht kopiert werden – nur root_archive.zip unter numerischen Directories – abschließender Datencheck – Vergleich mit korrespondierendem XML-File – leere Directories und Files sowie korrupte Files sollen nach Transfer entfernt werden – ID zu jedem Transfer auf Wiki – Seite hinzufügen – trainlists sollen nach hera/nyx gehen – SE to SE transfers könnten wieder getestet werden  symlinks zu existierenden Datensätzen können von T3 gemacht und getestet werden – symlinks – SE to SE Transfer – local processing – hera to nyx SE migration – time stamps kommen von AliEn oder vom Kopieren auf SE ? – ev. nur Files mit bestimmten Timestamps synchronisieren ?

ALICE T2 todos * KPI Performance – Begründung – Ausfälle pro Woche dokumentieren und warum ? – Am besten via Monitoring-Tool, z.B. MonaLisa ? HPC-Chef-Rezepte müssen noch getestet und übergeben werden – lustre_mount, (obsolet, funktioniert auch so) – ulimit, mlocate – Meeting mit V. Penso und D. Klein ist geplant :00 Uhr im Schulungsraum IT – Meeting mit HPC fand statt (CH, VP, DK) ExSys soll für eigene Kisten entsprechend der zugehörigen Rollen vollen Zugriff auf Chef bekommen, Rezepte etc. werden geteilt mit HPC Verantwortlichkeiten von HPC und EXSys bleiben wie gehabt NächsteTreffen zur technischen Realisierung mit D. Klein und V. Penso fanden im Rahmen der Installation des ALICE –T2-Umzugs in den GC und der anstehenden Rechner – Installation statt. Work in Progress.

Todos vom * Error Rate: – ist eventuell die Referenz falsch ? erhalten GSI und die Referenz-Zentren die gleichen Jobs ? Job-Verteilung muss überprüft werden (Sören/Jona) doppelte SE-Kapazität wird berichtet in MonaLisa. Muss investigiert werden. – vermutlich Bug in xrootd, Jan Knedlik investigiert – Grund gefunden, Topic in Github/xrootd aufgemacht alles muss dokumentiert werden: wo ? Wiki ? Gridamin ? – mit Dokumentation ist begonnen worden – Dokumentation muss weiter geführt werden

non ALICE T2 – Todos * Fertigstellung der Umgebung für verteilte Optimierung via Geneva, MPI, Scallapack, etc. (J. Knedlik) – funktionierende Testumgebung existiert – Aktuell: Test im Produktionsbetrieb – Skalierungsprobleme von Geneva werden untersucht

xrootd Todos: -Plugin, um bei lokalem Zugriff direkt von Lustre oder bei Remote Zugriff, die Proxy- URL davor schalten zu können, ist in Arbeit -mit eigenem Client funktioniert es bereits -xrdcp und xrd stat funktionieren mit Proxy URL und Client Plugin -xrdcp funktioniert noch nicht mit Lustre URL (Protokoll muss überschrieben werden) -von ROOT aus gibt es noch ein API-Problem. -Tfile, TXNetFile verwendet das falsche API, bei dem das Plugin nicht aufgerufen wird -aktueller Status: -xrd Plugin funktioniert jetzt in ROOT und mit xrdcp/xrdcopy! -Proxy Plugin funktioniert jetzt in ROOT mit TnetXNGfile -kurzer Code Review soll statt finden (TK, JK) -Frage: wie geht es nun weiter ? -Problem mit Garbage-Collector von ROOT -Plugin Library wird entladen bevor Tfile deleted wird -Funktioniert mit ROOT6, nicht mit ROOT5 -Diskussion in xroot und ROOT – Foren fand statt -wird nicht mehr in ROOT 5 behoben, ev. nun doch ?

todos vom * Liste mit ALICE-T2-Rechnern zum Hochfahren für HPC erstellen mit Abhängigkeiten PANDAGrid – Installation FairRoot und PandaRoot in CVMFS-Server – Muss noch auf Wns verteilt werden – Stefano Spataro hätte gerne eine Integration von Kronos in PandaGrid – SE, Proxy in GC bauen aus neuen existierenden Kisten – neues CE als VM einrichten, welches nach Kronos in GC submittiert – Kilian fährt nächste Woche nach Wien um an PandaGrid weiter zu arbeiten – PandaGrid-Jobs laufen via AliEn RunAgent in GC, PandaDaten können via xrootd Client Plugin und lxaliproxy2 in GC gelesen werden

Todos vom logwatch: -plugin schreiben: parser für xrootd log files (Werkstudent ?) -ERROR_V – Bekämpfung -proxy load balancer -Job-Zahl reduzieren und Effekt untersuchen ( auf 1500) (2-3 Tage Warten und Effekt studieren) -Proxy-Server auf neuste xrootd-Version upgraden (2-3 Tage warten und Effekt studieren) -alle xrootd Instanzen wurden auf v4.2.3 upgegraded -alle xrootd – Instanzen wurden auf v4.3.0 upgegraded -Proxy Cache erhöhen

Schülerpraktikanten * -Workflow zur gemeinsamen Betreuung mit BIT und HPC wurde eingerichtet -vom – kamen 2 Praktikanten nur zu uns -nächster Schülerpraktikant: Jonas Imhof, Nebelkammer, Linux/C++-Tutorial -Sommerstudent aus Jülich via Chinorat Kobdaj/Jim Ritman/M. Lutz – Plan: Simplex-Algorithmus in Geneva implementieren -Betreuer: J. Knedlik, R. Grosso, K. Schwarz

Workshops * -xrootd: -workshop mit Andy GSI was zu diskutieren ? -Proxy Performanz -Client/Server Plugins -alternative xrootd Setups -HEP IT Strategie: in Wuppertal