Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

ALICE GSI identified TOdos. ALICE T2 TODOs Skript zur automatischen Fehlersuche – in Arbeit (S. Fleischer)  Info in 2 Wochen beim nächsten Meeting.

Ähnliche Präsentationen


Präsentation zum Thema: "ALICE GSI identified TOdos. ALICE T2 TODOs Skript zur automatischen Fehlersuche – in Arbeit (S. Fleischer)  Info in 2 Wochen beim nächsten Meeting."—  Präsentation transkript:

1 ALICE T2 @ GSI identified TOdos

2 ALICE T2 TODOs Skript zur automatischen Fehlersuche – in Arbeit (S. Fleischer)  Info in 2 Wochen beim nächsten Meeting – ebenso Visualisierung (Jona) Workflow aller Softwarekomponenten inklusive aller verwendeten Ports verstehen und dokumentieren – identisch mit „Chefisierung“ alte Maschinen aus ML entfernen (lxgrid6, lxgrid9,...) – Costin wurde kontaktiert ALICE T2-Dienste müssen gemonitort werden (inklusive History) (R. Grosso) Kandidat: MonaLisa Info beim nächsten Meeting in 2 Wochen ALICE T2 – Umzug auf das neue Cluster – alien RunAgent muss noch getestet werden,  DONE, erste Jobs liefen in Kronos – neue vobox wurde beantragt. Implementieren und Testen bis 16.10.2015, ca. 100 Jobs vobox wurde in LDAP konfiguriert, installiert, Chef-Rezepte stehen, lediglich Test steht aus. – sync /hera - /nyx zur Vorbereitung von neuem SE – Job Submission von lxcealice03 auf Kronos Problem, die richtigen Umgebungsvariablen auf die Jobumgebung zu übertragen ALICE T3 – transfers – Transfer – Einstellung, Wiki, configs, etc. automatisieren – Action Items : (gemäß Meeting mit ALICE) – lxalitransfer6: direkter Transfer auf Kronos – Größe des Datensatzes vorher abschätzen und dokumentieren – automatischer Aufruf von Listenerzeugungsskript von J. Wiechula » neuen Ort für die Listen finden – Marcus Skript automatisch aufrufen ??? – automatische E-Mail-Notifkation nach Ende des Transfers einbauen – Option einbauen, den selben Transfer mehrfach auszuführen – zusätzlichen Check, dass transferierte Dateien ungleich null einbauen – Dokumentation zur Bedienung und Erstellung der Transfer Config – Files erstellen

3 ALICE T2 todos KPI Performance – Begründung – Ausfälle pro Woche dokumentieren und warum ? – Am besten via Monitoring-Tool, z.B. MonaLisa ? HPC-Chef-Rezepte müssen noch getestet und übergeben werden – lustre_mount, ulimit, mlocate – Meeting mit V. Penso und D. Klein ist geplant

4 Todos vom 28.9. 2015 Error Rate: – ist eventuell die Referenz falsch ? erhalten GSI und die Referenz-Zentren die gleichen Jobs ? Job-Verteilung muss überprüft werden (Sören/Jona) quota – Verbrauch auf /hera muss gemonitort werden, R. Grosso doppelte SE-Kapazität wird berichtet in MonaLisa. Muss investigiert werden. alles muss dokumentiert werden: wo ? Wiki ? Gridamin ?

5 non ALICE T2 - Todos Fertigstellung der Umgebung für verteilte Optimierung via Geneva, MPI, Scallapack, etc. (J. Knedlik) – funktionierende Testumgebung existiert – großer Test mit neuer Theoriesoftware steht aus Vorbereitung der Testumgebung für Geneva- Skalierungstests Ende Oktober (J. Knedlik) – Software-Installation und Konfigurierung ist in Arbeit

6 todos vom 26.10. Liste mit ALICE-T2-Rechnern zum Hochfahren für HPC erstellen mit Abhängigkeiten xrd – log – Löschskript (S. Fleischer) – Info beim nächsten Meeting in 2 Wochen PANDAGrid – Installation FairRoot und PandaRoot in CVMFS – ROOT scheitert an libfreetype. beantragen auf Build-Server oder Florian fragen, wie man die Lib vermeiden kann


Herunterladen ppt "ALICE GSI identified TOdos. ALICE T2 TODOs Skript zur automatischen Fehlersuche – in Arbeit (S. Fleischer)  Info in 2 Wochen beim nächsten Meeting."

Ähnliche Präsentationen


Google-Anzeigen