Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

ALICE GSI identified TOdos. ALICE T2 TODOs alle T2 Services „chefisieren“ – alle SE – Dienste wurden mit Chef und Überwachung versehen – Vobox-Dienste.

Ähnliche Präsentationen


Präsentation zum Thema: "ALICE GSI identified TOdos. ALICE T2 TODOs alle T2 Services „chefisieren“ – alle SE – Dienste wurden mit Chef und Überwachung versehen – Vobox-Dienste."—  Präsentation transkript:

1 ALICE T2 @ GSI identified TOdos

2 ALICE T2 TODOs alle T2 Services „chefisieren“ – alle SE – Dienste wurden mit Chef und Überwachung versehen – Vobox-Dienste sind ebenfalls abgeschlossen Skript zur automatischen Fehlersuche – in Arbeit (S. Fleischer) – ebenso Visualisierung (Jona) Workflow aller Softwarekomponenten inklusive aller verwendeten Ports verstehen und dokumentieren – identisch mit „Chefisierung“ Queued Jas müssen in ML angezeigt werden. (R. Grosso) – SGE.pm muss ergänzt werden getNumberqueued wurde implementiert. getNumberRunning muss implementiert werde. Änderungen müssen noch in Produktionsbetrieb überführt werden alte Maschinen aus ML entfernen (lxgrid6, lxgrid9,...) – Costin wurde kontaktiert ALICE T2-Dienste müssen gemonitort werden (inklusive History) (R. Grosso) Kandidat: MonaLisa ALICE T2 – Umzug auf das neue Cluster – alien RunAgent muss noch getestet werden,  DONE, erste Jobs liefen in Kronos – neue vobox wurde beantragt. Implementieren und Testen bis 16.10.2015, ca. 100 Jobs vobox wurde in LDAP konfiguriert, installiert, Chef-Rezepte stehen, lediglich Test steht aus. – sync /hera - /nyx zur Vorbereitung von neuem SE ALICE T3 – transfers – Transfer – Einstellung, Wiki, configs, etc. automatisieren – Diskussion mit ALICE-Gruppe steht an

3 ALICE T2 todos KPI Performance – Begründung – Ausfälle pro Woche dokumentieren und warum ? – Am besten via Monitoring-Tool, z.B. MonaLisa ? HPC-Chef-Rezepte müssen noch getestet und übergeben werden – lustre_mount, ulimit, mlocate – Meeting mit V. Penso und D. Klein ist geplant

4 Todos vom 28.9. 2015 SE redirector: – load aufnehmen zum „balancen“: neue Synthax muss überprüft werden – I/O auf 0 setzen, balancing nur nach CPU-Last – fuzzy-Einfluss überprüfen, innerhalb durch fuzzy definierten Unsicherheitsbereich werden Server gleich behandelt Error Rate: – ist eventuell die Referenz falsch ? erhalten GSI und die Referenz-Zentren die gleichen Jobs ? Job-Verteilung muss überprüft werden (Sören/Jona) ALICE T2-Chefisierung erhält Vorrang gegenüber Job-“Scraping“ – Chef-Rezept für neue Vobox in 1 Monat benötigt  Delay von 2 Tagen es muss dafür gesorgt werden, dass das Ticket bearbeitet wird (KS)  wurde im TCM besprochen – Zeit zur Chefisierung der verbliebenen Services: 2 Wochen – danach weiter machen mit „Scraping“. Jona arbeitet parallel weiter am GUI. Infiniband-Interface der Datenserver wird noch nicht gemonitort, gelöst durch R. Grosso xrd-Proxy muss upgegraded und chefisiert werden quota – Verbrauch auf /hera muss gemonitort werden, R. Grosso 16.12.: alle Computer im Minicube werden wegen Strom abgeschaltet – Downtime muss deklariert werden. Fehler für xrd/SE – Ausfälle investigieren doppelte SE-Kapazität wird berichtet in MonaLisa. Muss investigiert werden. alles muss dokumentiert werden: wo ? Wiki ? Gridamin ?

5 non ALICE T2 - Todos Fertigstellung der Umgebung für verteilte Optimierung via Geneva, MPI, Scallapack, etc. (J. Knedlik) – funktionierende Testumgebung existiert – großer Test mit neuer Theoriesoftware steht aus Vorbereitung der Testumgebung für Geneva- Skalierungstests Ende Oktober (J. Knedlik) – Software-Installation und Konfigurierung ist in Arbeit


Herunterladen ppt "ALICE GSI identified TOdos. ALICE T2 TODOs alle T2 Services „chefisieren“ – alle SE – Dienste wurden mit Chef und Überwachung versehen – Vobox-Dienste."

Ähnliche Präsentationen


Google-Anzeigen