Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

ALICE T2 KPI Status 14.9.2015. GSI ALICE T2 KPI ALICE T2 KPI - Vergleich direkter Vergleich der KPI-Werte mit 20.7. 2015 – Wall time delivered: nun konstant.

Ähnliche Präsentationen


Präsentation zum Thema: "ALICE T2 KPI Status 14.9.2015. GSI ALICE T2 KPI ALICE T2 KPI - Vergleich direkter Vergleich der KPI-Werte mit 20.7. 2015 – Wall time delivered: nun konstant."—  Präsentation transkript:

1 ALICE T2 KPI Status

2 GSI ALICE T2 KPI

3 ALICE T2 KPI - Vergleich direkter Vergleich der KPI-Werte mit – Wall time delivered: nun konstant >= 100% – 20.7.: 87% (Monat) – Job Error Rate: heute: 38% 20.7.: 58% – Storage Element Verfügbarkeit: heute: 0/0/ : 100/100/100 – Compute Efficiency: heute: 7/39/ : 94/58/76

4 wall time delivered status: green still a bit bumpy, but last month 1407 jobs in average (20.7.: 860 jobs) queued JA issue still needs to be addressed

5 compute efficiency compared with reference site (Straßburg) the difference to GSI is „improving“ – current ratio (81:72) – 20.7.: ratio was (94::78)  GSI is not improving but Straßburg declining...  reason maybe job pattern at least starting September 5 job efficiency is clearly related to SE availability

6 Sep 5 – xrd monitoring issue fixed GSI::SE is actually „used“ since then for writing. ApMon sends now to external interface of lxalird1, since then xrd usage data appear in alimonitor.cern.ch manual fix needs to be addressed by „Chef“ in order to be sustainable

7 lxalise3 – monitoring info Gründe für die Abstürze von lxalise3: -ev. Probleme mit Plattenplatz durch xrd logs  Maßnahme: Umziehen auf /var/log/xrootd -diverse High-Load-Peaks:  Maßnahmen: Inbetriebnahme von zweiter SE-Maschine

8 ALICE T2 – Error Rate last week – GSI (DONE/ERROR): 74000/ : 12500/9400 ERROR_V und ERROR_IB sowie ERROR_E noch keine Auto-Info von ERROR-Analyse-Skript – Straßburg (DONE/ERROR): 74000/12000

9 wöchentliche KPI-Analyse Trends: - Wall-time-Delivered: zunehmend - Error Rate: abnehmend, current wieder mehr, vermutlich durch SE – Probleme - Compute Efficiency: abnehmend – vermutlich wegen SE-Problemen - SE-Verfügbarkeit: stark abnehmend

10 wöchentliche KPI-Analyse #37: #36: #35: Dokumentierte Ausfälle: – 19.8.: Lustre-Ausfall – 01.09: Lustre-Ausfall – SE-Ausfälle: 19.8., 1.9., 7.9., 11.9., für die letzten 3 Ausfälle muss der Grund noch gefunden werden


Herunterladen ppt "ALICE T2 KPI Status 14.9.2015. GSI ALICE T2 KPI ALICE T2 KPI - Vergleich direkter Vergleich der KPI-Werte mit 20.7. 2015 – Wall time delivered: nun konstant."

Ähnliche Präsentationen


Google-Anzeigen