Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
Veröffentlicht von:Thilo Küchler Geändert vor über 7 Jahren
1
ALICE T2 KPI Status 14.9.2015
2
GSI ALICE T2 KPI
3
ALICE T2 KPI - Vergleich direkter Vergleich der KPI-Werte mit 20.7. 2015 – Wall time delivered: nun konstant >= 100% – 20.7.: 87% (Monat) – Job Error Rate: heute: 38% 20.7.: 58% – Storage Element Verfügbarkeit: heute: 0/0/61 20.7.: 100/100/100 – Compute Efficiency: heute: 7/39/57 20.7.: 94/58/76
4
wall time delivered status: green still a bit bumpy, but last month 1407 jobs in average (20.7.: 860 jobs) queued JA issue still needs to be addressed
5
compute efficiency compared with reference site (Straßburg) the difference to GSI is „improving“ – current ratio (81:72) – 20.7.: ratio was (94::78) GSI is not improving but Straßburg declining... reason maybe job pattern at least starting September 5 job efficiency is clearly related to SE availability
6
Sep 5 – xrd monitoring issue fixed GSI::SE is actually „used“ since then for writing. ApMon sends now to external interface of lxalird1, since then xrd usage data appear in alimonitor.cern.ch manual fix needs to be addressed by „Chef“ in order to be sustainable
7
lxalise3 – monitoring info http://lxmon13.gsi.de/ganglia Gründe für die Abstürze von lxalise3: -ev. Probleme mit Plattenplatz durch xrd logs Maßnahme: Umziehen auf /var/log/xrootd -diverse High-Load-Peaks: Maßnahmen: Inbetriebnahme von zweiter SE-Maschine
8
ALICE T2 – Error Rate last week – GSI (DONE/ERROR): 74000/46000 20.7.: 12500/9400 ERROR_V und ERROR_IB sowie ERROR_E noch keine Auto-Info von ERROR-Analyse-Skript – Straßburg (DONE/ERROR): 74000/12000
9
wöchentliche KPI-Analyse Trends: - Wall-time-Delivered: zunehmend - Error Rate: abnehmend, current wieder mehr, vermutlich durch SE – Probleme - Compute Efficiency: abnehmend – vermutlich wegen SE-Problemen - SE-Verfügbarkeit: stark abnehmend
10
wöchentliche KPI-Analyse #37: 7.-11-9. #36: 31.8.-4.9. #35: 24.-28.8. Dokumentierte Ausfälle: – 19.8.: Lustre-Ausfall – 01.09: Lustre-Ausfall – SE-Ausfälle: 19.8., 1.9., 7.9., 11.9., 13.9. für die letzten 3 Ausfälle muss der Grund noch gefunden werden
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.