Thomas Kaiser 1 Analyse von Performanceproblemen beim UNIX-Backup Server
netbackup2 Gliederung 1.Backup- und Archiv- Service 2.Wer nutzt netbackup? 3.Funktion der netbackup 4.Problem nach dem Aufrüsten 5.Mögliche Ursachen und Lösungen 6.Quellen / Kontakt
netbackup3 Backup- und Archiv- Service Bei einem Festplattencrash oder Datenverlust durch den Benutzer können Daten wieder geholt werden. Backup für kurze Zeit mindestens 2 Monate mehrere Versionen des Backups Archivierung über mehrere Jahre beliebig lange Zeit, bis zu 15 Jahre nur eine Version der Daten
netbackup4 Wer nutzt netbackup? „Das Backup“ -> Roboter + Unix = netbackup + Novell = rznwsave einfaches und schnelles Wiederherstellen eines Datenbestandes verursacht durch Benutzerfehler oder Systemcrash
netbackup5 Funktion der netbackup Zwischen- speicherung der Daten die von der Servern geliefert werden. Speicherung der Daten auf 100 GB AIT 3 Bändern Steuerung des Roboters
netbackup6 Gründe für die Speicheraufrüstung Der Speicherbedarf reichte aufgrund steigender Anzahl von Servern bei den Backups nicht mehr aus. Da die netbackup die Server in einer Nacht nicht mehr sichern konnte, wurde eine Speichererweiterung vorgenommen.
netbackup7 Problem nach dem Aufrüsten Speicher wurde erkannt aber: Bei geringem Speicherbedarf hohe Performance Sobald Speicher gebraucht wird geringe Performance Mit dem alten Speicher wurde eine höhere Leistung erzielt als mit dem neuen Speicher.
netbackup8 Speicherproblem? Vermutete Ursache: Speicher ist defekt oder hat das falsche Timing. Maßnahme: Ausbau des Speichers und Test des Speichers auf Funktion und Korrektheit des Timings. Ergebnis Messung hat ergeben, dass das Timing im Toleranzbereich liegt und ein Speicherbaustein defekt ist.
netbackup9 Speicherproblem? Vermutete Ursache: Die Maschine kommt mit dem großem Speicher nicht zurecht. Maßnahme: Schrittweiser Einbau des neuen Speichers und anschließender Test. Ergebnis: Die Leistung der Maschine ist noch immer nicht zufrieden stellend.
netbackup10 Leistungsvergleich Benchmark um das Problem des stehen bleiben von Skripts zu reproduzieren. Bei Jobs die weniger als 2/3 des Speichers brauchen, gute Performance. Über 2/3 Speicherbedarf bleibt der Job und damit das Programm oder Skript hängen.
netbackup11 Leistungsvergleich (HPC – Benchmark) MB GB GB CPU-Zeit GB CPU Zeit Benchmark mit verschiedenen Jobgrößen mit unterschiedlicher Speichermenge und CPU-Zeit im Vergleich.
netbackup12 Netzproblem? Vermutete Ursache: Die Maschine hat ein Problem mit der Gigabit Netzwerkkarte. Maßnahme: Neues Gigabit Interface sendet weniger IRQ anfragen, und hat keine Packetverluste. Ergebnis: Durch das Tauschen des Gigabit Interfaces wurden die Paketverluste drastisch reduziert, das Problem mit dem Arbeitsspeicher aber nicht beseitigt.
netbackup13 Hardwareproblem? Vermutete Ursache: Es gib ein verstecktes Hardwareproblem. Maßnahme: Tausch von Netzteil, Speicher, Bios und Platten der netbackup mit der rznews. Ergebnis: Es gab bei der netbackup keine Verbesserung dafür aber bei der rznews leichte Defekte als Folge des Umbaus.
netbackup14 Busproblem? Vermutete Ursache: Der interne Bus ist überlastet. Maßnahme: Aufstellen eines Bus-Plans und Analyse der Struktur der Maschine. Ergebnis: Die Kapazitäten der internen Busse sind ausreichend und gleichmäßig belastet.
netbackup15 Bus-Plan
netbackup16 Bus-Plan
netbackup17 Plattenproblem? Vermutete Ursache: Einzelne Platten überlastet, da nur lokal geschrieben wird. Maßnahme: Durch das Stripen kann die Geschwindigkeit gesteigert werden, indem die Daten gleichmäßig verteilt werden, so dass von allen Platten gleichzeitig gelesen werden kann. Ergebnis: Das reorganisieren der Daten brachte eine ausreichende Performancesteigerung.
netbackup18 Quellen HPC-Gruppe Helmut Krausenberger Rainer Woitok Stefan Turowski Kontakt
netbackup19 Vielen Dank für ihre Aufmerksamkeit !