Hochverfügbarkeit.

Slides:



Advertisements
Ähnliche Präsentationen
Aufbau eines Netzwerkes
Advertisements

FlashCopy Lösungen für mySAP™ Business Hugo Boss
Bauteile des PC´c Werden vorgestellt: PC-Gehäuse Prozessor Tastatur
Übersicht RAID-Verfahren Labor für Betriebsdatenverarbeitung
:33 Architektur Moderner Internet Applikationen – Sonderthema 4 Copyright ©2003 Christian Donner. Alle Rechte vorbehalten. Architektur.
Systemverwaltung wie es Ihnen gefällt.
PC-Cluster.
SAP R/3 - Speichermanagement
On a Buzzword: Hierachical Structure David Parnas.
WS 2009/10 1 Systeme 1 Kapitel 1 Aufbau von Rechnern.
DNS – Domain Name System
Studiengang Informatik FHDW
Haupt- und Arbeitsspeicher
Linux-HA-Cluster – Heartbeat mit DRBD
Einführung in die Technik des Internets
Einführung MySQL mit PHP
M A P K I T Management eines J2EE basierten eCommerce Systems am Beispiel des ATG Dynamo Applikationsservers und BMC Patrol als Managementframework.
Der Prozessor - zentraler Bestandteil eines jeden Computers
Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme
Der Bully-Algorithmus a.) Prozess 7 ist ausgefallen. Der Ausfall wird von Prozess 4 bemerkt. Prozess 4 startet eine Auswahl.
Entwicklung verteilter eingebetteter Systeme - Einführung
Prof. Dr. Gerhard Schmidt pres. by H.-J. Steffens Software Engineering SS 2009Folie 1 Objektmodellierung Objekte und Klassen Ein Objekt ist ein Exemplar.
Generelles POVs müssen immer lizenziert werden
Unbeaufsichtigte Installation - Präsentation - Flexibel Automatisch Integriertes Changemanagement © 2012 exilschwaelmer.de.
Duo- und Quad Prozessor-Architektur
Stand: November Anforderungen an Systemumgebung und Hardware Anmerkung Gollas, Schulamt Freising: Für unsere Schulen kommt eine Mehrplatz Installation.
Copyright © 2013 DataCore Software Corp. – All Rights Reserved.. Mit Speichervirtualisierung mehr Effizienz, Performance und Kostenreduktion erreichen.
Timo Brueggemann Dir. Business Development Stratus Technologies.
Systeme 1 Kapitel 4 Prozesse WS 2009/10.
Präsentation von Alexander Schönfeld
Aufbau eines von-Neumann- Rechners Marcel Waldvogel.
PSI - Überblick und Szenarien
Firewall.
Systemaufbau / Komponenten
Grundlagen: Client-Server-Modell
Beschreiben Sie das Szenario wenn ein ORB einen Server aktiviert und eine Objektimplementation aufruft. Activate Server impl_is_ready Activate Object (GetID.
Präsentation von Lukas Sulzer
Replikation und Synchronisation
Flexible Datensicherung für kleine und mittlere Unternehmen
Netzwerke.
ADAT©2010 Dipl. - Ing. Andrea SabinSeite: 1 Version 1.0c Adat Semester 1.
Rechnersysteme: Halbzeit Marcel Waldvogel. Marcel Waldvogel, IBM Zurich Research Laboratory, Universität Konstanz, , 2 Daten und Information.
Netzwerke.
Eine Übersicht von Margarete Streitwieser
DNS DNS Das Domain Name System ist der Dienst im Internet, der DNS Namen in entsprechenden IP Adressen umsetzt und umgekehrt auch IPAdressen Namen zuordnen.
Vs Objektpufferung (caching) = dynamische, ad-hoc-Replikation einer Primärkopie: Zugriffswilliger beschafft sich temporär eine lokale Kopie cache.
->Prinzip ->Systeme ->Peer – to – Peer
Gaming-Computer-Aufbau
CODA - Installation Installation der Binärdateien –Venus: Client-Programm –Vice: Server-Programm –Für Windows existiert eine Alpha-Version (Coda Client.
Internet-Grundtechnologien. Client / Server Client („Kunde“): fordert Information / Datei an im Internet: fordert Internetseite an, z.B.
Software-RAID-5 mit Windows 2000 Professional Projektarbeit 2003.
2.3 Implementierung von Prozessen
User Mode Linux Sven Wölfel 1. Juni User Mode Inhalt  Was ist UML?  Wofür kann man UML benutzen?
Vs61 6 Fehlertoleranz. vs62 Zuverlässigkeit (reliability) Sicherheit vor FehlernSicherheit vor Angriffen (safety)(security) WS/SS xySystemsicherheit SS.
Der Taskmanager ist Bestandteil des Betriebssystems, der als Prozessmanager Prozessmanager unter anderem die aktuell laufenden Programme und Prozesse.
RAID-Systeme - Standards - Leistungsmerkmal - Redundanz - Datensicherheit eine Präsentation von Jochen Throm an der Berufsakademie Mosbach.
RAID Level. RAID 0 (Striping)  RAID 0 (Stripeset; “Streifensatz”) Mehrere HDDs zusammenfassen und gleichzeitig darauf zugreifen. Hohe Transferraten bei.
Dr. Klaus Ruhlig Technology & Product Consulting Sun Microsystems, München Skalierbare Rechnerarchitekturen für ein DWH: Eine vergleichende Analyse.
Rechen- und Kommunikationszentrum (RZ) Strukturierte Datensammlung in verteilten Systemen für den DHCP-Service Tim Becker Seminararbeit / /
Multiprocessing mit OpenMPI Marius Albath. Vorlesung Betriebssysteme, Was ist OpenMPI Was ist OpenMPI OpenMPI Standard Setup OpenMPI Standard.
Promise EX4650 & EX8650 Controller Allgemeines: – Es müssen immer Festplatten Konfiguriert werden, da ansonsten für das Betriebssystem keine Laufwerke.
LSI8204ELP & Onboard SATA Controller Allgemeines: – Nicht konfigurierte Festplatten werden automatisch als Single Disks bzw. Logical Drives (einzelne Laufwerke)
Microsoft Exchange Storage Recovery und Automatic Database Reseed Repariert sich Exchange wirklich alleine?! Herzlich Willkommen zum Webinar Referent:
RAID Controller Guide - Allgemeines - Glossar - RAID Level - RAID Controller.
Wechsel von Oracle Cloud Control 12c zu 13c
LINUX II Unit 6 RAID & LVM.
Port-Forwarding Der PC möchte vom Internet aus auf den http-Server zugreifen. Er sieht nur die IP-Adresse und den Port des Routers. http-Server PC Router.
Othmar Gsenger Erwin Nindl Christian Pointner
Shared Memory Programmierung: Grundlagen
 Präsentation transkript:

Hochverfügbarkeit

Gliederung Einführung Prozessor Kryptographischer Koprozessor Speicher Ein-/Ausgabe Weitere Hardware Parallel Sysplex Sysplex Failure Management Automatic Restart Manager Workload Balancing Software

Einführung Verfügbarkeit = Zeitanteil, zu dem das System seine Funktion wie spezifiziert erfüllt Hochverfügbarkeit ab 99,999% => 5 Min. Ausfallzeit/Jahr erreicht durch hohes Maß an Redundanz an allen möglichen Fehlerstellen Redundanz = Vorhandensein von Mitteln, die für die Funktionserfüllung nicht notwendig sind Nach außen hin kein Fehler sichtbar

Prozessor

Prozessor jede PU (Processor Unit) der zSeries 900 enthält doppelte Instruction/Execution Units, die simultan arbeiten Ergebnisse werden verglichen, bei Abweichung Instruction Retry bei weiterem Fehler Speichern des Zustands und Umschalten auf Reserve-PU falls keine freie PU vorhanden, wird der Zustand an eine andere aktive PU übergeben bei Fehler eines SAP und keiner Reserve-PU wird ein aktiver CP (Central Processor) als SAP eingeteilt SAP (System Assist Processor): I/O-Prozessor

Kryptographischer Koprozessor 2 Cryptographic Coprocessor Elements (CCE) pro System Betriebssystem wiederholt fehlgeschlagene Instruktion auf dem anderen CCE pro CCE ein Pfad zu einer primären PU sowie zu alternativer PU (immer nur 1 Pfad aktiv) Alternativ-PUs werden als letztes als Reserve- PUs benutzt

Speicher L1 Cache Parity protected L1 und L2: Löschen/Austauschen von Zeilen L2 und Memory: Error Correcting Codes (Single Error Correction/Double Error Detection) bei Parity/ECC-Fehler neuer Versuch, danach löschen der Cache-Zeile ECC auch für Daten- und Status/Kommando- Busse Speicherkarten sind mit Reservechips ausgerüstet Durch memory protect keys kann kein anderer Prozess (insbesondere kein fehlerhafter) auf Daten eines anderen Prozesses zugreifen => Isolation

Ein-/Ausgabe CPU Haupt- speicher Channel Subsystem Control Unit Channel Path Control Unit Control Unit Subchannel E/A E/A E/A E/A

Ein-/Ausgabe mehrere Channel Paths zur gleichen Control Unit ein E/A-Gerät kann mit mehr als einer Kontrolleinheit verbunden sein Verbindung einer CU mit mehr als einem System im Parallel Sysplex möglich dynamische I/O-Konfiguration ESCON 16-Port I/O-Card beinhaltet 1 Reserve- Port bei Versagen eines MBA partieller Neustart ohne entsprechende I/O-Verbindungen möglich MBA=Memory-Bus-Adapter

Weitere Hardware zur höheren Verfügbarkeit redundante Stromzufuhr, interne Batterie verfügbar redundante Kühlsysteme je System zwei External Time Reference-Karten und redundante Pfade zu den Clustern RAID (Redundant Array of Inexpensive Disks): verschiedene Level der Redundanz für Plattenspeicher (Hamming-Code, Parity) Disk Mirroring

Cluster-Typen Cluster = lose gekoppelte Anordnung mehrerer SMPs (Knoten) High Availability Cluster: Heartbeat-Monitoring- Prozess überträgt die Verarbeitung bei Ausfall des primären Servers auf einen Backup-Server, der sonst beschäftigungslos ist Parallel Cluster: manuelle Aufteilung der anfallenden Arbeit auf die Knoten Shared Cluster: WLM verteilt Arbeit dynamisch auf die einzelnen Knoten High Av.: cold standby(standby server übernimmt IP-Adresse sowie Kontrolle über Shared disks), Shared Cluster: mutual-takeover-Umgebung: aktives System übernimmt Prozesse vom fehlerhaften System Variationen: 3 Server, davon 1 Backup

Unterscheidung nach Zugriff auf Plattenspeicher Shared Nothing: nur ein Knoten kann auf einen bestimmten Plattenspeicher zugreifen => statische Aufteilung des Workloads Shared Disk: jeder Knoten kann auf alle Plattenspeicher zugreifen =>Datenkohärenzsteuerung nötig Parallel Sysplex implementiert Shared Disk(Data) Anstatt Datenkohärenzsteuerung besser Lock-Management Software?;shared Data zur höheren Skalierbarkeit

Parallel Sysplex redundante CF, ETR; Sysplex Timer wichtig für gleiche Zeiten bei Log-Recovery

Sysplex Failure Management integriert in OS/390 erlaubt Definition einer sysplex-weiten Policy Policy legt Fehlererkennungsintervalle und Wiederherstellungsaktionen für den Ausfall eines Systems im Sysplex fest Fehlerarten: Ausfall der Signalverbindung zwischen Systemen, Status Update Missing Condition Status Update Missing Condition: System erneuert nicht seinen Status innerhalb eines bestimmten Zeitintervalls =>z.B.System-Isolation Erklärung System-Isolation!

Automatic Restart Manager Teil von OS/390 ausgefallene Anwendungen können automatisch auf gesunden Systemen im Parallel Sysplex neu gestartet werden oder auf dem selben System, falls dies nicht ausgefallen ist kennt Zustände aller Prozesse auf allen Systemen, bemerkt sofort alle Systemausfälle, benutzt WLM um geeignetes System für Restart zu finden Prozesse können in Restart Groups zusammengefasst werden Zu sagen: je schneller Restart geht, desto kürzer ist die Ausfallzeit

Reihenfolge der Restart-Aktivitäten kann festgelegt werden in hot-standby-Umgebungen (Backup-Server) kann der Restart des ausgefallenen Servers unterdrückt werden Prozesse registrieren sich zum Start beim ARM, melden sich beim Herunterfahren ab

Workload Balancing nötig, um die eingehende Arbeit im Sysplex zu verteilen oder im Fehlerfall umzuleiten dabei muss der ganze Sysplex nach außen eine einzige Identität haben (Host Name oder IP- Adresse) 2 Kategorien von Lastverteilungslösungen: DNS mapping solutions, Connection dispatching

Domain Name Server mapping solutions dynamisches Wechseln der DNS-Einträge, um einem Hostnamen versch. IPs (und damit Server) zuzuordnen Round-Robin: DNS kreist durch Liste mit IP- Adressen => Workload auf Server unbetrachtet Connection Optimization: DNS betrachtet Arbeitslast der einzelnen Server, Messergebnisse vom Workload Manager Nachteil: Auswahl des Servers nur bei Verbindungsaufbau

Connection dispatching solutions Client hat Verbindung mit Verteilerknoten, dieser leitet die Daten an entspr. Server weiter, der dann direkt dem Kunden antworten kann alle Systeme im Cluster liefern Informationen über ihre aktuelle Arbeitslast an den Distribution Manager Backup-Verteilerknoten überwacht Zustand des primären Verteilers und übernimmt die Arbeit bei Ausfall Verteilerknoten in PC, im Sysplex oder im Router

Softwarefeatures MQSeries, DB2 usw. benutzen ARM MQSeries: automatic rerouting of messages if target machine is unavailable Fehlerbehandlungsmaßnahmen der Datenbanksysteme Zeit des Neustarts eines Queue-Managers hängt von der Menge der Recovery-Aufgaben ab, MQSeries benutzt ARM (bei OS/390)