Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

ClusterLion. Unternehmenskritische Applikationen müssen heute jeder Zeit verfügbar sein! Hochverfügbarkeit der IT „Heute eine Grundlage und keine Option“

Ähnliche Präsentationen


Präsentation zum Thema: "ClusterLion. Unternehmenskritische Applikationen müssen heute jeder Zeit verfügbar sein! Hochverfügbarkeit der IT „Heute eine Grundlage und keine Option“"—  Präsentation transkript:

1 ClusterLion

2 Unternehmenskritische Applikationen müssen heute jeder Zeit verfügbar sein! Hochverfügbarkeit der IT „Heute eine Grundlage und keine Option“ Die meisten Branchen sind heute von einer funktionierenden IT abhängig. Daher ist permanente IT Verfügbarkeit „Always-ON“ für viele Unternehmen eine Grundvoraussetzung und keine Option mehr. Jeder Ausfall kostet Geld und Image!

3 Die Werte der Branchen und Studien variieren, doch fest steht, IT Downtime verursacht beträchtlichen Schaden! Wie viel kostet IT Downtime?

4 Redundante Hardware Kein single Point of Failure innerhalb der Systeme Zumindest zwei räumlich getrennte Rechenzentren Synchrone Datenspiegelung Cluster Technologie für transparenten Site Failover Doch auch in der Cluster Technologie gibt es Szenarien, wo das zentrale System ausfallen kann. In diesem Fall entsteht beträchtlicher Schaden für das Unternehmen! Hochverfügbarkeit erreichen

5 Was ist ein Split Brain Zustand? Wikipedia: Split Brain ist in der Informatik ein unerwünschter Zustand eines Computerclusters, bei dem alle Zwischenverbindungen zwischen den Clusterteilen gleichzeitig unterbrochen sind. Zur Koordination der Transaktionen im Cluster wird in der Regel ein Cluster Interconnect verwendet. Wird die Verbindung zwischen einem oder mehreren Teilen des Clusters über diesen Weg unterbrochen, kann keines noch unterscheiden ob es sich um einen partiellen Ausfall oder eine Trennung handelt. Alle diese (nun isolierten) Clusterfragmente arbeiten für sich weiter, um die Bereitstellung des Dienstes aufrechtzuerhalten.

6 Srvc(a) Heartbeat Hardware Fehler aktiv/aktiv Cluster o Beispiel: Hardware Ausfall o Cluster Service (a) wird automatisch auf den zweiten Cluster Node gestartet (Takeover) Srvc(b) Srvc(a)

7 Leitungsausfall o Beispiel: Leitungsausfall o Cluster Services werden nicht automatisch übernommen, jede Site läuft autark weiter. o Sobald die Leitungen wieder verfügbar sind, werden die Daten synchronisiert und der Cluster befindet sich wieder im Normalzustand. Heartbeat aktiv/aktiv Cluster Srvc(a) Srvc(b) Srvc(a)

8 o Beispiel: Stromausfall im Rechenzentrum o Der Cluster weiß nun nicht ob es sich nur um einen Leitungsausfall oder um einen Stromausfall handelt! Service (a) wird nicht automatisch übernommen! o Service (a) geht nun offline! o Nur durch einen manuellen Takeover oder einen dritten Standort (Quorum) kann das Service übernommen werden. Desasterfall, Stromausfall, etc. aktiv/aktiv Cluster Heartbeat Srvc(b) ? Srvc(a) Manual Cluster Takeover Srvc(a)

9 7-Mode MetroCluster B Srvc (b) cf giveback A A3 A2A1 B4B3 B2B1 Srvc (a) system01 failed ! takeover! stretched HA A/A Controller Failure Scenario 1.1st Controller fails 2.Identity „moves“ to 2nd controller 3.I/O passes through 2nd controller 4.After repairing1st controller, issue „cf giveback“ 5.Identity „moves“ back to 1st controller 6.Normal operations continues

10 7-Mode MetroCluster A A‘ B B‘ Srvc (a) Srvc (b) MC Site Failure Scenario 1.Entire Site A fails 2.2nd controller checks heartbeat, disk- connections and IP connection while still serving it‘s data 3.Human or process on 3rd Site identifies site-failure 4.Issue „cf takeover –d“ 5.Identity „moves“ to second controller MC Site Failure Scenario 1.Entire Site A fails 2.2nd controller checks heartbeat, disk- connections and IP connection while still serving it‘s data 3.Human or process on 3rd Site identifies site-failure 4.Issue „cf takeover –d“ 5.Identity „moves“ to second controller SiteA down or site-connection broken? cf takeover -d cf giveback

11 MC Fabric Srvc(b) Srvc(a) cDOT MetroCluster, local HA no automatic Takeover between Datacenter stretched HA local HA

12 Data ONTAP 8.3 MetroCluster Management und Desaster Recovery Guide

13

14 ClusterLion, die Lösung!

15 UPS Grid 100m Ethernet RS232 Q Remote Quorum 100m Ethernet RS232 Monitoring: Power Storage Controller Partner Status Heart-Beat 1. Reporting: A1: Lost Cluster Partner B1: Lost Cluster Partner A2: not responding any more B2: not responding any more 2. Action: A2: Power off B2: Power off A1: force Takeover B1: force Takeover Q: Open Helpdesk Ticket Takeover ClusterLion-AP (Advanced Protection) open Ticket Partner Helpdesk Support Customer during Giveback Telco B Telco A Use Case: Site Desaster UPS Grid MC Fabric “Giveback” A1 B1 A2 B2 Srvc(b) Srvc(a) Srvc(b)

16 ClusterLion-AP erhöht die Verfügbarkeit eines zwei-Standorte Storage Clusters! Deutlich geringere Kosten im Vergleich zu einem traditionellen Quorum Standort (Leitungskosten, Betriebskosten, Aministration)! Selbst bei einem Site Desaster (K-Fall) an einem Standort werden die Cluster Services ordnungsgemäß übergeben und alle Applikationen bleiben verfügbar! Durch lokales Abschalten wird eine Dateninkonsistenz aufgrund eines Split Brain Syndroms durch ClusterLion ausgeschlossen! An jedem bestehenden NetApp MetroCluster kann ClusterLion unterbrechungsfrei nachgerüstet werden und so die Verfügbarkeit der unternehmenskritischen Applikationen weiter steigern! Vorteile durch ClusterLion-AP

17 Alleinstellungsmerkmal (USP) speziell in NetApp MetroCluster Projekten! Höhere Marge durch den Verkauf von zusätzlichen Services (Premium Contract)! „Door opener“ bei Bestandskunden der Mitbewerber! Vorteil bei Ausschreibungen durch geringere TCO im Vergleich zu einem 3 Standorte Konzept! Technisch valide Antwort auf Witness-Konzepte der Mitbewerber (z.B. EMC vplex, etc.) Höhere Sicherheit und Verfügbarkeit für den Kunden! Mehrwert für ClusterLion Reseller

18 Basiert auf HighEnd Industrie Komponenten Überwacht Stromversorgungen, Netzwerk, Interconnects und die Dienste des Clusters. Kommuniziert über zwei getrennte und vom Cluster unabhängige Kommunikationskanäle. Bei Beeinträchtigung der Storage Services wird ein automatischer Takeover im Storage Cluster ausgelöst und die Gefahr von Split-Brain mit Garantie ausgeschlossen. Die Storage Services laufen weiter – keine Downtime! ClusterLion im Detail

19 7x24 Telefon Support Proaktive Benachrichtigung des Kunden Automatisches Support Ticket am Partner Helpdesk Unterstützung beim Cluster Giveback Premium Support f. Partner

20 ClusterLion ohne Frontblende „hot swap“ Battery ClusterLion (front view)

21 4x Power Input 4x Power Output (UPS max W) 2x Cooling Fans 2x 24V Output for UMTS Gateways Reset Button 2x Serial Consol Port 6x Ethernet Connectivity ClusterLion (rear view)

22 ...ob man sich einen Betrieb ohne ClusterLion leisten kann? Vielen DANK! Die Frage ist nicht ob man sich ClusterLion leisten kann? Sondern...


Herunterladen ppt "ClusterLion. Unternehmenskritische Applikationen müssen heute jeder Zeit verfügbar sein! Hochverfügbarkeit der IT „Heute eine Grundlage und keine Option“"

Ähnliche Präsentationen


Google-Anzeigen