1 DeDuplication Speicher Systeme > Gründung: 2001/ Hauptsitz in Santa Clara (CA) / +600 Angestellte > Umsatz: 2006 ca. $52 M. / 2007 ca. $122 M. / 1 HJ.

Slides:



Advertisements
Ähnliche Präsentationen
MOBILE SICHERHEIT: THE GOOD, THE BAD & THE UGLY QUELLE: TOSHIBA EUROPE GMBH.
Advertisements

2. November 2004 Iomega Corporation André Armstrong Product Marketing Manager - New Technologies EMEA.
Software Assurance Erweiterte Software Assurance Services
FlashCopy Lösungen für mySAP™ Business Hugo Boss
Web Storage System - Einrichten, Verwalten und Anwendungsmöglichkeiten
Karo IT Viehmarkt Neumarkt Karo IT Neumarkt GmbH | Tel.:
Virtual Storage Das Fundament für Total Enterprise Virtualization.
How many of these flags do you recognise? Work with your partner to see if you know many – write them down - some will crop up shortly!
Design- und Entwicklungswerkzeuge
<<Presentation Title>>
TERRA SERVER Referent: Martin Klein 1 1.
NATURAL Web-Integration 1 / 27/28-Feb-98 TST NATURAL Web-Integration Arbeitskreis NATURAL Süd Theo Straeten SAG Systemhaus GmbH Technologieberater Stuttgart.
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil2.
Virtualisierung mittels VMware und Datacore SANMelody
AFS-Workshop 2005 Statusbericht Rechenzentrum TU Braunschweig
Ralf KüstersDagstuhl 2008/11/30 2 Ralf KüstersDagstuhl 2008/11/30 3.
IBM Workplace Forms - In Kürze © 2007 IBM Corporation XML basierte elektronische Formulare: Effizienzsteigerung und Kostenreduktion durch Automatisierung.
INSTITUT FÜR DATENTECHNIK UND KOMMUNIKATIONS- NETZE 1 Harald Schrom ViEWcon08.
TANDEM-X: Zwei gegen den SAM-FS-Cache Stephan Schropp DLR Oberpfaffenhofen.
SKALIERBARE HARDWARE UNABHÄNGIGE LÖSUNGEN FÜR HSM, ARCHIVIERUNG UND SICHEREN DATENAUSTAUSCH YOUR DATA. YOUR CONTROL.
Netzwerke | Serversysteme | Client-Service | Groupware Darmstadt The Game Changer Microsofts Hyper-V v3 & HPs Insight Online Thorsten Podzimek,
Backup und Recovery sehr großer Datenbanken
Performance-Steigerung durch schnelle Festplatten Ulrich Dinger.
Backup Warum Datensicherung? Löschen von Daten durch den Benutzer
Der führende Anbieter von SecureZIP Lösungen 20. July, 2004.
SSDs im SAN – Praxisbericht Teil3
Windows Server 2008 Kurzüberblick Dr. Richtmann+Eder AG Olschewskibogen München.
| Basel Wege in die Cloud: Office 365 Dennis Hobmaier, Technical Solutions
Präsentation läuft auch vollautomatisch ab … wie du möchtest
Universität Zürich Informatikdienste GoKoordinatorenmeeting 27. April UZH Global Storage Projekt.
Archival and Discovery
1© Copyright 2011 EMC Corporation. Alle Rechte vorbehalten. EMC NETWORKER – BACKUP UND RECOVERY FÜR VM WARE.
ÜBERSICHT ÜBER EMC DATA DOMAIN
… eine solide Basis für langfristigen Erfolg
EMC NETWORKER UND DATENDEDUPLIZIERUNG
Vorlesung Datenbanksysteme vom Physische Datenorganisation
SAN der zweiten Generation Compellent … in weniger Speicher investieren Christian Browers – BDM - DE / A / CH.
Digital Dashboard Toolkit 2001 SharePoint Portal Server released targeting portal market SharePoint Team Services (STS) released as free add-
Einheitliche Backup- und Recovery-Software
Hs-soft.com H&S EUROPE Wien – Schwabach hs-soft.com | Datenmanagement hs-soft.com H&S EUROPE Wien – Schwabach hs-soft.com |
UHZ / 2Roberto Mazzoni - Informatikdienste Geschichte MySql-Service im Portfolio der Informatikdienste seit 2000 Ablösung der Filemaker.
M. Lautenschlager (M&D/MPIM) / / 1 WDC Konsortium Meeting Oberpfaffenhofen, 24/ )CERA-DB 2)WDCC Homepage 3)DLR EOWEB Zugang 4)Kostenmodell.
Seit 2006 auf virtuelle Umgebungen spezialisiert Mitarbeiter Global Headquarter in der Schweiz Unternehmen setzten beim Backup strategisch.
SSDs im SAN – Praxisbericht Teil2 Erich Eckel Österreichische Lotterien Storage Management.
SSDs im SAN - Praxisbericht Erich Eckel Österreichische Lotterien Storage Management.
VMware® Virtual SAN™ Klassisches SAN. VMware® Virtual SAN™ Klassisches SAN.
Der Erotik Kalender 2005.
EMC End-to-End-Funktionen für Microsoft
1© Copyright 2012 EMC Corporation. Alle Rechte vorbehalten. EMC NETWORKER MODULE FOR SAP WITH ORACLE Vollständige Backup- und Recovery- Lösung für SAP.
1© Copyright 2012 EMC Corporation. Alle Rechte vorbehalten. EMC NETWORKER MODULE FOR DATABASES AND APPLICATIONS Einheitlicher Schutz für DB2, Informix,
Webspace Stephan Herbst Christian Köhler. Themen des Vortrages Kurze Einführung ins Thema Kurze Einführung ins Thema Webspace - Was? Wozu? Wo? Wie? Webspace.
RETAIL 2010 MAXIMALER SCHUTZ MINIMALE BELASTUNG. RETAIL 2010 MAXIMALER SCHUTZ MINIMALE BELASTUNG Nur 8 MB Speicherverbrauch.
Softwaredefined Enterprise Axel Gronert März 2015 Schneller reagieren in einer dynamischen Welt © 2015 VMware Inc. Alle Rechte vorbehalten.
Was spricht für EMC für SQL?
3rd Review, Vienna, 16th of April 1999 SIT-MOON ESPRIT Project Nr Siemens AG Österreich Robotiker Technische Universität Wien Politecnico di Milano.
Hadoop-as-a-Service (HDaaS)
Prof. Dr. T. Kudraß1 Speicherverwaltung: Flash-Laufwerke.
The PowerLanguage Platform © PowerLanguage™ Ltd KEY LANGUAGE Term 3 GERMAN.
Rechen- und Kommunikationszentrum (RZ) TSM vs. inSync Seminarvortrag am von Nicole Temminghoff Betreut von: Prof. Dr. Andreas Terstegge Dr.
The PowerLanguage Platform © PowerLanguage™ Ltd KEY LANGUAGE P7 / YEAR 1 / BLOCK 3 GERMAN.
Robert Graf | CEO Mobile
NetApp Alliance ProLion CEO Robert Graf
Kaseya System Backup and Recovery
RMAN versus NSR-ORA Vergleich und Bewertung
Premiere Conferencing GmbH
Erweiterte Azure Dienste
Der Kalender L3 GERMAN PRIMARY 5.
Die Stadt Aarau setzt für das Backup im RZ auf
OFFICE 365 FOCUS SESSION SHAREPOINT ONLINE 101:LERNE DIE BASICS 19. März 2018 Höhr-Grenzhausen.
Open-E JovianDSS Einführung
 Präsentation transkript:

1 DeDuplication Speicher Systeme > Gründung: 2001/ Hauptsitz in Santa Clara (CA) / +600 Angestellte > Umsatz: 2006 ca. $52 M. / 2007 ca. $122 M. / 1 HJ 2008 ca. $114 M. > Weltweite Support Infrastruktur (1.630 Stützpunkte) > installierte Systeme weltweit > Kunden > Petabyte Daten Zeitlinie Data Domain First Dedupe NAS First Dedupe Volume Replication First Dedupe Volume Replication First Dedupe Gateway Largest Dedupe Array First Dedupe Directory Replication First Dedupe Directory Replication First Dedupe VTL First Dedupe Nearline Storage 2008

2 Marktbetrachtung: Capacity Optimized Storage (COS) COS Tape Automation 2006 Revenues $M When viewed through the data deduplication lens, Data Domain took a lions share of the market with 53% of the storage with data deduplication in 2006, according to our estimates. Source: Arun Taneja, SearchStorage.com, May 2, 2007 Data Domain has enjoyed the market leadership position in the midrange data deduplication space for at least two years now. We believe that Data Domain today continues to hold a 9 to 12 month technology lead over its nearest competitor. Meanwhile the company is aggressively expanding its products both up and down the performance spectrum. Source: RBC Capital Markets Corp. - Enterprise Systems Perspectives Deduplication: Proliferation and Confrontation Ahead, June 2008 Source: Taneja Group - Next Generation Data Protection Market Profile, December 2006

3 Data Domain – Hauptmerkmale Integration: Einfache Einbindung in bestehende Umgebungen Technologie: DeDuplizierung Sicherheit: Data Invulnerability Architektur Effizienz: Replikation für DR

4 Integration 3U (15) 500 GB SATA drives RAID-6 NVRAM N+1 Fan Ports 5.4 to 21.6 TB with Shelves File System (Gateway: EMC, HDS, Nexsan, Pillar, NetApp, 3PAR, LSI, IBM, HP) CIFS, NFS, NDMP OST FC = VTL Replikation … Nearline Applikationen

5 3FB0734C 5B2B36AC842194A3214DCF8947 Technologie im Detail 3FB0734CD7DC8B935B2B36AC842194A3214DCF8947 D7DC8B93 Pointer

6 94A3214DCF8947 5B2 3FB0734C 5B2B36AC842194A3214DCF8947 B36AC8421 3FB0734C Pointer Technologie im Detail

A3214DCF8947 5B2 3FB0734C A3214DCF8 Technologie im Detail

B2 3FB0734C 3FB0734C5B Technologie im Detail

9 Variable Segmente vs. Blocklevel Segmemte von variabler Größe haben entscheidende Vorteile ! Feste Blockgröße versagt bei den meisten Veränderungen Variable Startpunkte verbessern das Auffinden von Dubletten Startpunkte Redundante Segmente Ichbinim Zoo bei den Affen Siesind imZoobeidenAffe IchwarbeidenAffen imZoo Paul und ich warenim Zoo bei den Affen

10 Second Friday Full Backup BCDEFLGH Daten-DeDuplizierungseffekt ABCDEFG HIJ Friday Full Backup ABCDAEFG Mon Incr ABH Tues Incr CBI Thurs Incr ACK Weds Incr EGJ BACKUP DATALOGICALESTIMATEDPHYSICAL REDUCTION Monday Incr 100 GB 7-10x 10 GB Tuesday Incr 100 GB 7-10x 10 GB KL Wednesday Incr 100 GB 7-10x 10 GB Thursday Incr 100 GB 7-10x 10 GB 2 nd FRIDAY FULL 1 TB 50-60x 18 GB TOTAL 2.4 TB 7.8x 308 GB FRIDAY FULL 1 TB 2- 4x 250 GB

11 Week 1 BACKUP DATALOGICALESTIMATEDPHYSICAL REDUCTION Feb TB 14x 890 GB März TB 16x 940 GB April TB 18x 980 GB April 14 19,4 TB 18x 1050 GB April TB 19x 1130 GB TOTAL 23.4 TB 20x 1178 GB Jan TB 11x 714 GB Längere Aufbewahrungszeiten mit der selben Diskkapazität ! Week 2 Week 3 Month 1 Month 2 Month 3 Month 4 April TB 20x 1178 GB Daten-Deduplizierungseffekt

12 Online-DeDuplizierung Online Erkennung von Redundanzen IO basierender Prozess benötigt CPU & RAM Leseverifizierung der Daten direkt beim Schreiben Asynchrone Replikation der Daten während dem Backup 1 X Schreiben auf primärer DD; 1 x Lesen für Replikation

13 Online-DeDuplizierung 4 TB Backup Replikation Kein zusätzlicher Plattenbedarf geringere Stromkosten Keine Software-Upgradegebühren für z.B. NetWorker notwendig Replikation kann unmittelbar mit dem Backup angestoßen werden DR fähig

14 Online versus Post - DeDuplizierung Festplatten I/O basierende Architektur Backup erfolgt direkt auf VTL Device und wird in Native Format abgelegt Wenn genügend System Ressourcen vorhanden sind beginnt die Deduplizierung Nach Abschluss der Deduplizierung beginnt die Replikation Kritisch im Bezug auf die Überwachung des Systemzustands Kritisch im Bezug auf die Systemperformance und Datenkonsistenz Benötigt zusätzliche Diskkapazität 1 x Schreiben Native; 1 x Lesen für DeDup; 1 x schreiben DeDup; 1 x Lesen für Replikation

15 Post-DeDuplizierung 10 TB BackupReplikation 4 TB DeDup Zusätzlicher Platzbedarf höhereStromkosten Zusätzliche Software-Upgradegebühren für z.B. NetWorker notwendig Extrem I/O-lastig Anfällig für Datenkonstistenzprobleme / hohe Wahrscheinlichkeit für Diskfragmentierung Replikation kann erst nach Post-Deduplizierung angestoßen werden DR fähig ?

16 Performance: CPU vs. HDD Source: Klassische Lösungen haben Nachteile gegenüber CPU bassierender DeDuplizierung Mehr Geschwindigkeit nur durch mehr Festplatten Verschwendung von Plattenplatz Höherer Managementaufwand / Kosten Faktor CPU Performance1 MIPS2,000,000 MIPS2,000,000 x Memory Size16 Kbytes32 Gbytes2,000,000 x Disc Drive Performance 60 msec5.3 msec 11 x

17 Durchsatz: CPU-centric Design Mit jeder Verdopplung der # Cores erhöht sich bei DD der Durchsatz um ~50% SISL (Stream Informed Segment Layout) CPU-centric Design Laufwerke Durchsatz 300 MB/sec 100 MB/sec 50 MB/sec Most Dedupe Vendors FC Drives: 2x SATA Geschw. 3-5x SATA Preis SATA Drives Data Domain

18 Recovery: Data Invulnerability Architektur Zusätzlicher Schutz RAID-6 NVRAM Snapshots Datenüberprüfung Check-Summe DeDup, auf Platte schreiben Verifizieren Selbstheilendes file system Cleaning Defrag Verifizieren Trust but verify – hope is not a strategy !

19 Replikation: WAN–Effizienz WAN home Backup Daten homeDIR A Quelle: Remote Sites Ziel: Data Center Hub % Bandbreitenreduzierung 1- 5% Echtes DR; reduziert WAN–Kosten; verbessert SLAs ! Backup Daten

20 Einheitliche Plattform für Archiv- und Backupdaten home Archiv und Backup auf einem System eine Plattform für mehrere Applikationen Backup Daten Archiv Daten WAN SnapShot für Datenintegrität Effiziente Replikation für DR

21 Skalierbarste Inline Deduplication Systeme DD500 Appliance Series DDX Array Series Replicator, VTL, Open Storage, Retention Lock Software Optionen Bis zu 16 Kontroller interner oder externer Storage DD120DD510DD530DD565DD580/gDD690/gDDX Array Durchsatz (GB/h) ,4 TB/h22,4 TB/h Logische Kap. (TB) ,08 PB710-1,7 PB11,3-28 PB Roh Kap. (TB),750Bis zu 3,75Bis zu 7,5Bis zu 23,5Bis zu 31,5Bis zu 48Bis zu 768 Nutzbare Kap. (TB),373Bis zu 2,7Bis zu 5,7Bis zu 16,2Bis zu 21,6Bis zu 35,3Bis zu 564 DD120 Für Außenstellen Gateway Series DD690 System DD690g DD580g

22 Data Domain – 10 Vorteile auf einen Blick ! Problemlose Einbindung in die vorhandene Backup-Software und Vereinfachung des Managements Datenreduktion von über 90% möglich (variables SI auf Segmentebene) Reduzierung von Wiederherstellungszeiten durch viel längere Aufbewahrung der Backupläufe auf Disk Extreme Datensicherheit durch eingesetzte Technologie z.B. RAID 6, Replikation, permanente Überprüfung der Daten auf Korruption (physisch und logisch) Einfache Umsetzung von DR-Konzepten durch Replikation Außenstellen mit Replikation über WAN-Leitung anbinden Performantes Backup/Recovery gerade auch in unternehmenskritischen Umgebungen und bei Datenbanken Optimal auch in virtuellen Umgebungen mit VMware Kosten für weniger benötigte Dokumente reduzieren (Speicherung von Archiv- und Backup-Daten auf der gleichen Data Domain Appliance) Green-IT: drastische Reduktion der Stromkosten, des Platzbedarfes und der Klimakosten

23 Was beim Thema DeDup berücksichtigt werden sollte Ist die Datenstruktur DeDup fähig ? Gibt es Referenzen mit meiner Applikation ? Können Außenstellen mit eingebunden werden ? Kann ein Leistungsfähiges DR–Konzept erstellt werden ? Technologie: Online oder Postprozess / CPU- oder Platten-basiert / fixe oder variable Blöcke? VTL oder Filesystem ? Managementaufwand & Sicherheit des Systems (bspw. Metadaten, Datenkorruption, Selbstheilung, RAID-Typ, Gegenmaßnahmen zur Fragmentierung) ? Implementierungsaufwand ?

24 Fortune 1000 Kunden Technology Telecom Public Sector Media/Entertainment Healthcare Industrial/Auto Consumer/Retail Financial Services Source: Data Domain

25 Kunden in Deutschland EMC NetWorker Gateway mit EMC Clariion Speicher 4 TB Daten Oracle, Mail und Flat File 4 Wochen retention SAN

26 Kunden in Deutschland Data Domain hat unsere Erwartungen mehr als erfüllt, in dem bei hoher Performance sehr gute DeDuplication Werte erreicht werden und der Betrieb absolut problemlos und zuverlässig läuft (Peter Langwieder)

27 Kunden in Deutschland Die Betreuung und der Know-How Transfer … hat sehr gut funktioniert und durch den Test konnte schon im Vorfeld die hervorragende Funktionsweise der DeDuplication der Data Domain Lösung ermittelt werden. Dies hat sich mittlerweile im produktiven Praxisbetrieb bestätigt. (Ljudevic Katovic)

28 Data Domain … the proven way to do DeDuplication