© 2012 TravelTainment Einführung in NoSQL-Datenbanken und deren Klassifizierung Von Patrick Becker.

Slides:



Advertisements
Ähnliche Präsentationen
Hauptseminar NoSQL ElasTraS und CloudTPS
Advertisements

Daten- und Informationsqualität. © Prof. T. Kudraß, HTWK Leipzig Management der Informationsqualität Keine verbindlichen Standards oder Vorgaben für Informationsqualität.
Datenbanken Einführung.
Relationaler Datenbankentwurf (II)
spezielle Nutzersichten formale Ebene (deskriptive Regeln)
Vs61 6 Verteilte Datenverwaltung. vs62 Ziel:Zusammengehöriger Datenbestand soll über mehrere Stationen verteilt werden, z.B. Fragmentierung: in mehrere.
Microsoft Access – Einführung – Allgemeine Technologien I
Das Entity-Relationship-Modell
Art der Arbeit (Projekt-/Studien-/Diplomarbeit/
Datenbankdesign und Normalisierung
Oberseminar Datenbanken Multimediale Datenbanken Christian Völschow.
Alternativen zu relationalen Datenbanken
Geometrische Objekte in Datenbanken Martin Pfeifle Institut für Informatik, Universität München Lehr- und Forschungseinheit für Datenbanksysteme Prof.
Normalformen Normalisieren Schlüssel
6 Normalformen Normalisieren Schlüssel
Informationssysteme SS Informationssysteme Grundvorlesung Informatik Sommersemester 2004 Universität des Saarlandes, Saarbrücken Dr. Ralf Schenkel.
Flache Datenstrukturen in der Operationsdokumentation.
Einführung und Überblick
... und alles was dazugehört
Bewertung von Cloud-Anbietern aus Sicht eines Start-ups
Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Anforderungen von eScience und Grid-Technologie.
XML-Archivierung betriebswirtschaftlicher Datenbank-Objekte*
Erstellen einer Webseitenstatistik mithilfe eines OLAP-Servers
Erstellen einer Webseitenstatistik mithilfe eines OLAP-Servers
Betrieb von Datenbanken Marco Skulschus & Marcus Wiederstein Datenmanipulation Lehrbuch, Kapitel 4.
Statuspräsentation Titel der Seminararbeit
Entwicklung verteilter Anwendungen I, WS 13/14 Prof. Dr. Herrad Schmidt WS 13/14 Kapitel 8 Folie 2 ASP.NET Zustandsverwaltung
Überblick über die Datenbankproblematik
Datenbanken und Datenmodellierung
Vorlesung #4 Überführung des ER-Modells in das relationale Modell
SS 2004 Datenbanken 4W Mi 13:30 – 15:00 G 2.30 Vorlesung #5 Relationale Anfragesprachen.
WS 2011/12 Datenbanksysteme Fr 15:15 – 16:45 R Vorlesung #3 Das relationale Modell (Teil 2)
Vorlesung #4 Überführung des ER-Modells in das relationale Modell
Allgemeines zu Datenbanken
Replikation und Synchronisation
DI (FH) DI Roland J. Graf MSc (GIS) U N I V E R S I T Ä T S L E H R G A N G Geographical Information Science & Systems UNIGIS.
Access Einführung in das Datenbank-Management-System Grundlagen.
Unternehmenskultur im Zeitalter der Globalisierung
ADAT©2004 Dipl. - Ing. Walter SabinSeite: 28 Version 1.0a Elementare Datenstrukturen –Tables Ansammlung von rows Jede row enthält eine oder mehrere column(s)
Structured Query Language
Eike Schallehn, Martin Endig
HADOOP – a Brief overview
RelationentheorieObjektorientierte Datenbanken  AIFB SS Grenzen relationaler Datenbanksysteme (1/2) Eine Reihe von Anwendungsgebieten, insbesondere.
Einführung Dateisystem <-> Datenbanksystem
ArcView als SDE - Client SDE Client inklusive! ArcViewGIS: ArcView GIS: Michael Jacobi ESRI GmbH ESRI EUROPEAN USER CONFERENCE.
Datenbanken im Web 1.
SS 2014 – IBB4B Datenmanagement Do 17:00 – 18:30 R Vorlesung #4 Überführung des ER-Modells in das relationale Modell.
Unscharfe Anfragen in Multimedia- Datenbanksystemen Seminar Multimedia-Datenbanken WS 2001/2002 Silvana Runow.
Rolle und Potential von IT-Technologien im Rahmen von Unternehmenskooperationen Dirk Naruhn.
Das Build-Tool ANT ETIS SS04. ant 2 Gliederung Motivation Build-Datei build.xml Bestandteile build.xml –Properties Zusammenfassung.
Seminar Ingenieurdatenbanken WS 04/05 Dr. Schallehn, Prof. Paul, Dipl.-Inf. Fröhlich {eike | paul | iti.cs.uni-magdeburg.de.
Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider.
SS 2015 – IBB4C Datenmanagement Fr 17:00 – 18:30 R Vorlesung #1 Datenmanagement.
SS 2015 – IBB4C Datenmanagement Fr 17:00 – 18:30 R Vorlesung #4 Überführung des ER-Modells in das relationale Modell.
Spatial Partition Game Programming Patterns / Optimization Patterns AM3: Softwaretechnologie II (Teil 2): Simulation und 3D Programmierung Dozent: Prof.
© 2012 TravelTainment Einführung in NoSql-Datenbanken und der Vergleich zu relationalen Datenbanken Alexey Sibirtsev.
© 2015 TravelTainment NoSQL – Eine Alternative zu relationalen Datenbanken Dominik Schmitz.
Vergleich von MongoDB und Redis im Hinblick auf ihre potentielle Eignung zur Messdatenerfassung und -auswertung Seminararbeit Im Studiengang Scientific.
Auftragserfassungssystem für Drehmomentaufnehmer Datenbank und Software Dennis Rollesbroich 1.
Comprehensive Information Base (CIB) – ein Prototyp zur semantischen Datenintegration Stefan Arts
Rechen- und Kommunikationszentrum (RZ) Strukturierte Datensammlung in verteilten Systemen für den DHCP-Service Tim Becker Seminararbeit / /
/Folie 1Holger Frietsch Historisierung von Zuordnungsänderungen für Dimensionen in relationalen ORACLE8-Data Warehouse- Datenbanken Holger Frietsch.
Entwicklung einer Webanwendung mittels HTML, ASP, C# und SQL am Beispiel einer Publikationsverwaltung Philipp Kühne Erstprüfer: Prof. Dr. Wilhelm.
Non-Standard-Datenbanken Von NoSQL zu NewSQL
Wissenschaft als soziales Netzwerk
Cassandra: Ein verteiltes Speichersystem für strukturierte Daten mit schließlicher Konsistenz (Open-Source-Projekt) Andreas Prante
Von Wietlisbach, Lenzin und Winter
Präsentation von Darleen und Michèle
Datenbanken Von Amed und Alicia.
Von Wietlisbach, Lenzin und Winter
 Präsentation transkript:

© 2012 TravelTainment Einführung in NoSQL-Datenbanken und deren Klassifizierung Von Patrick Becker

© 2012 TravelTainment Gliederung  Einleitung & Motivation  Grundlagen  Klassifizierung von NoSQL-Datenbanken  CAP-Theorem  Eventually Consistent / BASE  Multiversion Concurrency Control  Zusammenfassung & Fazit  Ausblick

© 2012 TravelTainment Einleitung  Weltweit gespeicherte Datenmenge  1,8 Zettabyte (1,8 Billionen Gigabyte)  Datenvolumen verdoppelt sich  Gründe:  Mehr Internetnutzer  Web2.0-Zeitalter  RDBMS

© 2012 TravelTainment Einleitung  Probleme von RDBMS:  Performanceprobleme  Nachträgliche Schemaänderungen  Impedance Mismatch  Web2.0-Zeitalter Anforderungen:  Performance  Verfügbarkeit  Skalierbarkeit [1]

© 2012 TravelTainment Grundlagen - NoSQL  NoSQL = Not only SQL  Verzicht auf Relationen  NoREL  Keine klare Definition

© 2012 TravelTainment Grundlagen – Definition von NoSQL  Prof. Dr. Edlich 1. Nicht relational 2. Verteilt und horizantal skaliert 3. Open-Source 4. Schemafrei 5. Einfache Datenreplikation 6. Einfache Programmierschnittstelle 7. Eventually Consistent/ BASE

© 2012 TravelTainment Grundlagen – Nicht Relational  Problem: Impedance-Mismatch  Beispiel: Speicherung von Fluginformationen DUS PMI DUS CGN PMI

© 2012 TravelTainment Grundlagen – Nicht Relational  Erste Möglichkeit:.…  Unflexibel

© 2012 TravelTainment Grundlagen – Nicht Relational  ZweiteMöglichkeit

© 2012 TravelTainment Grundlagen – Nicht Relational  Sehr komplex  Join-Operationen  Performancegewinn

© 2012 TravelTainment Grundlagen – Verteilt und hoizontal skaliert  Serverarchitektur  Skalierungsmöglichkeiten:  Vertikal  Horizontal

© 2012 TravelTainment Grundlagen – Open-Source  Kaum Beachtung  Ziele:  leichter Zugang  günstige Alternative  Geringe Bedeutung

© 2012 TravelTainment Grundlagen – Schemafreiheit  Schemafreiheit oder nur schwache Schemaausprägungen  Problem:  Agile Web2.0-Anforderungen und Datenstukturen  Nachträgliche Schemaanpassungen  Ziel:  Schemaanpassungen in den Anwendungen

© 2012 TravelTainment Grundlagen – Einfache Datenreplikation  Serverausfall  Datenbestand sichern

© 2012 TravelTainment Grundlagen – Einfache Programmierschnittstelle  SQL zu komplex:  Join-Operationen  Unterabfragen  ineinandergeschachtelte Select-Operationen  rekursive Select-Operationen  Ziel: NoSQL-APIs einfacher als SQL  Idee: Daten als Ganzes speichern

© 2012 TravelTainment Grundlagen – Eventually Consistency / BASE  Konsistenzmodell  Bankanwendungen  Soziale Netzwerke  Gegenseite strikter Konsistenz- anforderungen

© 2012 TravelTainment Klassifizierung von NoSQL-Datenbanken  Es gibt mehr als 120 NoSQL-Datenbanken Core-NoSQL-SystemeSoft-NoSQL-Systeme Wide-Column-Store/ Column-Families Object-Databases Document-StoresGrid & Cloud-Database- Solutions Key-Value-StoreXML-Databases Graph-DatabasesEtc.

© 2012 TravelTainment Wide-Column-Stores / Column-Families  Spaltenorientierte Datenbanksysteme  Column-Family:  Gruppe von mehreren Spalten

© 2012 TravelTainment Wide-Column-Stores / Column-Families  Zeilenorientierte Datenbank:  Spaltenorientierte Datenbank:  Vertreter: Cassandra, HBase, Amazon SimpleDB und Hypertable

© 2012 TravelTainment Document-Stores  Speichern Daten als Ganzes  Identifikationsnummer  Redundanz  Schemalos  Keine Relationen  Vertreter: Lotus Notes, Riak, CouchDB und MongoDB { „firstn“:“Patrick“, „lastn“:“Becker“ } { „firstn“:“Patrick“, „lastn“:“Moll“, „age“:“19“ } 1 2

© 2012 TravelTainment Key/Value-Store  Wert  Schlüssel  Wert:  Strukturiert  Unstrukturiert  Semistrukturiert  Nicht zwingend ein String  Listen & Mengen  Abfrage der Daten über den Schlüssel  Eingeschränkte Abfragemöglichkeit

© 2012 TravelTainment Graphdatenbanken  Graphmodell  Relationen  Effiziente Traversierung  Vertreter: Neo4J, HyperGraphDB und noch viele mehr Bild befreundet A B C C liebt gefällt

© 2012 TravelTainment CAP-Theorem  Brewers-Theorem  Consistency(Konsistenz)  Availabilitiy(Verfügbarkeit)  Partition Tolerance(Ausfalltoleranz)  Vereinbarkeit ist unerreichbar

© 2012 TravelTainment CAP-Theorem [2]

© 2012 TravelTainment CAP-Theorem - Beispiel  Verfügbar und ausfalltolerant(AP)

© 2012 TravelTainment CAP-Theorem - Beispiel

© 2012 TravelTainment CAP-Theorem - Beispiel

© 2012 TravelTainment Eventually Consistent / BASE  BASE = Basically Available, Soft State, Eventually Consistent  Gegenseite der Konsistenzeinhaltung  Weak-Consistency  Übergangsprozess  Zeitfenster der Inkonsistenz  Verfügbarkeit

© 2012 TravelTainment Multiversion Concurrency Control(MVCC)  Hohe Kommunikationskosten  Keine Sperrungen  Versionierung  Datenmanipulationen  Vorgängerversion X = 1 Y = 0 X = 1 Y = 0 X = 2 Y = 1 X = 2 Y = 1 X = 2 Y = 2 X = 2 Y = 2 Aktuellste Version V=0V=1 V=2

© 2012 TravelTainment Multiversion Concurrency Control(MVCC) [4]

© 2012 TravelTainment Multiversion Concurrency Control(MVCC) [5]

© 2012 TravelTainment Zusammenfassung und Fazit  Neue Anforderungen  Klassifizierung  Ideen und Technologien  Datenanalyse

© 2012 TravelTainment Ausblick  Große Bedeutung  UnQL [6]

© 2012 TravelTainment Thank you

© 2012 TravelTainment Literatur- & Quellenverzeichnis Verweis Quelle [1] e-peg-round-hole.jpg [2] [3]S. Edlich, A. Friedland, J. Hampe, B. Brauer und M. Brückner, NoSQL, München: Carl Hanser Verlag, 2011 [4] koeln.de/wiki_db/Datenbanken/MVCC [5] koeln.de/wiki_db/Datenbanken/MVCC [6] abasesNoSQL_ pdf [7]