Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider
Definition Mehrere Computer über ein WAN oder LAN verbunden Funktionsverteilung Billiger als Mainframesysteme
Datenbankserver
Verteiltes Datenbanksystem
Parallele Architektur Problem des Flaschenhalses Hohe Performance Parallelisierung Ladebalancierung Hohe Verfügbarkeit Erweiterbarkeit Rechenleistung Speicherkapazität
Subsysteme des parallelen Datenbanksystems
Parallele Systemarchitektur Effiziente Realisierung der Ziele Verbindung der einzelnen Hardwarekomponenten Liegen zwischen zwei Extremen Shared Memory Shared Nothing
Shared Memory Vorteile Einfachheit Ladebalancierung Nachteile begrenzte Erweiterbarkeit hohe Kosten
NUMA Architektur leicht erweiterbar ist standardisiert beste Wahl für große Systeme
Data Placement
Query Parallelism Intra-Operator Parallelisierung Inter-Operator Parallelisierung Pipeline- Parallelisierung Independent- Parallelisierung
Kombination von Parallelisierungsarten
Parallel Query Optimization Search Space Cost Model Search Strategy
Probleme bei der parallelen Ausführung Initialisierung Interferenz und Konvoieffekt Hardwareinterferenz Softwareinterferenz Ladebalancierung Intra-Operator Ladebalancierung Inter-Operator Ladebalancierung
Verteilte Objekte und Datenbank Managementsysteme unterstützt neue Applikationen Computer Aided Design, Künstliche Intelligenz unterstützen abstrakte Datentypen bewahrt die natürliche Struktur von Objekten
Partitionierung Class Engine as Object Attributes No_cylinder : Integer Cpacity : Real Horsepower: Integer wegen komplexer Attribute wegen komplexer Methoden
Alternative Client/Server Architekturen
Objektmanagement Object Identifier Management logische Object Identifiers physikalische Object Identifiers Pointer Swizzeling Object Migration Quellcode am Zielort neu kompilieren kompilierte Klasse wird übertragen nur Quellcode der Klasse übertragen
Distributed Object Storage Object Clustering Decomposition Storage Model (DSM) Normalized Storage Model (NSM) Distributed Garbage Collection Reference Counting Tracing Based
Zusammenfassung Art der Datenbank relationale objektorientierte Anzahl der User (Systemarchitektur) Art der Daten (Data Placement, Organisation von objektorientierten Datenbanken)