Partitionierungstechniken in Datenbanksystemen

Slides:



Advertisements
Ähnliche Präsentationen
Der R-Baum Richard Göbel.
Advertisements

Imperative Programmierung
Datenparallele Algorithmische Skelette in Muesli
Punkt-in-Polygon-Verfahren III (R/R+-Baum)
Knapsack & Bin Packing Sebastian Stober
Eine dynamische Menge, die diese Operationen unterstützt,
Generalisierung/Spezialisierung (1)
Prof. Dr. T. Kudraß1 Hash-Verfahren. Prof. Dr. T. Kudraß2 Einführung Drei Alternativen, wie Dateneinträge k* im Index aussehen können: 1. Datensatz mit.
Relationaler Datenbankentwurf (II)
Indizierung von Graphen durch häufige Subgraphen (2)
WS 03/041 Algorithmentheorie 01 - Einleitung Prof. Dr. S. Albers Prof. Dr. Th. Ottmann.
Dr. Brigitte Mathiak Kapitel 9 Physische Datenorganisation (ganz kurz)
der Universität Oldenburg
Das Entity-Relationship-Modell
Systemüberblick Beispiele: Microsoft Access Oracle Ingres Informix
Mathematisches Seminar – Thema 2.1
Universität Paderborn
Klicke Dich mit der linken Maustaste durch das Übungsprogramm! Ein Übungsprogramm der IGS - Hamm/Sieg © IGS-Hamm/Sieg 2007 Dietmar Schumacher Die Wertetabelle.
Java: Objektorientierte Programmierung
FH-Hof Effizienz - Grundlagen Richard Göbel. FH-Hof Inhalt Einführung Aufwand für Anfragen ohne Indexierung Indexstrukturen für Anfragen an eine Tabelle.
Der R-Baum Richard Göbel.
Java: Grundlagen der Objektorientierung
Algorithmentheorie 04 –Hashing
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (17 – Bäume: Grundlagen und natürliche Suchbäume) Prof. Th. Ottmann.
WS 06/07 Algorithmentheorie 01 - Einleitung Prof. Dr. Th. Ottmann Tobias Lauer.
Geometrisches Divide and Conquer
MySQL Der Einstieg.
Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme
Seminar Data Warehousing Thema: Partitionierung
Institut für Kartographie und Geoinformation Dipl.-Ing. J. Schmittwilken Diskrete Mathe II Übung
Institut für Kartographie und Geoinformation Dipl.-Ing. J. Schmittwilken Diskrete Mathe II Übung
Normalformen Normalisieren Schlüssel
Seminar: Verteilte Datenbanken
6 Normalformen Normalisieren Schlüssel
Einführung Dateisystem <-> Datenbanksystem
Routingverfahren in Content Delivery Networks
Was sind Histogramme? (1)
Vortrag: Ingo Gensch, Mathias Reich am:
Beispielrelation Buchbestellungen H = Menge der bedeutenden Ziele = {a, d} Schwelle T = 4 Stichprobe S = {a, b, a, a, a, a} mit s = |S| = 6 N = Anzahl.
Intelligentes Crawling im WWW mit Hilfe intuitiver Suchbedingungen
Integritätsbedingungen
Fachhochschule Wels Mechatronik Wirtschaft - MEWI  FH Campus Wels Einführung in die Informatik Fernlehre: Ingenieurtechnische Anwendungen der Tabellenkalkulation.
Einführung in die Programmierung
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Geoinformation I Vorlesung 5 WS 2000/2001 Topologie, Landkarten, Datenstrukturen.
Datenbank.
GIS - Seminar Wintersemester 2000/2001
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Geoinformation I Vorlesung 12 WS 2000/2001 Gerhard Gröger Modellierung mit Geodatabases.
1 J4 Hash-Join R und S werden mittels der gleichen Hashfunktion h – angewendet auf R.A und S.B – auf (dieselben) Hash- Buckets abgebildet Hash-Buckets.
Einführung in die Informatik für Naturwissenschaftler und Ingenieure (alias Einführung in die Programmierung) (Vorlesung) Prof. Dr. Günter Rudolph Fachbereich.
Einführung in die Programmierung Wintersemester 2009/10 Prof. Dr. Günter Rudolph Lehrstuhl für Algorithm Engineering Fakultät für Informatik TU Dortmund.
Allgemeines zu Datenbanken
Replikation und Synchronisation
Relationentheorie AIFB SS Relationen in 1NF und relationale Datenbanken(1/5) Attribut a Wertebereichdom(a) (domain) AttributemengeA = {a 1,...,
verstehen planen bearbeiten
Was ist überhaupt eine Datenbank?
Studienarbeit: Filteralgorithmen für Benachrichtigungssysteme
ADAT©2004 Dipl. - Ing. Walter SabinSeite: 28 Version 1.0a Elementare Datenstrukturen –Tables Ansammlung von rows Jede row enthält eine oder mehrere column(s)
Integritätserhaltung und -Überprüfung in deduktiven Datenbanken
8 Erzeugen und Verwalten von Tabellen Ziele Kennenlernen der wichtigsten Datenbankobjekte Anlegen von Tabellen Datentypen zur Definition von Spalten.
Landkarten Landkarten sind Tesselationen mit folgenden Eigenschaften:
ER-Modell Attribute, Attributwerte (1|8) Attribut (a): Eigenschaft a = Name des Attributes E : Ein Entity-Typ E wird charakterisiert.
1 Sichten-Änderungen (1) Änderungen von Sichten sind i.d.R. problematisch, da sie in entsprechende Änderungen der Basisrelationen überführt werden müssen.
Einführung Dateisystem <-> Datenbanksystem
WS 2014/15 Datenbanksysteme D0 15:15 – 16:45 R Vorlesung #6 SQL (Teil 3)
Inhalt Einordnung und Funktion der lexikalische Analyse Grundlagen
Datenbank System (DBS) - Warum?
Aufbau semantischer Caches und Anfrageverarbeitung Seminar Semantic Caching 1/12 Kathleen Hänsch
Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider.
Rel-Modell Einige Definitionen (1|2) Kartesisches Produkt: W 1, W 2, …, W n beliebige Mengen. W 1  W 2  …  W n ::= {(w 1, w 2, …,
Making Global Knowledge Leaders Thomas Kemmann, PROMATIS AG Oracle eBusiness Suite Datenübernahme.
 Präsentation transkript:

Partitionierungstechniken in Datenbanksystemen kleines Seminar von Tatjana Brot

Gliederung des Vortrages Einführung Grundlagen der Partitionierung Definition Partitionierungsverfahren Partitionierungsarten Partitionierungsstrategien Partitionierungsentwurf Nutzen einer Partitionierung Beispiele für DBMSe Zusammenfassung

Einführung Problem: immer weiter steigende Datenmengen, sehr große Tabellen Lösung: Einsatz von Hardware, Ausnutzen von Anwendungswissen, geeigneter Datenbankentwurf Lösung für große Datenbanken – Einsatz einer Kombination: materialisierte Sichten, Bitmap-Indexe, Partitionierung

Definition Partitionierung – horizontale, vollständige und transparente Aufteilung einer Datenbanktabelle in disjunkte Teiltabellen. Die einzelnen Partitionen werden physischen Speicherbereichen zugewiesen.

Partitionierungsverfahren nicht wertebasiert - Partition eines Tupels wird mit Hilfe eines Fremdkriteriums (Zufallszahl, Reihenfolge des Einfügens eines Tupels) festgelegt. Nachteil: Zuordnung Tupel - Partition nicht wiederholbar Verwendung: parallele Anfrageverarbeitung wertebasiert – Partition wird aus einem oder mehreren Attributwerten des Tupels berechnet. Vorteil: die Zuordnung Tupel – Partition bleibt nachvollziehbar

Partitionierungsarten Nicht wertebasierte Verfahren: Round-Robin-Partitionierung – Verteilung der Tupel bezüglich der Einfügereihenfolge Random-Partitionierung – zufällige Verteilung Wertebasierte Verfahren: Hash-Partitionierung – Partition wird mit Hilfe einer Hash-Funktion berechnet intervallweise Partitionierung (oder Bereichspartitionierung)

Bereichspartitionierung Zerlegung des Wertebereichs der ausgezeichneten Attribute in disjunkte Intervalle Verteilung der Tupel entsprechend des Wertes der ausgezeichneten Attribute Zuordnung Bereich-Partition eindeutig Optional – Restpartition, kann als Ausnahme mehrere Partitionen enthalten

Beispiel einer Bereichspartitionierung P1 falls 2001-01-01  DATUM < 2001-04-01 P2 falls 2001-04-01  DATUM < 2001-07-01 P3 falls 2001-07-01  DATUM < 2001-10-01 P4 falls 2001-10-01  DATUM < 2002-01-01 P5 sonst     f (DATUM)

Partitionierungsstrategien Wertebasierte Verfahren: Eindimensional – Partitionierung über genau ein Attribut Mehrdimensional – Partitionierung bezüglich mehrerer Attribute Vorteil: viele Anfragen können von dieser Partitionierung profitieren

Partitionierungsentwurf Logisches Datenbankschema -> geeignetes Partitionierungsschema Auswahl der Tabellen Anzahl der Partitionen Verteilung der Tupel Aufteilung des Wertebereichs Anwendungserfordernisse Verschiedene Strategien: Propagieren der Partitionierungsidee Ausnutzung tabellenübergreifender Integritätsbedingungen

Nutzen einer Partitionierung Ziele: Leistungssteigerungen bei der Ausführung von Anfragen Verbesserung der Administrierbarkeit Erhöhung der Verfügbarkeit

Beispiele für DBMS DB2 Oracle Informix Adabas

Zusammenfassung