Partitionierungstechniken in Datenbanksystemen

Slides:

Advertisements

Ähnliche Präsentationen

Der R-Baum Richard Göbel.

Advertisements

Imperative Programmierung

Datenparallele Algorithmische Skelette in Muesli

Punkt-in-Polygon-Verfahren III (R/R+-Baum)

Knapsack & Bin Packing Sebastian Stober

Eine dynamische Menge, die diese Operationen unterstützt,

Generalisierung/Spezialisierung (1)

Prof. Dr. T. Kudraß1 Hash-Verfahren. Prof. Dr. T. Kudraß2 Einführung Drei Alternativen, wie Dateneinträge k* im Index aussehen können: 1. Datensatz mit.

Relationaler Datenbankentwurf (II)

Indizierung von Graphen durch häufige Subgraphen (2)

WS 03/041 Algorithmentheorie 01 - Einleitung Prof. Dr. S. Albers Prof. Dr. Th. Ottmann.

Dr. Brigitte Mathiak Kapitel 9 Physische Datenorganisation (ganz kurz)

der Universität Oldenburg

Das Entity-Relationship-Modell

Systemüberblick Beispiele: Microsoft Access Oracle Ingres Informix

Mathematisches Seminar – Thema 2.1

Universität Paderborn

Klicke Dich mit der linken Maustaste durch das Übungsprogramm! Ein Übungsprogramm der IGS - Hamm/Sieg © IGS-Hamm/Sieg 2007 Dietmar Schumacher Die Wertetabelle.

Java: Objektorientierte Programmierung

FH-Hof Effizienz - Grundlagen Richard Göbel. FH-Hof Inhalt Einführung Aufwand für Anfragen ohne Indexierung Indexstrukturen für Anfragen an eine Tabelle.

Der R-Baum Richard Göbel.

Java: Grundlagen der Objektorientierung

Algorithmentheorie 04 –Hashing

Vorlesung Informatik 2 Algorithmen und Datenstrukturen (17 – Bäume: Grundlagen und natürliche Suchbäume) Prof. Th. Ottmann.

WS 06/07 Algorithmentheorie 01 - Einleitung Prof. Dr. Th. Ottmann Tobias Lauer.

Geometrisches Divide and Conquer

MySQL Der Einstieg.

Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme

Seminar Data Warehousing Thema: Partitionierung

Institut für Kartographie und Geoinformation Dipl.-Ing. J. Schmittwilken Diskrete Mathe II Übung

Institut für Kartographie und Geoinformation Dipl.-Ing. J. Schmittwilken Diskrete Mathe II Übung

Normalformen Normalisieren Schlüssel

Seminar: Verteilte Datenbanken

6 Normalformen Normalisieren Schlüssel

Einführung Dateisystem <-> Datenbanksystem

Routingverfahren in Content Delivery Networks

Was sind Histogramme? (1)

Vortrag: Ingo Gensch, Mathias Reich am:

Beispielrelation Buchbestellungen H = Menge der bedeutenden Ziele = {a, d} Schwelle T = 4 Stichprobe S = {a, b, a, a, a, a} mit s = |S| = 6 N = Anzahl.

Intelligentes Crawling im WWW mit Hilfe intuitiver Suchbedingungen

Integritätsbedingungen

Fachhochschule Wels Mechatronik Wirtschaft - MEWI FH Campus Wels Einführung in die Informatik Fernlehre: Ingenieurtechnische Anwendungen der Tabellenkalkulation.

Einführung in die Programmierung

Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Geoinformation I Vorlesung 5 WS 2000/2001 Topologie, Landkarten, Datenstrukturen.

GIS - Seminar Wintersemester 2000/2001

Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Geoinformation I Vorlesung 12 WS 2000/2001 Gerhard Gröger Modellierung mit Geodatabases.

1 J4 Hash-Join R und S werden mittels der gleichen Hashfunktion h – angewendet auf R.A und S.B – auf (dieselben) Hash- Buckets abgebildet Hash-Buckets.

Einführung in die Informatik für Naturwissenschaftler und Ingenieure (alias Einführung in die Programmierung) (Vorlesung) Prof. Dr. Günter Rudolph Fachbereich.

Einführung in die Programmierung Wintersemester 2009/10 Prof. Dr. Günter Rudolph Lehrstuhl für Algorithm Engineering Fakultät für Informatik TU Dortmund.

Allgemeines zu Datenbanken

Replikation und Synchronisation

Relationentheorie AIFB SS Relationen in 1NF und relationale Datenbanken(1/5) Attribut a Wertebereichdom(a) (domain) AttributemengeA = {a 1,...,

verstehen planen bearbeiten

Was ist überhaupt eine Datenbank?

Studienarbeit: Filteralgorithmen für Benachrichtigungssysteme

ADAT©2004 Dipl. - Ing. Walter SabinSeite: 28 Version 1.0a Elementare Datenstrukturen –Tables Ansammlung von rows Jede row enthält eine oder mehrere column(s)

Integritätserhaltung und -Überprüfung in deduktiven Datenbanken

8 Erzeugen und Verwalten von Tabellen Ziele Kennenlernen der wichtigsten Datenbankobjekte Anlegen von Tabellen Datentypen zur Definition von Spalten.

Landkarten Landkarten sind Tesselationen mit folgenden Eigenschaften:

ER-Modell Attribute, Attributwerte (1|8) Attribut (a): Eigenschaft a = Name des Attributes E : Ein Entity-Typ E wird charakterisiert.

1 Sichten-Änderungen (1) Änderungen von Sichten sind i.d.R. problematisch, da sie in entsprechende Änderungen der Basisrelationen überführt werden müssen.

Einführung Dateisystem <-> Datenbanksystem

WS 2014/15 Datenbanksysteme D0 15:15 – 16:45 R Vorlesung #6 SQL (Teil 3)

Inhalt Einordnung und Funktion der lexikalische Analyse Grundlagen

Datenbank System (DBS) - Warum?

Aufbau semantischer Caches und Anfrageverarbeitung Seminar Semantic Caching 1/12 Kathleen Hänsch

Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider.

Rel-Modell Einige Definitionen (1|2) Kartesisches Produkt: W 1, W 2, …, W n beliebige Mengen. W 1  W 2  …  W n ::= {(w 1, w 2, …,

Making Global Knowledge Leaders Thomas Kemmann, PROMATIS AG Oracle eBusiness Suite Datenübernahme.

Präsentation transkript:

Partitionierungstechniken in Datenbanksystemen kleines Seminar von Tatjana Brot

Gliederung des Vortrages Einführung Grundlagen der Partitionierung Definition Partitionierungsverfahren Partitionierungsarten Partitionierungsstrategien Partitionierungsentwurf Nutzen einer Partitionierung Beispiele für DBMSe Zusammenfassung

Einführung Problem: immer weiter steigende Datenmengen, sehr große Tabellen Lösung: Einsatz von Hardware, Ausnutzen von Anwendungswissen, geeigneter Datenbankentwurf Lösung für große Datenbanken – Einsatz einer Kombination: materialisierte Sichten, Bitmap-Indexe, Partitionierung

Definition Partitionierung – horizontale, vollständige und transparente Aufteilung einer Datenbanktabelle in disjunkte Teiltabellen. Die einzelnen Partitionen werden physischen Speicherbereichen zugewiesen.

Partitionierungsverfahren nicht wertebasiert - Partition eines Tupels wird mit Hilfe eines Fremdkriteriums (Zufallszahl, Reihenfolge des Einfügens eines Tupels) festgelegt. Nachteil: Zuordnung Tupel - Partition nicht wiederholbar Verwendung: parallele Anfrageverarbeitung wertebasiert – Partition wird aus einem oder mehreren Attributwerten des Tupels berechnet. Vorteil: die Zuordnung Tupel – Partition bleibt nachvollziehbar

Partitionierungsarten Nicht wertebasierte Verfahren: Round-Robin-Partitionierung – Verteilung der Tupel bezüglich der Einfügereihenfolge Random-Partitionierung – zufällige Verteilung Wertebasierte Verfahren: Hash-Partitionierung – Partition wird mit Hilfe einer Hash-Funktion berechnet intervallweise Partitionierung (oder Bereichspartitionierung)

Bereichspartitionierung Zerlegung des Wertebereichs der ausgezeichneten Attribute in disjunkte Intervalle Verteilung der Tupel entsprechend des Wertes der ausgezeichneten Attribute Zuordnung Bereich-Partition eindeutig Optional – Restpartition, kann als Ausnahme mehrere Partitionen enthalten

Beispiel einer Bereichspartitionierung P1 falls 2001-01-01  DATUM < 2001-04-01 P2 falls 2001-04-01  DATUM < 2001-07-01 P3 falls 2001-07-01  DATUM < 2001-10-01 P4 falls 2001-10-01  DATUM < 2002-01-01 P5 sonst f (DATUM)

Partitionierungsstrategien Wertebasierte Verfahren: Eindimensional – Partitionierung über genau ein Attribut Mehrdimensional – Partitionierung bezüglich mehrerer Attribute Vorteil: viele Anfragen können von dieser Partitionierung profitieren

Partitionierungsentwurf Logisches Datenbankschema -> geeignetes Partitionierungsschema Auswahl der Tabellen Anzahl der Partitionen Verteilung der Tupel Aufteilung des Wertebereichs Anwendungserfordernisse Verschiedene Strategien: Propagieren der Partitionierungsidee Ausnutzung tabellenübergreifender Integritätsbedingungen

Nutzen einer Partitionierung Ziele: Leistungssteigerungen bei der Ausführung von Anfragen Verbesserung der Administrierbarkeit Erhöhung der Verfügbarkeit

Beispiele für DBMS DB2 Oracle Informix Adabas

Zusammenfassung