Seminar Data Warehousing Thema: Partitionierung

Slides:



Advertisements
Ähnliche Präsentationen
Algorithmen und Datenstrukturen
Advertisements

Partitionierungstechniken in Datenbanksystemen
Anzahl der ausgefüllten und eingesandten Fragebögen: 211
Hash-Tabellen und -Funktionen Hash-Tabellen in Java
Eine dynamische Menge, die diese Operationen unterstützt,
Vorlesung Programmieren II
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil3.
Datenbanken Einführung.
Folien 2-5, 7-8 © Prof. Dr. Manfred Rössle (FH Aalen)
Objekt – Relationales – Modell Tomasz Makowski IN
Vorteile der Online-Produkte
Telefonnummer.
CPCP Institute of Clinical Pharmacology AGAH Annual Meeting, 29. Februar 2004, Berlin, Praktischer Umgang mit den Genehmigungsanträgen gemäß 12. AMG Novelle.
Modelle und Methoden der Linearen und Nichtlinearen Optimierung (Ausgewählte Methoden und Fallstudien) U N I V E R S I T Ä T H A M B U R G November 2011.
Modelle und Methoden der Linearen und Nichtlinearen Optimierung (Ausgewählte Methoden und Fallstudien) U N I V E R S I T Ä T H A M B U R G November 2011.
Lehrstuhl Informatik III: Datenbanksysteme Achim Landschoof 28. April 2009 Strukturierte P2P Systeme 1 Achim Landschoof Betreuerin: Dipl.-Inf. Jessica.
Algorithmentheorie 04 –Hashing
WS Algorithmentheorie 02 - Polynomprodukt und Fast Fourier Transformation Prof. Dr. Th. Ottmann.
Geometrisches Divide and Conquer
SQL als Abfragesprache
Rechneraufbau & Rechnerstrukturen, Folie 2.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 2.
© 2006 W. Oberschelp, G. Vossen Rechneraufbau & Rechnerstrukturen, Folie 2.1.
Grundkurs Theoretische Informatik, Folie 2.1 © 2006 G. Vossen,K.-U. Witt Grundkurs Theoretische Informatik Kapitel 2 Gottfried Vossen Kurt-Ulrich Witt.
Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme
IS: Datenbanken, © Till Hänisch 2000 CREATE TABLE Syntax: CREATE TABLE name ( coldef [, coldef] [, tableconstraints] ) coldef := name type [länge], [[NOT]NULL],
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil2.
PKJ 2005/1 Stefan Dissmann Rückblick auf 2005 Was zuletzt in 2005 vorgestellt wurde: Klassen mit Attributen, Methoden und Konstruktoren Referenzen auf.
PKJ 2005/1 Stefan Dissmann Zusammenfassung Bisher im Kurs erarbeitete Konzepte(1): Umgang mit einfachen Datentypen Umgang mit Feldern Umgang mit Referenzen.
Access 2000 Datenbanken.
Normalformen Normalisieren Schlüssel
SQL 2 Order by null Aggregatfunktionen group by Join subselect.
Datenintegrität Referentielle Integrität create table
6 Normalformen Normalisieren Schlüssel
Einführung Dateisystem <-> Datenbanksystem
Beispielrelation Buchbestellungen H = Menge der bedeutenden Ziele = {a, d} Schwelle T = 4 Stichprobe S = {a, b, a, a, a, a} mit s = |S| = 6 N = Anzahl.
2.2 Definition eines Datenbankschemas (SQL-DDL)
Datenbankentwicklung IV-LK
Bild 1.1 Copyright © Alfred Mertins | Signaltheorie, 2. Auflage Vieweg+Teubner PLUS Zusatzmaterialien Vieweg+Teubner Verlag | Wiesbaden.
20:00.
Diskrete Mathe 9 Vorlesung 9 SS 2001
SK / , , in Hochkössen und der Wildschönau flow Ski- und Snowboardschule Intersport Menzel.
1 J4 Hash-Join R und S werden mittels der gleichen Hashfunktion h – angewendet auf R.A und S.B – auf (dieselben) Hash- Buckets abgebildet Hash-Buckets.
Einführung in die Programmierung Wintersemester 2009/10 Prof. Dr. Günter Rudolph Lehrstuhl für Algorithm Engineering Fakultät für Informatik TU Dortmund.
Einführung in die Informatik für Naturwissenschaftler und Ingenieure (alias Einführung in die Programmierung) (Vorlesung) Prof. Dr. Günter Rudolph Fachbereich.
Vorlesung #4 Überführung des ER-Modells in das relationale Modell
Vorlesung #4 Überführung des ER-Modells in das relationale Modell
Analyse von Ablaufdiagrammen
Einführung in Datenbankmodellierung und SQL
Vorlesung Mai 2000 Konstruktion des Voronoi-Diagramms II
Symmetrische Blockchiffren DES – der Data Encryption Standard
verstehen planen bearbeiten
Normalisierungsprozess
Das IT - Informationssystem
Großer Altersunterschied bei Paaren fällt nicht auf!
1 (C)2006, Hermann Knoll, HTW Chur, FHO Quadratische Reste Definitionen: Quadratischer Rest Quadratwurzel Anwendungen.
Analyseprodukte numerischer Modelle
Pigmentierte Läsionen der Haut
ADAT©2004 Dipl. - Ing. Walter SabinSeite: 19 Version 1.0a Programme - Zusatzsoftware Oracle: –Forms –Reports –Designer –Jdeveloper –APEX (Application Express)
Schutzvermerk nach DIN 34 beachten 20/05/14 Seite 1 Grundlagen XSoft Lösung :Logische Grundschaltung IEC-Grundlagen und logische Verknüpfungen.
Vortrag von Rechtsanwältin Verena Nedden, Fachanwältin für Steuerrecht zur Veranstaltung Wege zum bedingungslosen Grundeinkommen der Piratenpartei Rhein-Hessen.
Ertragsteuern, 5. Auflage Christiana Djanani, Gernot Brähler, Christian Lösel, Andreas Krenzin © UVK Verlagsgesellschaft mbH, Konstanz und München 2012.
Structured Query Language
Kompetenztraining Jura Martin Zwickel / Eva Julia Lohse / Matthias Schmid ISBN: © 2014 Walter de Gruyter GmbH, Berlin/Boston Abbildungsübersicht.
Einführung in die Volkswirtschaftslehre, Mikroökonomie und Wettbewerbspolitik Lothar Wildmann ISBN: © 2014 Oldenbourg Wissenschaftsverlag.
Das IT - Informationssystem
Einführung Dateisystem <-> Datenbanksystem
1 Medienpädagogischer Forschungsverbund Südwest KIM-Studie 2014 Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.
Monatsbericht Ausgleichsenergiemarkt Gas – Oktober
Monatsbericht Ausgleichsenergiemarkt Gas – November
SQL Basics Schulung –
 Präsentation transkript:

Seminar Data Warehousing Thema: Partitionierung Seminarvortrag 10.06.2005 Benjamin Dunst

Gliederung Einführung und Motivation Grundlagen der Partitionierung Tabellenpartitionierung Anwendung im DWH Umfeld Ausblick 10.06.2005

Übersicht Einführung und Motivation Grundlagen der Partitionierung Tabellenpartitionierung Anwendung im DWH Umfeld Ausblick 10.06.2005

Einführung Daten Partitionierung: - Ansatz ursprünglich aus verteilten DB Bsp.: Logisch eine Produkttabelle - in HH produzierte Produkte (Produkttupel) liegen in HH (ProduktNr 1xxxx) - in K produzierte Produkte (Produkttupel) liegen in K (ProduktNr 2xxxx) - Produkttabelle physisch partitioniert horizontale Partitionierung nach ProduktNr 10.06.2005

Einführung - vertikale Partitionierung (physisch) - Zuordnung verschiedener Spalten zu verschiedenen Lokationen Bsp.: Logisch eine Produkttabelle - Bildmaterial der Produkte liegt in M bei Marketing- abteilung - Verkaufspreise der Produkte liegen in der Kosten- rechnung in B seit 2. Hälfte der `90er Einzug in zentralisierte DBMS 10.06.2005

Einführung Data Warehousing kann zu Datenbanken in hohen Giga- oder Terabyte-Bereichen führen Es kommen immer mehr Daten hinzu, jedoch werden in der Regel keine gelöscht Datenvolumen stellt DBen kaum vor Probleme Probleme verursachen Tabellen mit vielen Millionen oder sogar Milliarden Tupeln Die Datenmanipulation im OLTP-Betrieb (Online Transaction Processing), aber auch eine klassische Datensicherung (Offline-Backup) oder die Reorganisation derartig großer Tabellen begrenzen zum einen die Leistung des gesamten Systems, zum anderen kann dadurch die Verfügbarkeit der Daten wesentlich eingeschränkt werden. Aufgrund der Forderung nach hoher Verfügbarkeit der Daten (z.B. global tätige Unt mit einem DHW) sind Online Backups oder eine Online- Reorganisation ansatzweise mögliche Lösungen der Probleme Daten müssen aus betriebswirtschaftlichen und/oder rechtlichen Gründen erhalten bleiben l 10.06.2005

Motivation Umgang mit großen Relationen Partitionierung bietet Optimierungspotenziale Ziel der Partitionierungstechnik: „Steigerung des Leistungsverhaltens von Anfragen im Zusammenhang mit der Datenpartitionierung“ Leistungsanforderungen: Verfügbarkeitsanforderungen: 10.06.2005

Übersicht Einführung und Motivation Grundlagen der Partitionierung Tabellenpartitionierung Anwendung im DWH Umfeld Ausblick 10.06.2005

Partitionierung - Grundlagen Partitionierungsidee: „Divide & Conquer“ Partitionen können unabhängig voneinander verwaltet werden Performanceverbesserungen (befinden sich die in einer Abfrage benötigten Daten in einer Partition, so muss nur auf diese Partition zugegriffen werden) Tabellen und Zugriffspfade können partitioniert werden 10.06.2005

Partitionierung - Grundlagen Definitionsansatz: Eine Partitionierung von Tabellen und Zugriffspfaden ist eine injektive (eindeutige) Abbildung von Tupeln einer Tabelle bzw. eines Zugriffspfades anhand werte-abhängiger oder werteunabhängiger Kriterien, wobei jedes Tupel genau einer Partition zugeordnet wird. 10.06.2005

Partitionierung - Grundlagen Zur Definition (1): Eine Partitionierung von Tabellen und Zugriffspfaden ist eine injektive (eindeutige) Abbildung von Tupeln einer Tabelle… Partition 1 ProduktNr ProduktName ProduktGruppe ProduktPreis ProduktBild 1001 Fussball X16 2 30,05 1001.bmp 1002 Fussball X17 59,95 1002.bmp 1003 Basketball 1 70,00 1003.bmp 1004 Volleyball 21,99 1004.bmp 1005 Tennisball 2,33 1005.bmp : 2001 Nike Shirt T65 3 65,00 2001.bmp 2002 Adidas Cap Nr1 7 20,50 2002.bmp 2003 PowerBar Riegel 15 2,00 2003.bmp 2004 Schuh X1 11 149,99 2004.bmp 2005 Schuh X6 269,00 2005.bmp Ein Tupel aus der Ausgangstabelle wird genau einer Partition zugewiesen Partition 2 10.06.2005

Partitionierung - Grundlagen Zur Definition (2): … von Tupeln einer Tabelle bzw. eines Zugriffspfades anhand werteabhängiger Kriterien… - Berechnung der Partition eines Datensatzes durch eine Funktion anhand der Attributwerte - Partitionierungsarten: z.B. Range-, Hash-Partitionierung Vorteil: DBMS kann jederzeit die Partition in der ein Datensatz untergebracht ist berechnen Partitionierungsarten werden später vorgestellt 10.06.2005

Partitionierung - Grundlagen Zur Definition (3): … von Tupeln einer Tabelle bzw. eines Zugriffspfades anhand werteunabhängiger Kriterien. - DBMS hat keine Info`s, in welcher Partition sich Datensatz X befindet - Partitionierungsarten: z.B. Random-, Round-Robin-Partitionierung 10.06.2005

Übersicht Einführung und Motivation Grundlagen der Partitionierung Tabellenpartitionierung Anwendung im DHW Umfeld Ausblick 10.06.2005

Tabellenpartitionierung Horizontale Partitionierung - Relation wird zeilenweise in disjunkte Teilmengen partitioniert - Tupel als Ganzes wird nicht zerlegt (wie bei vertikaler Partitionierung) 10.06.2005

Tabellenpartitionierung Selektionsprädikat (Partitionierungsprädikat) ProdNr ProduktName ProdGr. ProdPreis ProduktBild 1001 Fussball X16 2 30,05 1001.bmp 1002 Fussball X17 59,95 1002.bmp 1003 Basketball 1 70,00 1003.bmp 1004 Volleyball 21,99 1004.bmp 1005 Tennisball 2,33 1005.bmp : ProdNr ProduktName ProdGr. ProdPreis ProduktBild 1001 Fussball X16 2 30,05 1001.bmp 1002 Fussball X17 59,95 1002.bmp 1003 Basketball 1 70,00 1003.bmp 1004 Volleyball 21,99 1004.bmp 1005 Tennisball 2,33 1005.bmp : 2001 Nike Shirt T65 3 65,00 2001.bmp 2002 Adidas Cap Nr1 7 20,50 2002.bmp 2003 PowerBar Riegel 15 2,00 2003.bmp 2004 Schuh X1 11 149,99 2004.bmp 2005 Schuh X6 269,00 2005.bmp ProdNr ProduktName ProdGr. ProdPreis ProduktBild 2001 Nike Shirt T65 3 65,00 2001.bmp 2002 Adidas Cap Nr1 7 20,50 2002.bmp 2003 PowerBar Riegel 15 2,00 2003.bmp 2004 Schuh X1 11 149,99 2004.bmp 2005 Schuh X6 269,00 2005.bmp Horizontale Partitionierung 10.06.2005

Tabellenpartitionierung Vertikale Partitionierung - Häufig zur Abspaltung der LOBs verwandt - Aufteilung der Relation in eine oder mehrere Spalten - Bis auf den Schlüssel disjunkt partitioniert - Für die Rekonstruktion notwendig Forderung nach Disjuktheit bezieht sich nur auf die Attribute, die nicht zum Schlüssel gehören 10.06.2005

Tabellenpartitionierung ProdNr ProduktName ProdGr. ProdPreis ProduktBild 1001 Fussball X16 2 30,05 1001.bmp 1002 Fussball X17 59,95 1002.bmp 1005 Tennisball 1 2,33 1005.bmp : 2001 Nike Shirt T65 3 65,00 2001.bmp 2002 Adidas Cap Nr1 7 20,50 2002.bmp 2003 PowerBar Riegel 15 2,00 2003.bmp 2004 Schuh X1 11 149,99 2004.bmp Vertikale Partitionierung ProduktNr ProduktName ProdGruppe ProduktPreis 1001 Fussball X16 2 30,05 1002 Fussball X17 59,95 1005 Tennisball 1 2,33 : 2001 Nike Shirt T65 3 65,00 2002 Adidas Cap Nr1 7 20,50 2003 PowerBar Riegel 15 2,00 2004 Schuh X1 11 149,99 ProduktNr ProduktBild 1001 1001.bmp 1002 1002.bmp 1005 1005.bmp : 2001 2001.bmp 2002 2002.bmp 2003 2003.bmp 2004 2004.bmp 10.06.2005

Tabellenpartitionierung Partitionierungsdimensionen: - Eindimensionale Partitionierungsfunktion   B 6 P1 P2 P3 A 5 4 3 2 1 7 8 9 10.06.2005

Tabellenpartitionierung - Mehrdimensionale Partitionierungsfunktion   B 6 P4 P5 P6 A 5 4 3 P1 P2 P3 2 1 7 8 9   B 6 P4 A 5 4 3 P1 P2 P3 2 1 7 8 9 Variante 1 Variante 2 10.06.2005

Tabellenpartitionierung - Arten Bereichs-Partitionierung (Range-Partitioning) - Wertebereiche der ausgewählten Attribute wird in disjunkte Intervalle zerlegt - Partitionierungsfunktion aufstellen - Datensätze werden mittels Partitionierungs- funktion den Partitionen zugeteilt Eignet sich überall dort, wo aufgrund der Tabellenstruktur und der Spaltenwerte NATÜRLICHE Partitionierungswerte vorliegen, die darüber hinaus eine Gleichverteilung der Daten garantieren können. Z.B. Partitionierung nach Jahren und Monaten, d.h. für jeden Monat eines Jahres eine Partition, die einzeln gelöscht oder archiviert werden kann 10.06.2005

Tabellenpartitionierung - Arten Selektionsprädikat Ausgangstabelle: ProduktNr ProduktName ProdGruppe ProduktPreis ProduktBild 1001 Fussball X16 2 30,05 1001.bmp 1002 Fussball X17 59,95 1002.bmp 1003 Basketball 1 70,00 1003.bmp 1004 Volleyball 21,99 1004.bmp : 2001 Nike Shirt T65 3 65,00 2001.bmp 2002 Adidas Cap Nr1 7 20,50 2002.bmp 2003 PowerBar Riegel 15 2,00 2003.bmp 2004 Schuh X1 11 149,99 2004.bmp 2005 Schuh X6 269,00 2005.bmp 3001 Fit.riegel Q10 2,15 3001.bmp 3002 Fit.riegel Q12 3,50 3002.bmp P1 P2 P3 Restpartition möglich 10.06.2005

Tabellenpartitionierung - Arten Hash-Partitionierung - Datensätze werden mit einer Hash-Funktion verteilt - DBMS errechnet beim INSERT Partitions- nummer als Hashwert aus Attributwerten - Breite Streuung der Datensätze auf Partitionen - Vorteil: Keine parallele Suche notwendig, da die Partition wiederholt berechnet werden kann - Zuteilung wie bei Range auch über eine oder mehrere Spalten Nur die Anzahl der gewünschten Partitionen angeben, Rest macht Hash-Funktion Vorteile, wo KEINE natürlichen Partitionierungskriterien vorliegen oder die nur eine sehr ungleiche Verteilung der Daten aufweisen BESSER, wenn man nur 1. Spalten mit möglichst hoher Selektivität & 2. eindeutige oder nahezu eindeutige Werte als Kriterium auswählt 10.06.2005

Tabellenpartitionierung - Arten Beispiel Hashfunktion: Zwei Partitionen: h(k)= k mod 2 Partition 1 ( h(ProduktNr) = 0 ): ProdNr ProduktName ProdGr. ProdPreis ProduktBild 1001 Fussball X16 2 30,05 1001.bmp 1002 Fussball X17 59,95 1002.bmp 1005 Tennisball 1 2,33 1005.bmp 2001 Nike Shirt T65 3 65,00 2001.bmp 2002 Adidas Cap Nr1 7 20,50 2002.bmp 2003 PowerBar Riegel 15 2,00 2003.bmp 2004 Schuh X1 11 149,99 2004.bmp ProdNr ProduktName ProdGr. ProdPreis ProduktBild 1002 Fussball X17 2 59,95 1002.bmp 2002 Adidas Cap Nr1 7 20,50 2002.bmp 2004 Schuh X1 11 149,99 2004.bmp Partition 2 ( h(ProduktNr) = 1 ): ProdNr ProduktName ProdGr. ProdPreis ProduktBild 1001 Fussball X16 2 30,05 1001.bmp 1005 Tennisball 1 2,33 1005.bmp 2001 Nike Shirt T65 3 65,00 2001.bmp 2003 PowerBar Riegel 15 2,00 2003.bmp h(1005) = 1005 mod 2 = 1 h(1002) = 1002 mod 2 = 0 h(1001) = 1001 mod 2 = 1 h(2001) = 2001 mod 2 = 1 h(2002) = 2002 mod 2 = 0 h(2003) = 2003 mod 2 = 1 h(2004) = 2004 mod 2 = 0 10.06.2005

Tabellenpartitionierung - Arten Composite - Partitionierung Kombination z.B. aus Range- & Hash-Partitionierung Range-Partitionierung durchführen Subpartition mittels Hash-Funktion 10.06.2005

Tabellenpartitionierung - Arten List – Partitionierung - Administrator bestimmt diskrete Werteliste - anhand dieser Liste werden Tupel den Partitionen zugeteilt - Vorteil: Inhaltlich nicht zusammenhängende Werte können in einer Partition zusammen- gefasst werden (sonst Range-Partitionierung) - Administrator für gleichmäßige Verteilung verant- wortlich 10.06.2005

Tabellenpartitionierung - Arten Random – Partitionierung - DBMS verteilt Tupel beim INSERT zufällig auf Partitionen - führt zu einer weitgehend gleichmäßigen Belegung - Vorteil: Partitionen können gleichzeitig durchsucht werden - Nachteil: nicht bekannt, wo Tupel abgelegt wurden 10.06.2005

Tabellenpartitionierung - Arten Round Robin – Partitionierung - DBMS füllt beim INSERT die Partitionen ‚reihum‘ auf - gleichmäßige Partitionsbelegung - Vorteil: gleichzeitiges Durchsuchen möglich - Nachteil: nicht bekannt, wo Tupel abgelegt wurde (ganze Tabelle durchsuchen) 10.06.2005

Tabellenpartitionierung - Arten Übersicht: Parititionierungs-verfahren Range Hash Composite List Random Round Robin wertebasiert x nicht wertebasiert 10.06.2005

Übersicht Einführung und Motivation Grundlagen der Partitionierung Tabellenpartitionierung Anwendung im DWH Umfeld Ausblick 10.06.2005

Anwendung DWH Data Warehouse Ansatz - Multidimensionaler Datenraum - Realisierung meist durch RDBMS - Multidimensionale Zusammenhänge werden mittels relationalem Sternschema umgesetzt Multidimensionales Datenmodell - Unterteilung der Daten in Fakten & Dimensionen 10.06.2005

Anwendung DWH Beispiel Sternschema Dimsionstabellen Faktentabelle ZEITEN ZEITNR Tag Monat Jahr Wochentag Kalenderwoche Quartal Beispiel Sternschema Dimsionstabellen KUNDEN KDNR Nachname Vorname Adresse PLZ Ort Gebiet VERKÄUFE RECHNR KDNR ZEITNR PRODNR Menge Preis PRODUKTE PRODNR ProdName ProdGruppe PreisEK PreisVK Faktentabelle 10.06.2005

Anwendung DWH Mögliche Anfrage: Wieviel Umsatz haben die VERKÄUFE: Mögliche Anfrage: Wieviel Umsatz haben die Kunden im Bereich Logistik im 2. Quartal erbracht? Bereich Logistik: KdNr bis 1000 2. Quartal: ZeitNr ab 91 RECHNR KDNR ZEITNR PRODNR Menge Preis 1 1021 85 1455 10 50 1005 1000 86 13 5074 95 31 5084 2000 55 100 5086 120 54 5189 121 45 1 1005 5074 5084 5086 5189 1005 5074 5086 5189 1 5084 10.06.2005

Anwendung DWH Mögliche Anfrage: Wieviel Umsatz haben die Kunden im Bereich Logistik im 2. Quartal erbracht? (Bereich Logistik: KdNr bis 1000 ; 2. Quartal: ZeitNr ab 91)   .. 91 90 1 : P2 P1 1000 1001 KDNR P4 P3 ZEITNR 5189 5086 5084 5074 1005 10.06.2005

Anwendung DWH Partitionierung bietet Optimierungspotenziale Bereiche: - Verwaltung sehr großer Relationen - Überspringen von Partitionen bei der Anfrageauswertung - Ausnutzung paralleler Datenbank- & Systemarchitekturen 10.06.2005

Anwendung DWH Verwaltung sehr großer Relationen - klassische Einfüge- & Löschoperationen für große Teile einer Datenbasis auf einzelner Tabelle ineffizient - Vorteil der Partitionierung: Einfaches Hinzufügen oder Löschen mittels DDL Anweisung 10.06.2005

Anwendung DWH Überspringen von Partitionen bei Anfrageauswertung (partition pruning) - Voraussetzung: Anfrage weist Restriktion auf, die über Partitionierungskriterium definiert ist - nur betroffene Relationen müssen zur Beantwortung herangezogen werden - wesentlicher leistungssteigernder Ansatz bei der Ausführung von Warehouse-Anfragen 10.06.2005

Anwendung DWH Ausnutzung paralleler Datenbank- & Systemarchitekturen - Aufteilen großer Datenbestände in kleinere Partitionen ermöglicht systemtechnische Optimierung - einzelne Partitionen auf unterschiedliche Festplatten verteilen, um parallel zugreifen zu können 10.06.2005

Informix Dynamic Server (Enterpreise and Workgroup Edition 10.00) Anwendungen DBS ADABAS (Tool Adabas Vista) Informix Dynamic Server (Enterpreise and Workgroup Edition 10.00) Oracle 10g Sybase IQ Part.-arten Range Round Robin, Expression (benutzerdefinierte Verteilungs-funktion, z.B. Range, Hash) Range, Hash, List, Composite Range-Hash, Composite Range-List Hash, Range 10.06.2005

Anwendung: Oracle Beispiel: Range-Partitionierung CREATE TABLE Produkte ( prodnr NUMBER(4) NOT NULL, prodname VARCHAR2(100), prodgruppe NUMBER(10), CONSTRAINT pkprodukte PRIMARY KEY (prodnr)) STORAGE (INITIAL 900M NEXT 900M) PCTFREE 0 PARTITION BY RANGE (prodnr) ( PARTITION prod1 VALUES LESS THAN (2000) TABLESPACE ts1 PARTITION prod2 VALUES LESS THAN (3000) TABLESPACE ts2 PARTITION prod3 VALUES LESS THAN (4000) TABLESPACE ts3 ); Jede Partition in separatem Tablespace Für alle Partitionen Extent-Größe von 900 MB (vor Partitionierungsklausel 10.06.2005

Anwendung: DB2 Beispiel: Hash-Partitionierung CREATE TABLE Produkte ( prodnr int primary key, ... ) partitioning key (prodnr) using hash 10.06.2005

Übersicht Einführung und Motivation Grundlagen der Partitionierung Tabellenpartitionierung Anwendung im DWH Umfeld Ausblick 10.06.2005

Ausblick  Optimierungspotenzial vorhanden  Unterschiede zwischen den Herstellern  weitere Anwendung z.B. in der Archivierung 10.06.2005