Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

FH-Hof Effizienz: Indexstrukturen Richard Göbel. FH-Hof Indexstrukturen - Ideen Ohne Indexstrukturen wächst der Suchaufwand mindestens linear mit der.

Ähnliche Präsentationen


Präsentation zum Thema: "FH-Hof Effizienz: Indexstrukturen Richard Göbel. FH-Hof Indexstrukturen - Ideen Ohne Indexstrukturen wächst der Suchaufwand mindestens linear mit der."—  Präsentation transkript:

1 FH-Hof Effizienz: Indexstrukturen Richard Göbel

2 FH-Hof Indexstrukturen - Ideen Ohne Indexstrukturen wächst der Suchaufwand mindestens linear mit der Anzahl der Einträge Der Suchaufwand lässt sich zum Beispiel beschleunigen durch: binäres Suchen in sortierten Listen Hash-Verfahren Die Indexstruktur muss die Verwaltung des Sekundärspeichers berücksichtigen

3 FH-Hof Indexstrukturen auf einer Festplatte Für eine Festplatte wird immer mindestens ein Block gelesen und geschrieben. Mögliche Blockgrößen sind zum Beispiel zwischen 512 und Byte. Der Aufwand für den Zugriff auf einen Block ist um mehrere Größenordnungen höher als Operationen im Hauptspeicher! Die Indexstrukturen wird so gewählt, dass ein Block vollständig mit Werten und Referenzen auf Nachfolgeknoten gefüllt wird.

4 FH-Hof B-Baum - Konzept Baumstruktur mit: gleicher Länge aller Pfade von der Wurzel zu den Blättern (Baum ist perfekt balanciert) Abbildung von Knoten auf Blöcke des Sekundärspeichers hohem Verzweigungsgrad (Kapazität der Blöcke) Effiziente Algorithmen für: die Suche das Einfügen das Löschen von Einträgen

5 FH-Hof B-Baum - Beispiel mit Verzweigungsgrad 3

6 FH-Hof B-Baum - Suche nach Wert 13

7 FH-Hof B-Baum - Suche Werte zwischen 12 und 26 Verkettung zwischen den einzelnen Blättern für eine Bereichssuche sinnvoll!

8 FH-Hof B-Baum - Einfügen von Einträgen Suche das Blatt, in das der neue Wert eingefügt werden muss Ausreichend Speicherplatz in dem Knoten vorhanden: JA:Wert einfügen NEIN:Blattknoten (und bei Bedarf Elternknoten) teilen Referenzen zwischen dem neuen Wert und den zugehörigen Einträgen herstellen

9 FH-Hof B-Baum - Löschen von Einträgen Suche das Blatt, aus dem der Wert gelöscht werden muss Knoten noch ausreichend gefüllt: JA:Wert löschen NEIN:Inhalt des Blattknoten auf andere Blätter verteilen Referenz des Blattknoten in Vaterknoten löschen Elternknoten noch ausreichend gefüllt...

10 FH-Hof B-Baum für Bereichssuche

11 FH-Hof B-Baum - Diskussion asymptotischer Aufwand Finden des ersten Eintrags: O(log(n)) Lesen aller Ergebnisse (Blätter verkettet): O(m) Gesamtaufwand: O(log(n) + m) Für sehr große Datenbanken ist der Aufwand damit weitgehend unabhängig von der Größe der Datenbank

12 FH-Hof Suchbedingungen für mehrere Spalten Allgemeine Form der Anfragen lower 1 column 1 upper 1 ANDlower 2 column 2 upper 1... ANDlower d column d upper d Ziel: Bearbeitungszeit einer Anfrage ist nur in geringem Maß abhängig von der Anzahl der gespeicherten Einträge Bearbeitungszeit einer Anfrage ist linear abhängig von der Anzahl der Suchergebnisse

13 FH-Hof Erweiterungen des B-Baums Ansatz: Abbildung mehrerer Werte auf einen einzelnen Wert Mögliche Operationen für die Kombination: Konkatenation Bit-Interleaving Auswirkung auf die Effizienz von Suchanfragen?

14 FH-Hof Analyse: Suchen mit zwei Spalten

15 FH-Hof Analyse: Beispiel mit 2 Spalten 2 a 4 2 b 3

16 FH-Hof Analyse - Werte der Spalten konkatenieren Werte der betrachteten Spalten werden zusammengehängt Die neuen Werte werden mit Hilfe der lexikographischen Ordnung verglichen....

17 FH-Hof Analyse - Bit-Interleaving 1 Werte mit den Bitfolgen 'x 1 x 2... x n und 'y 1 y 2... y n ' werden zu dem Wert 'x 1 y 1 x 2 y 2... x n y n kombiniert Die erzeugten Bitfolgen lassen sich danach direkt vergleichen...

18 FH-Hof Analyse - Bit-Interleaving 2

19 FH-Hof Erweiterungen des B-Baums - Diskussion Erweiterungen unterstützen Punktsuchen mit logarithmischen Zeitaufwand Für Bereichssuchen ist der Ansatz des Bit-Interleaving günstiger als die Konkatenation Im schlechtesten Fall wächst der Suchaufwand für beide Verfahren linear mit der Anzahl der Einträge


Herunterladen ppt "FH-Hof Effizienz: Indexstrukturen Richard Göbel. FH-Hof Indexstrukturen - Ideen Ohne Indexstrukturen wächst der Suchaufwand mindestens linear mit der."

Ähnliche Präsentationen


Google-Anzeigen