Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
Veröffentlicht von:Wilfried Schnall Geändert vor über 10 Jahren
1
Postgres Tsearch2 und Indexe
2
Basics Dokumente = alle Textattribute, Kombinationen von Textattributen über mehrere Tabellen Native Textsearch Operatoren: ~, ~*, LIKE, ILIKE keine linguistischen Besonderheiten (satisfy, satisfied), kein Ranking, langsam
3
Indexe wenige Datensätze aus sehr vielen verschiedenen Datensätzen zu extrahieren (Telefonbuchbsp.) sinnvoller Einsatz notwendig – Aufwand/Nutzen B+-Baum, R-Baum, Hash-Indizes, Gist, Gin
4
B+ Baum Standardtyp High-Concurrency optimiert (viele gleichzeitige Nutzer) Bsp. [1-1000000] ges.: 365000 – Mittelwert 500000 > 365000 – Mittelwert 250000 < 365000… – 2 Suchschritte = 25% übrig – Anzahl der Suchschritte = Logarithmus dualis der Datenmenge
5
R Baum Gist Anpassung an Geometrische Phänomene Stichwort: Bounding Boxes im Baum nach Größe geordnet sind sie Geometrien unabhängig voneinander eine Ebene im Baum Gist http://gist.cs.berkeley.edu
6
Hashindizes Hash Indices speichern Datensätze in einem Hash in Postgres nicht relevant, schlecht unterstützt und somit langsamer
7
GIN relativ neu meist im Kontext von Tsearch statische Texte enthalten oft häufig wiederkehrende Worte tauchen nur einmal im Index auf – inkl. Verweise auf die darunter liegende Tabelle in Spezialfall sehr mächtig
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.