1 6.4 Verwaltung semistrukturierter Daten - was ist das? Datenverwaltung für XML-Dokumente - Daten in XML-Gewand - eigentlich XML-Dokumente - Abbildung.

Slides:



Advertisements
Ähnliche Präsentationen
Einführung "Datenbanksysteme"
Advertisements

Vortrag von Stephanie Weirauch Jens Pleger Peter Jancke Frank Wejmelka
Freie Universität Berlin Institut für Informatik
Randomisierte Algorithmen Präfix Suche und Konsistentes Hashing
Algorithm Engineering
Man bestimme den „minimalen aufspannenden Baum“ des Graphen.
Minimum Spanning Tree: MST
Zerlegung von Graphen.
7.2 B-Bäume / B*-Bäume als Hilfsmittel zur Indexorganisation
LS 2 / Informatik Datenstrukturen, Algorithmen und Programmierung 2 (DAP2)
Claudio Moraga; Gisbert Dittrich
Graphen Ein Graph ist eine Kollektion von Knoten und Kanten. Knoten sind einfache Objekte. Sie haben Namen und können Träger von Werten, Eigenschaften.
7. Natürliche Binärbäume
Die 1-Baum-Relaxation des TSP mit der Subgradientenmethode
HEINZ NIXDORF INSTITUT Universität Paderborn Fachbereich Mathematik/Informatik Algorithmische Probleme in Funknetzwerken X Christian Schindelhauer
Fallstudie. 2 Statistik April Dokumente Jan Mio. Dokumente Performance 3 Mio. Queries pro Tag 9. Juni 2000 Most popular search engines.
Baumstrukturen Richard Göbel.
Bäume als Datenmodelle
DOM (Document Object Model)
Suche in Texten: Suffix-Bäume
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (27 – Kürzeste Wege) Prof. Th. Ottmann.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (17 – Bäume: Grundlagen und natürliche Suchbäume) Prof. Th. Ottmann.
1 Vorlesung Informatik 2 Algorithmen und Datenstrukturen (21 – Kürzeste Wege) T. Lauer.
Algorithmen und Datenstrukturen
WS Prof. Dr. Th. Ottmann Algorithmentheorie 09 - Suche in Texten Suffix - Bäume.
XINDICE The Apache XML Project Name: Jacqueline Langhorst
Informatik II – Kapitel 13
EINI-I Einführung in die Informatik für Naturwissenschaftler und Ingenieure I Vorlesung 2 SWS WS 99/00 Gisbert Dittrich FBI Unido
1 Kap. 2 Graphen Kap. 2.1 Netze Beispiele: MVV, Autobahnen, WIN, E/R, LH-Flüge, Stützgraphen, Petri-Netze, SIPs, ISA-Hierarchien, Operator-Graphen, Wartegraphen.
Katja Losemann Chris Schwiegelshohn
PG 478 – Open Graph Drawing Framework Thema: Compounds & Force-Directed Francois Bertault & Mirka Miller – An Algorithm for Drawing Compound Graphs [1999]
Access 2000 Datenbanken.
Minimum Spanning Tree: MST
Intelligentes Crawling im WWW mit Hilfe intuitiver Suchbedingungen
Datenbasisschema Wegen der Freizügigkeit des Modells: Keine a-priori Vereinbarung eines Schemas Hingegen: a-posteriori Extraktion eines Schemas: Gibt es.
Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme
... und alles was dazugehört
Visualisierung objektrelationaler Datenbanken
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Diskrete Mathematik II Vorlesung 1 SS 2001 Algorithmus von Dijkstra.
Effiziente Algorithmen
Interoperable Informationssysteme - 1 Klemens Böhm Datenmodell 1: OEM.
2. Die rekursive Datenstruktur Baum 2
Flüsse, Schnitte, bipartite Graphen
Effiziente Algorithmen
Diskrete Mathematik II
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen
Animation von Dijkstra
Animation von Dijkstra
Jan Hinzmann – – GIS Praxis II – Slide 1/10 Der Algorithmus von Dijkstra (Berechnung kürzester Wege in bewerteten Graphen) GIS Praxis II, Jan Hinzmann,
DI (FH) DI Roland J. Graf MSc (GIS) U N I V E R S I T Ä T S L E H R G A N G Geographical Information Science & Systems UNIGIS.
Einführung in Datenbankmodellierung und SQL
Trust and context using the RDF- Source related Storage System (RDF‑S3) and easy RQL (eRQL) Karsten Tolle und Fabian Wleklinski.
Algorithmen für das Erfüllbarkeitsproblem SAT
SS 2014 – IBB4B Datenmanagement Do 17:00 – 18:30 R Vorlesung #4 Überführung des ER-Modells in das relationale Modell.
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Diskrete Mathematik II Vorlesung Datenstrukturen für den Algorithmus von.
Verwaltung semistrukturierter Daten
Datenbank System (DBS) - Warum?
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Diskrete Mathematik II Vorlesung Suche des kürzesten Weges in einem Netz.
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Diskrete Mathematik II Vorlesung der Algorithmus von Floyd.
- Studienarbeit - Entwurf und Umsetzung von kombinierten Anfragen für die Ähnlichkeitssuche auf digitalen Bilder auf der Basis von Regionen und Features.
Matchings (Paarungen) in Graphen
Gliederung der Vorlesung
SS 2015 – IBB4C Datenmanagement Fr 17:00 – 18:30 R Vorlesung #4 Überführung des ER-Modells in das relationale Modell.
Programmiersprachen II Vorbesprechung Klausur Prof. Dr. Reiner Güttler Fachbereich GIS HTW.
1 © Thales IS GmbH 2002 Thales Information Systems GmbH Im Team für Ihren Erfolg DOAG - Regionaltreffen Hannover Donnerstag, Oracle 9i XML Datenbank.
XML-Erweiterungen in ORDBMS Seminar: DBMS für spezielle Anwendungen Florian Brieler.
 Präsentation transkript:

1 6.4 Verwaltung semistrukturierter Daten - was ist das? Datenverwaltung für XML-Dokumente - Daten in XML-Gewand - eigentlich XML-Dokumente - Abbildung auf relationale und objektrelationale DBS - Indexierung - Anfragesprachen: XML Query - RDF-Datenbanken: erste Versuche

6.2 Indexierung  Performance matters !  Naive Lösung zur Auswertung von existsNode etc:  Parsen des Dokuments, Baum traversieren  CLOB mit invertierten Listen (wie oben: z.B. Intermedia)  Grundsätzliches Problem: Indexierung Semistrukturierter Daten  Warum eigentlich schwierig??  Wertindex / Textindex  "Finde alle Objekte, die über einen Pfad erreichbar sind" : Pfadindex

6.3 Indexierung  Dataguides*  Idee: - alle Pfade des Datengraphen merken - Index, wenn die erreichbaren Objekte gespeichert werden Lore-System (Stanford '97) Abiteboul et al.: Indexing semistructured data, Tech. Rep, Stanford Univ., ftp://db.stanford.edu/pub/papers/semiindexing98.ps. * Datenverzeichnis (keine Standardübersetzung)

6.4 Dataguide (2)  Definition  Gegeben eine semistrukturierte DB (typisch hierarchisch, auch für Graph-DB definiert)  Ein Datenverzeichnis (Dataguide) für DB ist ein Graph G mit: Jeder Pfad in DB kommt in G vor (Bezeichner-Pfad, nicht Daten!) Jeder Pfad in G kommt in DB vor Pfade in G sind eindeutig (aber nicht in DB!)

6.5 Dataguides (3) Problem: mehr als ein korrektes Datenverzeichnis für eine DB

6.6 Dataguides (4) 1II I a b c {1} {I,II} {c} {a,b} {x} {z,z'} {z}{z'} {I,II}{1} {a,b,c} {x,z,z'} "Strong Dataguide": äquivalente Pfade in Guide äquivalent in DB Nicht stark (strong)

6.7 Dataguides (5)  Algorithmus zur "Indexerstellung": Dataguide G: Knoten (G) = { {wurzel}} Kanten =  while Veränderung do s = nonDetSelect (Knotenmenge (G)) a = Select (Labels) Knoten (G) =+ {s'={y|x in s, es existiert (x->y, label a) in Kantenmenge(DB)} Kanten (G) =+ (x->y, label a)

6.8 Dataguides (6) b x x a x x x a a a a b c d 1 2,3,4,5,6 7,8,10,12,13 7, x a b d c DB Dataguide G Kann offenbar groß werden Wenn DB Baum: Größe von G <= Größe DB Beachte: Konstruktion eines deterministischen aus nichtdetermini- stischem Automaten!

6.9 Indexierung Bsp: Lore-System (Stanford '97) Abiteboul et al.: Indexing semistructured data, Tech. Rep, Stanford Univ., ftp://db.stanford.edu/pub/papers/semiindexing98.ps. Ein hierarchisches Datenbänken Und ein "DataGuide" (Widom et al.: "DataGuides: Enabling Query.....", Proc VLDB 1997) - enthält jeden möglichen Pfad der hierarchischen DB - "gibt es einen bestimmten Pad in der DB" - wie heißen die Nachfolger des aktuellen Knotens - Erweiterung zu Index durch Menge der erreichbaren Objekte... und die zughörigen Pfade

6.10 Systeme: Tamino  Tamino (SoftwareAG) "Native data store"

Tamino... Tamino  Beispiel für Integration mit tabellarischen Daten Anfrage:...?_xql=hospital/patient[p-surname="Jones"]/doctor Sprache: X-Query