Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
Veröffentlicht von:Agata Lamberg Geändert vor über 10 Jahren
1
Seminar XML und Datenbanken Speicherung von XML-Werten vor SQL:2003
2
XML vor SQL:2003 Inhalt Einführung und Motivation Grundlagen und Verständnis Speichermethoden Speicherung als Ganzes Speicherung der Dokumentenstruktur Abbildung auf Datenbankstruktur Andere Verfahren Zusammenfassung
3
XML vor SQL:2003 Einführung und Motivation Notwendigkeit einer persistenten Speicherung von XML-Dokumenten Vor SQL:2003 Keine XML-Unterstützung in SQL-Norm Speichertechniken nur Notbehelf Mit Nachteilen behaftet
4
XML vor SQL:2003 Inhalt Einführung und Motivation Grundlagen und Verständnis Speichermethoden Speicherung als Ganzes Speicherung der Dokumentenstruktur Abbildung auf Datenbankstruktur Andere Verfahren Zusammenfassung
5
XML vor SQL:2003 Grundlagen und Verständnis Dokumenten-Charakter Datenzentrierte Dokumente Dokumentenzentrierte Dokumente Semistrukturierte Dokumente Document Object Model (DOM)
6
XML vor SQL:2003 – Grundlagen und Verständnis Datenzentrierte Dokumente Daten selbst von Interesse Strukturinformationen dienen Unterteilung Regulär Strenge Typinformationen Dokumente meist aus anderen Informationen generiert Beispiele: Produktkataloge, Rechnungen, Fahrpläne 07743 Jena Lutherplatz 2 03641/406-0 03641/406-113 <
7
XML vor SQL:2003 – Grundlagen und Verständnis Dokumentenzentrierte Dokumente Daten und Struktur beinhalten Information Häufig als XML-Dokument erzeugt Darstellung irregulär Meist keine Typinformationen Beispiele: wissenschaftliche Artikel, Buchinhalte, eMails, Webseiten Sie können unser Haus auf verschiedenen Wegen erreichen: per bahn: 1km ab Bahnhof … per Auto: 10km ab Autobahn A4 … Sie finden uns in direkter Citylage.
8
XML vor SQL:2003 – Grundlagen und Verständnis Semistrukturierte Dokumente Mischform aus daten- und dokumentenzentrierten Dokumenten Beispiele: Bücher (Metadaten vs. Inhalten) Hotelinformationen (Preise, Adresse vs. Beschreibungen, Anreisemöglichkeiten) Online-Buchhändler (Bücher, Lieferzeiten vs. Inhaltsangeben, Rezessionen) Schwarzer Bär Fürstengraben … Sie können unser Haus auf verschiedenen Wegen erreichen: …
9
XML vor SQL:2003 Grundlagen und Verständnis Dokumenten-Charakter Datenzentrierte Dokumente Dokumentenzentrierte Dokumente Semistrukturierte Dokumente Document Object Model (DOM)
10
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Document Object Model (DOM) Comment ProcessingInstruction Document DocumentFragment DocumentType Element Entity EntityReference Notation Text CDataSection DOMImplementationNodeNodeListNamedNodeMap CharacterData Attr Empfehlung des W3C beschreibt Schnittstellen zum Zugriff auf XML-Dokumente und zur Veränderung von Struktur und Inhalten die zugrundeliegende Implementierung und Speicherung der XML- Dokumente wird nicht definiert
11
XML vor SQL:2003 Inhalt Einführung und Motivation Grundlagen und Verständnis Speichermethoden für XML-Dokumente Speicherung als Ganzes Speicherung der Dokumentenstruktur Abbildung auf Datenbankstruktur Zusammenfassung
12
XML vor SQL:2003 – Speichermethoden für XML-Dokument Klassifikation der Speicherung Zahlreiche verschiedene Methoden Drei grundlegende Klassen von Verfahren Speicherung von XML-Dokumenten Speicherung als Ganzes Speicherung von XML-Dokumenten Abbildung auf Datenbankstruktur Speicherung von XML-Dokumenten Speicherung der Dokumentenstruktur Speicherung als Ganzes Speicherung der Dokumentenstruktur Speicherung als Ganzes Speicherung der Dokumentenstruktur Abbildung auf Datenbankstruktur Speicherung der Dokumentenstruktur Abbildung auf Datenbankstruktur Speicherung als Ganzes Speicherung der Dokumentenstruktur Abbildung auf Datenbankstruktur Speicherung als Ganzes Speicherung der Dokumentenstruktur Abbildung auf Datenbankstruktur Speicherung als Ganzes Speicherung der Dokumentenstruktur Abbildung auf Datenbankstruktur Speicherung als Ganzes Speicherung der Dokumentenstruktur Abbildung auf Datenbankstruktur Speicherung als Ganzes Speicherung der Dokumentenstruktur Abbildung auf Datenbankstruktur
13
XML vor SQL:2003 Inhalt Einführung und Motivation Grundlagen und Verständnis Speichermethoden für XML-Dokumente Speicherung als Ganzes Speicherung der Dokumentenstruktur Abbildung auf Datenbankstruktur Zusammenfassung
14
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Speicherung als Ganzes XML-Dokumente als Datei in Dateisystem speichern und verwalten Keine Umwandlungsoperationen nötig Orginalzustand bleibt erhalten und jederzeit verfügbar Speicherung als CLOBs in Datenbanksystem Character Language OBject - Datenbankfeld zur Speicherung von sehr langen Textdaten
15
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Speicherung als Ganzes Anfragen durchsuchen Dokumente sequentiell Ineffizient bei großen Mengen Lösung: Index Speicherung als Ganzes Volltext-Index Volltext- und Struktur-Index
16
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Speicherung als Ganzes Verwendung eines Volltextindex Information Retrieval Anfragen auf Volltext Verwendung in Suchmaschinen Anfragen möglich wie: Welche Dokumente handeln von XML? In welchem Dokument treten Datenbanken im Zusammenhang mit XML auf? Deskribierung, Recherche und Ergebnispräsentation Deskribierung – Aufbereitung von Dokumenten Statistisch wortbasierte Verfahren Linguistische Verfahren Wissensbasierte Verfahren
17
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Speicherung als Ganzes Verwendung eines Volltextindex Index als invertierte Liste 2 1 ADF 3 CDB ACDE DokumenteStichworte 1 2 2 1 3 1 A B D E C F 3 3 32 Dokumente
18
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Speicherung als Ganzes Verwendung eines Volltextindex Index als invertierte Liste Verweis Jena 07743 Jena 2 Schwarzer Bär Aus Richtung Erfurt kommend... Begriff anreisebeschreibung ort Richtung hotel Lutherplatz
19
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Speicherung als Ganzes Verwendung eines Volltextindex Ranking A B D E C F 1 3 2 2 3 1 3 1 3 2 Stichworte Dokumente 2 1 EA 3 D C B D C F AD Stichworte
20
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Speicherung als Ganzes Verwendung eines Volltextindex Anfragen: boolesches Retrieval Kombination von Anfrageteilen mit AND, OR oder NOT Beispiele: Hotel AND Jena (Hotel OR Pension) AND (Jena OR Weimar) linguistische Anfragen Stammwortsuche, phonetische Suche, Ähnlichkeitssuche
21
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Speicherung als Ganzes Verwendung eines Volltextindex Fazit: SchemabeschreibungNicht erforderlich DokumentenrekonstruktionDokumente bleiben im Original erhalten AnfragenAnfragen des Information Retrieval BesonderheitenVolltextfunktion Keine Auswertung der XML-Struktur Einsatzdokumentenzentrierte
22
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Speicherung als Ganzes Kombination Volltext- und Strukturindex Erweiterung des Volltextindex um Strukturinfos Index geteilt (Struktur-, Volltextinformationen) Schwarzer Bär Jena 07743 TermVerweisElement Jena x x 07743 x x ElementVerweisOrdnungVorgänger hotel x 1 adresse x 2 x ort x 3 x plz x 3 x Volltext-Index Struktur-Index
23
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Speicherung als Ganzes Kombination Volltext- und Strukturindex Anfragen: Boolesches Retrieval Linguistische Anfragen Position der Stichworte im Index erlaubt weitere Anfragen Auswertung der XML-Struktur hotel.adresse CONTAINS (Jena) hotel.adresse CONTAINS (Weimar) OR pension.adresse CONTAINS (Erfurt)
24
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Speicherung als Ganzes Kombination Volltext- und Strukturindex Fazit: Schemabeschreibungnicht erforderlich DokumentenrekonstruktionOriginal bleibt erhalten AnfragenInformation Retrieval und Auswertung der Struktur BesonderheitenVolltextfunktion Einsatzdokumentenzentriert semistrukturiert
25
XML vor SQL:2003 Inhalt Einführung und Motivation Grundlagen und Verständnis Speichermethoden Speicherung als Ganzes Speicherung der Dokumentenstruktur Abbildung auf Datenbankstruktur Zusammenfassung
26
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Speicherung der Dokumentenstruktur Speicherung der Dokumentenstruktur Einfache Abbildung der Graphenstruktur DOM
27
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Speicherung der Dokumentenstruktur Abbildung der Graphenstruktur Elemente: Attribute DocIDElementnameIDVorgängerKind-NrWert h001hotel1011 h001name1021011Schwarzer Bär h001adresse1031012 h001strasse1041031Fürstengraben h001nummer10510322 h001ort1061033Jena DocIDAttributnameElementIDWert h001url101www.schwarzer-baer-jena.de h001id101h001
28
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Speicherung der Dokumentenstruktur Abbildung der Graphenstruktur - Anfragen Einfache Anfragen effizient SQL, Fähigkeiten jedoch kaum genutzt Beispiel: alle Hotelnamen in Jena: SELECT FROM Elemente a, Elemente b WHERE a.elemetname = name AND b.elementname = ort AND b.wert = Jena AND a.DocID = b.DocID;
29
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Speicherung der Dokumentenstruktur Abbildung der Graphenstruktur - Anfragen Fazit : Schemabechreibungnicht erforderlich Dokumentenrekonstruktionmöglich, aber sehr aufwendig AnfragenXQuery / XQL / angepasstes SQL Besonderheiten- Einsatzsemistrukturiert, aber auch für daten- und dokumentenstrukturierte Anwendungen
30
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Speicherung der Dokumentenstruktur Document Object Model Speicherung von XML-Dokumenten node_idnode_typdoc_idparentp_siblingn_sibling 001elementh001--- 002elementh001001-003 elementh001001002004 … 034attributh001027033035 attributh001001034- Node
31
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Speicherung der Dokumentenstruktur Document Object Model Speicherung von XML-Dokumenten node_idtag_nametext 001hotel 002nameSchwarzer Bär 003adresse 004plz07743 ……… 011anreisebeschreibungSie finden... node_idattr_nameattr_valuespecified 012urlwww.schwarzer-baer-jena.detrue 013idh001true Element Attribut
32
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Speicherung der Dokumentenstruktur Document Object Model Anfragen DOM-Methoden XPath oder XQuery SQL
33
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Speicherung der Dokumentenstruktur Document Object Model Fazit: Schemabechreibungnicht erforderlich Dokumentenrekonstruktionmöglich, aber sehr aufwendig AnfragenXQuery / XQL / angepasstes SQL BesonderheitenAnfragen und Updates über DOM- Methoden Einsatzsemistrukturiert, aber auch für daten- und dokumentenzentrierte Anwendungen
34
XML vor SQL:2003 Inhalt Einführung und Motivation Grundlagen und Verständnis Speichermethoden Speicherung als Ganzes Speicherung der Dokumentenstruktur Abbildung auf Datenbankstruktur Zusammenfassung
35
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Abbildung auf Datenbankstrukturen Abbildung auf Datenbankstrukturen Automatische Verfahren Benutzerdefiniertes Mapping
36
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Abbildung auf Datenbankstrukturen Abbildung auf Struktur objektorientierter Datenbanken hotelIDnameadressepreise Ortstrasse...einzelzimmer... H0001Schwarzer BärJenaFürstengraben89 Objektrelationale Datenbank Hotel XML-Dokument Schwarzer Bär Jena Fürstengraben... 89...
37
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Abbildung auf Datenbankstrukturen Abbildung auf Struktur relationaler Datenbanken XML-Dokument HotelIDHotelnameAdressePreise H0001Schwarzer BärA0001P0001 AdresseIDOrtStrasse... A0001JenaFürstengraben PreiseIDEinzelzimmer... P0001198 Hotel: Preise: Adresse: Schwarzer Bär Jena Fürstengraben... 89... Relationale Datenbank
38
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Abbildung auf Datenbankstrukturen Schemabechreibungerforderlich Dokumentenrekonstruktionnur teilweise möglich AnfragenSQL- und XML-Anfrage und Transformation möglich BesonderheitenErhalten der Dokumentordnung über zusätzliches Attribut Einsatzdatenzentrierte Anwendungen Automatische Verfahren - Fazit
39
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Abbildung auf Datenbankstrukturen Benutzerdefiniertes Mapping bisher: Art der Speicherung nicht beeinflussbar jetzt: Mappingvorschrift durch Benutzer spezifiziert Struktur der XML-Dokumente und Datenbankschema können unabhängig voneinander entworfen werden (und relativ autonom sein) ebenso: Speicherung von XML-Dokumenten in existierende Datenbanken
40
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Abbildung auf Datenbankstrukturen Benutzerdefiniertes Mapping (schreddern) Schwarzer Bär Hotel_URL Hotelpreise NameEinzelzimmer www.schwarzer-baer-jena.de89 Datenbank Schwarzer Bär Jena... 89... Fürstengraben... XML-Dokument Mapping Vorschrift
41
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Abbildung auf Datenbankstrukturen Benutzerdefiniertes Mapping Beispiel nach Ronald Bourret... Verbindung zwischen Elementen und Relationen Verbindung zwischen Elementen/Attributen und Datenbankattributen
42
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Abbildung auf Datenbankstrukturen Benutzerdefiniertes Mapping Anfragen: Datenbankenanfragen XML-Anfragen
43
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Abbildung auf Datenbankstrukturen Schemabechreibungerforderlich Dokumentenrekonstruktionnicht möglich AnfragenSQL BesonderheitenMapping-Vorschriften erforderlich Speicherung der Dokumenten- Ordnung durch zusätzliches Attribut Einsatzdatenzentrierte XML-Dokumente Benutzerdefiniertes Mapping - Fazit
44
XML vor SQL:2003 Inhalt Einführung und Motivation Grundlagen und Verständnis Speichermethoden Speicherung als Ganzes Speicherung der Dokumentenstruktur Abbildung auf Datenbankstruktur Zusammenfassung
45
XML vor SQL:2003 Zusammenfassung Vielzahl von Verfahren und Techniken existieren nebeneinander oft aus den Bereichen Datenbanken und Dokumentverarbeitung generell: keine beste Lösung für alle XML- Dokumente geeignetste Lösung ist abhängig von konkreten Erfordernissen vieles ist noch in der Entwicklung SQL:2003
46
Vielen Dank für die Aufmerksamkeit! Fragen?
47
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Document Object Model (DOM) Methoden der Klasse Node Fast alle Dokumentbestandteile basieren auf dieser Klasse Die Klasse Node enthält: Methoden zur Identifikation des Knotentyps Methoden zur Navigation durch die Dokumentstruktur Methoden zur Manipulation der Dokumentstruktur
48
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Document Object Model (DOM) Zugriff kann durch Navigation erfolgen Ausgehend vom Knoten liefern folgende Methoden der Klasse als Ergebnis: 6 - getNextSibling() 4 - getChildren() 3 - getLastChild() 2 - getFirstChild() 1 - getParentNode() 5 - getPreviousSibling() Node die Knoten bzw. Knotenlisten
49
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Document Object Model (DOM) Manipulation des Dokumentstruktur insertBefore (newChild, refChild) refChild appendChild (newChild) newChild refChild removeChild (oldChild) oldChild Methoden zum oLöschen, oErgänzen, oVerschieben oVerändern von Dokumentanteilen
50
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Document Object Model (DOM) Methoden der Klasse Elemente getTagName() - Tagnamen eines Elementes getAttribute(name) - liefert das angegebene Attribut setAttribute(name, value) - Verändern und Ergänzen von Attributen removeAttribute(name) - löscht das spezifizierte Attribut getElementsByTagName(tagname) - alle Elemente des Dokumentes, mit angegebenen Elementnamen haben getElementsByTagName(*) - alle Elemente.
51
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Document Object Model (DOM) Methoden der Klasse Attribute Attributinformationen können über die folgenden Methoden erfragt werden: getName() - Attributnamen getValue() - Attributwert setValue(value) - setzt Attributwert.
52
XML vor SQL:2003 – Speichermethoden für XML-Dokumente Document Object Model (DOM) Methoden der Klasse Character Data Zum Auslesen, Verändern und Setzen von Textanteilen getLength() getData() liefert den vollständigen Text substringData(start,count) appendData(text) replaceData(offset,count,text) insertData(offset,text) deleteData(offset,count)
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.