Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Validating XML Parser Application XML-Datei XML-Schema oder DTD.

Ähnliche Präsentationen


Präsentation zum Thema: "WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Validating XML Parser Application XML-Datei XML-Schema oder DTD."—  Präsentation transkript:

1 WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Validating XML Parser Application XML-Datei XML-Schema oder DTD XML-Datei

2 WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle SQL 2003 Part 14: XML-Related Specifications (SQL/XML) –This part of ISO/IEC 9075 defines ways in which Database Language SQL can be used in conjunction with XML. (Zitat aus der Einführung der Spezifikation) –~ 360 Seiten (Part 14) –Spezifikation kostet Geld (nur Part 14) ~190 Euro als PDF –Final Committee Draft Version online unter: pdf pdf

3 WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle SQL/XML Mapping - SQL-to-XML Mapping SQL character sets to Unicode. Mapping SQL s to XML Names. Mapping SQL data types (as used in SQL-schemas to define SQL-schema objects such as columns) to XML Schema data types. Mapping values of SQL data types to values of XML Schema data types. Mapping an SQL table to an XML document and an XML Schema document. Mapping an SQL schema to an XML document and an XML Schema document. Mapping an SQL catalog to an XML document and an XML Schema document.

4 WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Modell Mapping SQLXML SQL-Character-SetsXML-Unicode SQL-IdentifiersXML-Names SQL-DatentypenXML-Schema-Datentypen SQL-WerteXML-Werte SQL-TabellenXML-Dokumente (Daten) SQL-SchemataXML-Schema-Dokumente SQL-Katalog (Meta-Daten)

5 WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Datentype Mapping SQLXML CHARACTER, VARCHAR, CLOB xsd:string INTEGER, SMALLINT, BIGINT xsd:integer (maxInclusive und minInclusive) NUMERIC, DECIMALxsd:decimal ……

6 WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle SQL/XML Mapping - XML-to-SQL Mapping Unicode to SQL character sets. Mapping XML Names to SQL s. Also: SQL/XML konzentriert sich auf das Erzeugen von XML-Daten aus relationalen Datenbanken. link

7 WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle SQL/XML Funktionen Funktionen: XMLELEMENT – Konstruktion eines XML- Elements XMLATTRIBUTES – Erzeugung eines XML-Attributes Reservierte Schlüsselwörter: XML | XMLAGG | XMLATTRIBUTES | XMLBINARY | XMLCONCAT | XMLCOMMENT | XMLELEMENT | XMLFOREST | XMLNAMESPACES | XMLPARSE | XMLPI | XMLROOT | XMLSERIALIZE

8 WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle SQL/XML Funktionen XMLFOREST – Erzeugung einer Menge von XML-Elementen (Wald) XMLAGG – Zusammenfassen von Ergebnissen (Nutzung von Group-By, für 1-n Relationen) XMLCONCAT fügt mehrere XML-Werte zusammen XMLCOMMENT, XMLPI, …

9 WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Neuer Datentype: XML Erlaubte Werte sind: –Ein XML-Dokument (mit Prolog), –Ein XML-Inhalt gemäß XML-Standard 1.0, –NULL. Beispiel: CREATE TABLE StudentXML ( name VARCHAR(35), vorname VARCHAR(30), matrikel INTEGER, details XML);

10 WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle … nicht enthalten ist … Keine Anfragedefinition auf XML Datentype kann extern über XPath, XQuery, XSLT realisiert werden. Keine Festlegung der Abbildung von XML auf SQL-Tabellenstrukturen.

11 WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Praxisbeispiel DB2 von IBM Datenbanken müssen beim Erstellen auf XML vorbereitet werden. Es wird nur UTF-8 unterstützt. SELECT XMLELEMENT ( NAME "Test", XMLATTRIBUTES (12 AS "Default12"), XMLCONCAT ( XMLELEMENT (NAME "ZUSATZ", XMLFOREST (t.name AS "Vorname", t.ID AS "ID") ), XMLELEMENT (NAME "ZUSATZ", XMLFOREST (t.name AS "Vorname",t.ID AS "ID") ) ) from KARSTEN.TEST AS t;

12 WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle DBMS XML Was hatten wir bisher?

13 WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Native XML DBMS (NXD) Definiert ein logisches Model der XML-Dokumente zur Speicherung und Anfrage dieser. –Unterstützt minimal: Elemente, Attribute, PCDATA und die Dokumentreihenfolge Dokumente als logische Struktur (vergleichbar mit Tabellen in RDBMS) Unabhängig von der unterliegenden Speicherstruktur. DBMS, welches für den Umgang mit XML konzipiert wurde und dessen Besonderheiten berücksichtigt Beispiele: Tamino, eXist, XQuantum, …

14 WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Tamino XML Server Kommerzielles Tool der Software AG Online: Server basiert: Zugriff über HTTP Bietet DBMS Funktionalitäten: –Transaktionen, Sicherheit, Mehrbenutzer, Skalierbarkeit, … Für Windows, Unix, Linux (Details siehe Web) Speicherung ohne DTD oder XML Schema möglich

15 WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Architektur

16 WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Speicherung ohne DTD oder XML Schema möglich (meist bei NXD) –Änderungen, partielle Abhängigkeiten, … Speicherung von nicht-XML Objekten (HTML, Bilder, …) Zugriff zu externen (relationalen) Datenquellen Intern UTF, für Import und Export werden auch andere Encodings unterstützt!

17 WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Index –Standard Index: Indizierung der Werte für einzelne Elemente oder Attribute –Text Index: Indizierung der Werte über Elemente und Attribute hinweg –Struktur Index: Index über die Pfade, die in den Dokumenten vorkommen

18 WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Probleme bei der Erstellung eines Index Auftrennung eines Textes in Wörter (Token) ist nicht trivial! –Zeichensetzung, Umbrüche, Bindestriche, etc. Weiterhin werden nicht in jeder Sprache Wörter getrennt geschrieben, Koreanisch, Japanisch, Chinesisch …, –z.B. … wird von Tamino unterstützt!

19 WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Speicherung Speicherung wird aufgeteilt in zwei Spaces –data space – für die eigentlichen XML- Dokumente, die in Abhängigkeit ihrer Größe komprimiert werden –index space – für die Indizes, die für die Anfragen genutzt werden. Zugriff auf XML- Dokumente erst am Ende (wenn nötig) Die Spaces können partitioniert werden.

20 WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle eXist Open Source Online unter: Java (1.4 oder höher) Keine weitere Software nötig (Cocoon / Jetty als Web Server enthalten aber nicht zwingend nötig) Speichert auch nicht XML-Dateien (HTML, XQuery, CSS, …) Fact sheet

21 Hybrid Database – DB2 UDB Architecture SERVER CLIENT SQL XQuery DB2 Engine XML Interface Relational Interface Relational XML Storage: Client / Customer Client Application –Native XML data type (server & client side) –XML Capabilities in all database components –Applications combine XML & relational data Folie übernommen von: George Lapis (IBM)

22 Choosing database storage for XML data Storing XML as BLOB or VARCHAR Shredding XML into relational tables Storing XML in native format Folie übernommen von: George Lapis (IBM)

23 Storing XML in Shredded Form Folie übernommen von: George Lapis (IBM)

24 Storing XML in a Native XML data type Folie übernommen von: George Lapis (IBM)

25 Schema FlexibilityBestBadBest XML Search PerformanceBadGoodBest Full Document Retrieval PerfBestBadGood Partial Document Retrieval PerfBadGoodBest Insert PerformanceBestBadGood Sub-doc Level Update PerfBadGoodBest Sub-doc Level ConcurrencyBadGoodBest Full Document DeleteBestBadGood Preserve Doc Structure, OrderBestBadBest XML Parsing Required at InsertOptionalYes XML Parsing Required at QueryYesNo CLOB SHRED NATIVE Folie übernommen von: George Lapis (IBM) Summary

26 WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle … es gibt weitere Aspekte Performance kann schwanken je nach: –Größe der XML-Datei –Aufbau der XML-Datei –Gesamtgröße der Datenbank –Art der Umsetzung Wieviel Speicherplatz wird benötigt? Anfrage-Performance – Wonach wird gesucht? –Gesamtes Dokument, über Dokumente hinweg, einzelne Komponenten, … …

27 WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Buch-Beschreibung unter: … sollte in der Bib. sein!


Herunterladen ppt "WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Validating XML Parser Application XML-Datei XML-Schema oder DTD."

Ähnliche Präsentationen


Google-Anzeigen