XML in Datenbanksystemen. © Prof. T. Kudraß, HTWK Leipzig 2 2 Warum wird XML eingesetzt? Antworten von Unternehmen: erweiterte Suchmöglichkeiten im Unternehmen.

Slides:



Advertisements
Ähnliche Präsentationen
Web-Content-Management-Systeme
Advertisements

25. Mai 2001Kleyer/Oyen/ReuseFolie 1 Fallstudie im Rahmen des Studienganges Wirtschaftsinformatik Christian Kleyer, Daniel Oyen, Svend Reuse Grundkonzeption.
Dateiformate Tobias Rolle IT takes more than systems …
Prof. Dr. Thomas Kudraß HTWK Leipzig
Was bedeutet XML in Office-Applikationen für Systemadministratoren? Ruprecht Dröge MCSE MCSD MCT Microsoft Pre Sales Consultant.
Anmerkungen zu XML Im September 2000 Entwicklung/Anspruch von XML
Prof. Dr. Günter Törner Dipl-Math. Thorsten Bahne
XML, Biztalk Lernziele vertiefen der Kenntnisse über XML (eXtensible Markup Language) Biztalk – Tool zur Übertragung und Konvertierung von XML-Dokumenten.
Projekt von Rechenzentrum und Universitätsbibliothek Erste Inhalte: Linguistik-Server Essen (LINSE), Semesterapparate Physik Ziel: Bereitstellung einer.
XML - Aufbau und Struktur - mit Einsatz im B2B
Hands On – Einführung in XML
Business to Business Integration anhand von ERP-Systemen
IMS Universität Stuttgart 1 Einführung in XML Hannah Kermes HS: Elektronische Wörterbücher Do,
DOM (Document Object Model)
Seminar XML und Datenbanken Sven Wiegelmann SS 2002.
Eine Biografie aus ADB/NDB als XML Datenbanken vs. Markup Prof Dr. Manfred Thaller WS 2009 / 2010 Referent: Bilal Erkin.
HTML - Eine erste Annäherung
Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 10: Einführung in XML.
Edgar - Ein Texteditor Ein Vortrag von Carsten Severin.
Anwendungen. © Prof. T. Kudraß, HTWK Leipzig Historie des WWW Grundlage Internet – Entwickelt Ende der 60er Jahre vom US-Militär (ARPA-Net) – Technische.
SQL/XML. © Prof. T. Kudraß, HTWK Leipzig 2 2 Motivation Speicherung von XML in allen großen kommerziellen DBMS vorhanden proprietäre Lösungen für die.
Verwaltung von XML-Dokumenten. © Prof. T. Kudraß, HTWK Leipzig Motivation XML-Dokumente können für sehr verschiedene Anwendungen eingesetzt werden Aussehen.
Grundlagen von XML. © Prof. T. Kudraß, HTWK Leipzig Geschichte Grundidee generic coding - Trennung Information/Form formal definierter Dokumenttyp verschachtelte.
Anwendungen. © Prof. T. Kudraß, HTWK Leipzig Historie des WWW Grundlage Internet – Entwickelt Ende der 60er Jahre vom US-Militär (ARPA-Net) – Technische.
Grundlagen von XML. © Prof. T. Kudraß, HTWK Leipzig Geschichte Grundidee generic coding - Trennung Information/Form formal definierter Dokumenttyp verschachtelte.
Einführung XML XML Einführung Andreas Leicht.
Web-Datenbanken Ein Ausblick. © Prof. T. Kudraß, HTWK Leipzig Ausblick auf aktuelle Trends Web 2.0 (Social Web) Informationsintegration: (Web) Content.
XML und Datenbanken. © Prof. T. Kudraß, HTWK Leipzig Motivation XML-Dokumente können für sehr verschiedene Anwendungen eingesetzt werden Aussehen der.
XML und Datenbanken. © Prof. T. Kudraß, HTWK Leipzig Motivation XML-Dokumente können für sehr verschiedene Anwendungen eingesetzt werden Aussehen der.
Proseminar Auszeichnungssprachen WS04/05 XML und Multimedia Referat von Benjamin Bornemann.
Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library
Seminar: Verteilte Datenbanken
© data2type 2005, 1 Publishing mit XML Einsatz von XSL für das multimediale, automatisierte Publishing.
XML und Datenbanken - Einführung -
XML und Datenbanken - Einführung in XML -
Wizards & Builders GmbH Hypertext Markup Language Beschreibung von HTML als Vorbereitung für Webserver mit Microsoft Visual FoxPro.
1 Grundlagen und Anwendung der Extensible Markup Language (XML ) Peter Buxmann Institut für Wirtschaftsinformatik Johann Wolfgang Goethe-Universität Frankfurt.
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
SSD 1, WS05/06 Gruppe 1 Newsfeed-Standards Newsfeed-Standards (RSS & Atom) Site Syndication mit XML Gruppe 1.
Gegenstand EDV Thema: Informative Webseiten
Seminar XML-Technologien: VoiceXML/SMIL 1 Was ist SMIL ? Synchronized Multimedia Integration Language Ausprache wie das englische Wort smile {smaIl} August.
Integration heterogener verteilter Systeme mit WS-BPEL – ein Praxisbeispiel Dr. Wolf-Dieter Heinrichs.
Einsatzgebiete und Anwendungen
Proseminar: „Webtechnologien für Ecommerce“
Sesame Florian Mayrhuber
Übersicht Was ist cocoon? Separation of Concerns Pipeline Modell
Ausgabe vom Seite 1, XML Eine Einführung XML - Eine Einführung.
Management- und Web Services- Architekturen
XML in relationalen Datenbanken
XML (Extensible Markup Language)
XML1 XML-Motivation HTML definiert nur einen bestimmten Dokumenttyp Viele Web-Technologien benötigen eine allgemeinere Sprache zur Dokumentstrukturierung.
IT-Zertifikat Kurs IV Gunther Sarling
Dublin Core IT-Zertifikat Daten- und Metadatenstandards.
Content-Managment-System
© 2001 Sven Dammann1 Aufbau Integrierter Informationssysteme XML Bearbeitung und relationale Abbildung Sven Dammann Martin-Luther-Universität Halle-Wittenberg.
Hauptseminar Web-Services und verteilte Datenbanken Thema XML, DTDs und XML-Schema XML, DTDs und XML-Schema - Stefan Kurz, 25. April 2003.
IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle XML-BasicsWS 08/09.
Datenbanken im Web 1.
Oracle Portal think fast. think simple. think smart. Dieter Lorenz, Christian Witt.
Seminar zur Geoinformation Folie 1 Inhalt: –XML –XML- SCHEMA –XSL –Syntax –GML Seminar zur Geoinformation Datenaustausch mit XML / GML im InternetDatenaustausch.
Vorteile von XML Die installed base von HTML, HTTP und Webbrowsern XML ist einfach und portabel XML kann Dokumente beliebiger Komplexität abbilden XML.
Vorteile von XML Die installed base von HTML, HTTP und Webbrowsern XML ist einfach und portabel XML kann Dokumente beliebiger Komplexität abbilden XML.
Peter Brezany Institut für Softwarewissenschaften Universität Wien
XML Schema Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung WS2011/2012 Hist.-kult.wiss. Informationsverarbeitung (Teil.
WINLearn Technische Umsetzung. Basistechnologie Oberfläche in HTML JSP (JavaServerPages) zur Datenauswertung Datenhaltung: Datenbank oder Filesystem JDBC.
Vorteile von XML Die installed base von HTML, HTTP und Webbrowsern XML ist einfach und portabel XML kann Dokumente beliebiger Komplexität abbilden XML.
Semantic Markup für Zwecke der Langzeitarchivierung in digitalen Bibliotheken Neubiberg,
Native XML Datenbanken vs. ORDBMS für multimediale Dokumente Seminarvortrag von Alexander Loechel Seminar: DBMS für spezielle Anwendungen.
Document Type Definitions (DTDs) Marko Harasic Freie Universität Berlin Institut für Informatik Netzbasierte Informationssysteme
Dokumentenproduktion im Medienzentrum
 Präsentation transkript:

XML in Datenbanksystemen

© Prof. T. Kudraß, HTWK Leipzig 2 2 Warum wird XML eingesetzt? Antworten von Unternehmen: erweiterte Suchmöglichkeiten im Unternehmen ermöglicht neue Operationen auf Daten verkürzt Anwendungsentwicklungszeit erlaubt Konvertierung von EDI-Daten in besser handhabbares Format verbindet viele Anwendungen im Unternehmen verbindet Anwendungen mit denen von Zulieferern und Geschäftspartnern Teilnahme an E-Commerce / B2B, der auf XML basiert

© Prof. T. Kudraß, HTWK Leipzig 3 3 Vorteile von XML XML ist plattformunabhängig (vgl. Java) XML ist sprachunabhängig XML verursacht keine Lizenzkosten, viele kostenlose XML-Tools XML basiert auf Unicode: jedes Zeichen jeder Schrift darstellbar (voraussetzung für Internationalisierung) XML ist per Definition erweiterbar. XML durchgängig über alle Anwendungebenen hinweg verwendbar (Datenhaltung, Anwendungslogik, Präsentation) – vgl. klassische Realisierung solcher Anwendungen mit relationalen Datenbanken

© Prof. T. Kudraß, HTWK Leipzig 4 4 Textorientierte Dokumente Lesbare Dokumente (document centric) – textorientiert (document = Text) – sind selten genau gleich strukturiert – Reihenfolge ist wichtig – sinntragende Daten auf allen Ebenen, viel Mixed Content – Volltextsuche ist unabdingbar, aber nicht ausreichend – manuell erstellt oder aus anderem Format konvertiert – Beispiele Zeitschriftenbeiträge, Bücher Gebrauchsanweisungen, Handbücher Präsentationen Verträge – 70% der relevanten Geschäftsinformationen in Textdokumenten

© Prof. T. Kudraß, HTWK Leipzig 5 5 Datenorientierte XML-Dokumente Datenzentrierte Dokumente – wie Daten im herkömmlichen Sinn (z.B. in relationalen Datenbanken) – XML-Sicht auf stark strukturierte Daten – Reihenfolge ist oft nicht relevant – sind einheitlich und meist einfach strukturiert – haben Datentypen – sinntragende Daten in Blattelementen oder Attributen – Mixed Content ist die Ausnahme (oder Dekoration) – Beispiele: Telefonbücher wissenschaftliche Daten Fahrpläne, Flugpläne Bestellungen

© Prof. T. Kudraß, HTWK Leipzig 6 6 Daten und Dokumente Semistrukturierte Daten – Strukturiert: Felder – Unstrukturiert: binäre Daten wie Text, Video- und Audio-Streams, Bilder (in XML: External Entities, CDATA Sections) – unregelmäßiges Auftreten von Hyperlinks – ggf. fehlendes Schema Mangel an Struktur – Mischform aus datenzentriert und dokumentenzentriert – Struktur implizit oder verborgen – Integration von Daten aus heterogenen Quellen (hierfür strukturiertes Modell oft zu restriktiv) – Bestimmte Anfragetypen ignorieren Schema bewußt (z.B. Zeichenkettensuche über gesamte Datenbank hinweg) Beispiel Krankenakten: – Krankenakten Daten: Geburtsdatum, Adresse, Körpertemperatur-Messreihen … binäre Daten: Röntgenbilder Dokumente: Diagnose, Anamnese etc.

© Prof. T. Kudraß, HTWK Leipzig 7 7 Klassifikation: Beispiel Datenorientierte Dokumente (strukturiert, regulär Beispiele: Produktkataloge, Bestellungen, Rechnungen) Textorientierte Dokumente (unstrukturiert, irregulär Beispiele: wissenschaftliche Artikel, Bücher, s, Webseiten) Semistrukturierte Dokumente (datenorientierte und textorientierte Anteile Beispiele: Veröffentlichungen, Amazon) Meyer XML builds on the principles of two existing languages, HTML and SGML to create a simple mechanism.. The generalized markup concept.. Neil Bradley XML companion XML builds on the principles of two existing languages, HTML and..

© Prof. T. Kudraß, HTWK Leipzig 8 8 Einsatz von XML Publishing und Content Management Elektronischer Handel (E-Commerce) Workflow und integrierte Geschäftsprozesse – Prozessbeschreibungen (BPEL) – Ablaufdaten / Logs XML und Metadaten – RDF (Resource Decription Framework) XML und Multimedia – XHTML, SMIL, MPEG-7 Gesundheitswesen – HL7 Komplex strukturierte Daten – z.B. Chemical Markup Language (CML)

© Prof. T. Kudraß, HTWK Leipzig 9 9 Publishing und Content Management XSLT-Prozessor <xsl:stylesheet version=1.0 xmlns:xsl= <xsl:template match=P <xsl:apply-templates… <Produkt name=… Dieses Produkt stellt eine absolute Weltneuheit dar und ist in seiner funktionalen Gestaltung erstaunlich <xsl:stylesheet version=1.0 xmlns:xsl= <xsl:template match=P <xsl:apply-templates… <xsl:stylesheet version=1.0 xmlns:xsl= <xsl:template match=P <xsl:apply-templates… <Produkt name=… Dieses Produkt stellt eine absolute Weltneuheit dar und ist in seiner funktionalen Gestaltung erstaunlich <Produkt name=… Dieses Produkt stellt eine absolute Weltneuheit dar und ist in seiner funktionalen Gestaltung erstaunlich Braille WAP Internet

© Prof. T. Kudraß, HTWK Leipzig 10 Elektronischer Handel (E-Commerce) B2B (business to business) – zwischen zwei Unternehmen – Kommunikation entlang einer Zuliefererkette (supply chain) – Einsatzbereich für EDI (electronic data interchange) – XML/EDI-Aktivitäten: Vokabulare, Repositories, Frameworks (z.B. ebXML) B2C (business to consumer) – zwischen Unternehmen und Vebraucher – Verkauf über Internet / elektron. Bestellannahme B2G (business to government) – zwischen Unternehmen und öffentlicher Verwaltung G2C (government to citizen) – zwischen öffentlicher Verwaltung und Bürgern – kein Handel, sondern administrative Vorgänge (Steuererklärung, Anträge etc.)

© Prof. T. Kudraß, HTWK Leipzig 11 Warum XML in Datenbanken XML als Austauschformat – XML-Dokumente enthalten geschäftsrelevante Daten (z.B. in Zuliefererketten) – Aufbewahrung der Dokumente so wie bei Eingang (d.h. Originaldokument unverändert lassen!) Rechtsrahmen: Grundsätze zum Zugriff und zur Prüfbarkeit digitaler Unterlagen (GDPdU) seit – Umwandlung in ein anderes Format Umwandlung in anderes Format grundsätzlich möglich, aber fehlerträchtig nicht notwendig, wenn Funktionalität im Umgang mit XML- Dokumenten der von Datenbanken entspricht – Speicherung der XML-Daten auf der Strecke zwischen den Austauschpartnern (persistent message queuing) Nur die Speicherung in Datenbanken garantiert – mächtige und effiziente Suchfunktionen – transaktionsorientierte Speicherung – Mehrbenutzerbetrieb

© Prof. T. Kudraß, HTWK Leipzig 12 Warum XML in Datenbanken (2) XML-basierte Anwendungen – XML als internes Datenhaltungsformat: Konfigurationsdateien, Anwendungsdaten, Stylesheets Bedarf für adäquate Speicherung Dokumentenverwaltung – für XML-Dokumente spezialisierte Systeme – benötigen XML-spezifische Datenhaltung – Basisfunktionalität (z.B. Textsuche) sollte im DBS enthalten sein Beispiele für Anwendungen – Portale für Unternehmensinformationen – Produktkataloge – Patienteninformationsverwaltung – B2B Dokumentenaustausch

© Prof. T. Kudraß, HTWK Leipzig 13 Grundmodelle von XML-Datenbanken monolithischer Ansatz – gesamte DB einziges großes XML-Dokument – Verwaltung einzelner XML-Doumente problematisch (Prolog, DTD, Metadaten, Referenzen) fragmentorientierter Ansatz – Daten in der DB (aus XML-Sicht) nicht miteinander verknüpft – bei Koexistenz von relationaler und XML-Sicht – aufwendige Rekonstruktion, Gefahr des Informationsverlustes (Prolog,DTD,Kommentare,PI) dokumentenorientierter Ansatz – DB = Menge von XML-Dokumenten – (typbezogene) Gruppierung von Dokumenten (mit gleicher schematischer Beschreibung) – analog zu Tabelle – benutzerspezifische Sammlung von Dokumenten (collections)

© Prof. T. Kudraß, HTWK Leipzig 14 XML-Architektur physische Ebene Dokument- verarbeitung Dokumenten Entwurf von XML- Konzeptueller logische Ebene konzeptuelle XML Datenbanken Klettke / Meyer XML-Datenbanken

© Prof. T. Kudraß, HTWK Leipzig 15 Anforderungen an XML-Datenbanken Datenbankspezifische Anforderungen Effizienz (Performance) – Indizierung (B* Baum nicht ausreichend) – Anfrageoptimierung – Caching Mehrbenutzerbetrieb Skalierbarkeit – Wachstum von Daten und Benutzern – XML-spezifisch: Dokumentgröße, tiefere Struktur Transaktionskonzept (ACID) – Sperrgranulat?

© Prof. T. Kudraß, HTWK Leipzig 16 Anforderungen an XML-Datenbanken Datenbankspezifische Anforderungen (2) Speicherungsstrukturunabhängigkeit – Optimierer sollte über Speicherungsstruktur entscheiden – vgl. SQL: Anfrage bleibt, auch wenn Indexe hinzukommen Sicherheit – abhängig von Grundmodell des XML-Datenbanksystems – Mögliche Definition von Zugriffsregeln auf Dokumenttypebene auf Basis von Knotentypen prädikatbasiert Verfügbarkeit Erweiterbarkeit – Definition von eigenen Datentypen und Methoden (vgl. objektrelationale Datenbanken) – auch: Definition eigener Zugriffsstrukturen – Erweiterbarkeit durch Unterstützung von XML Schema gegeben – prozedurale Erweiterbarkeit erweitert Anfragesprache

© Prof. T. Kudraß, HTWK Leipzig 17 Anforderungen an XML-Datenbanken XML-spezifische Anforderungen (1) Standardkonformität – XML 1.0 – XML Schema, XML Namespaces – XQuery 1.0 Dokumentenbehandlung – Verwaltung vollständiger XML-Dokumente (einschließlich Prolog, DTD) – gespeicherte Dokumente vollständig und unverändert zurückgeben Originaltreue der Dokumente (Round-Trip-Problem) – Was heißt unverändert? – auch Behandlung von Metadaten

© Prof. T. Kudraß, HTWK Leipzig 18 Anforderungen an XML-Datenbanken XML-spezifische Anforderungen (2) Schema-Unabhängigkeit – schematische Beschreibung nicht zwingend erforderlich – Speicherung beliebiger wohlgeformter XML- Dokumente auch bei unbekanntem Schema Strukturunabhängigkeit – rekursive Typdefinitionen mit beliebig tiefen (aber endlichen) Elementverschachtelungen in Dokumenten verarbeitbar – Speicherung von XML-Dokumenten jeden Typs (daten- oder textorientiert)

© Prof. T. Kudraß, HTWK Leipzig 19 Anforderungen an XML-Datenbanken XML-spezifische Anforderungen (3) Schemavorgabe und Validierung – bei vorhandenem Schema Validierung der Dokumente beim Speichern Web-Anbindung – Referenzierung von Dokumenten über HTTP analog zu Dateien – Unterstützung einer URL-Adressierung (HTTP- Methode GET mit Parametern) Einbettung von Datenbankzugriffen Kodierung und Internationalisierung – UTF-8 und UTF-16 XML-spezifische Schnittstelle

© Prof. T. Kudraß, HTWK Leipzig 20 Anforderungen an XML-Datenbanken XML-spezifische Anforderungen (4) Unveränderte Rückgabe (Originaltreue) Was heißt unverändert? Vergleich in kanonischer Form (bei gleicher Kodierung) – Kommentare und PI bleiben erhalten – Elemente bleiben Elemente, Attribute bleiben Attribute – Namen und Namensräume bleiben erhalten – Reihenfolge der Geschwisterelement bleibt erhalten – DTD und Prolog bleiben erhalten Entity-Referenzen werden aufgelöst

© Prof. T. Kudraß, HTWK Leipzig 21 Anforderungen an XML-Datenbanken XML-spezifische Anforderungen (5) Offenes Inhaltsmodell – Anwendung: einseitige Erweiterung eines gemeinsamen Datenformat durch Teilnehmer an einem Datenaustausch – Schemadefinition nur teilweise validieren – Wildcards in XML Schema: any, anyattribute Schema-Evolution – Schemaänderungen ohne Einfluß auf Daten – Wahrung der Konsistenz (Verschärfung von Constraints problematisch) Speicherung von Nicht-XML-Daten – Referenzen auf unparsed entities – Beispiel: Bilder im GIF-Format Anbindung anderer Datenquellen

© Prof. T. Kudraß, HTWK Leipzig 22 Anfragetypen objektrelationale Systeme: werteorientierte und textorientierte Anfragen XML: komplexere Strukturen als Relationenmodellneue Anfragetypen – werteorientierte Anfragen – textorientierte Anfragen – strukturorientierte Anfragen – verweisorientierte Anfragen – schemaorientierte Anfragen – namensraumorientierte Anfragen – metadatenorientierte Anfragen – kombinierte Anfragen

© Prof. T. Kudraß, HTWK Leipzig 23 Anfragetypen: Werteorientiert Wert eines Elements = Inhalt, reduziert auf alle Nicht-Element-Daten aller < 5 – element < 7.1 – 6.1 element = Hugo – Hugo

© Prof. T. Kudraß, HTWK Leipzig 24 Anfragetypen: Textorientiert textorientierte Prädikate, zumeist auf Elementen orientiert an Textstruktur (Wort, Satz, Abschnitt) keine exakte Übereinstimmung gefordert (Akzente, Groß/Kleinschreibung) Ziel: möglichst viele relevante Dokumente finden mit geringem Anteil nicht-relevanter Dokumente (Recall vs. Precision) Beispiele: – documents containing XML – documents containing XML OR HTML but not SGML – documents containing XML within two words of database – documents with word similar to XML (ranking) – Wort, das mit dem Teilwort bank aufhört, ist im Wert eines Elements enthalten

© Prof. T. Kudraß, HTWK Leipzig 25 Anfragetypen: Strukturorientiert sinnvoll bei nicht beschränktem Schema siehe XPath Query Language //Buch bzw. /[//Buch] alle Buch-Elemente bzw. Dokumente, in denen ein Element Buch vorkommt bzw. der Wert des Attributs ISBN von Buch bzw. Dokumente, in denen ein Element Buch ein Attribut ISBN hat /Buch/Titel /Buch/Autor[1] /Buch/*[1] Im Dokument kommt ein Buch-Element vor, das mehr als zwei Autor-Kindelemente hat.

© Prof. T. Kudraß, HTWK Leipzig 26 Weitere Anfragetypen (1) Verweisorientierte Anfragen – verschiedene Verweismechanismen: IDREF, XLink, externes Entity – Verweise in Anfragen referenzieren – Beispiele: Welche Dokumente zeigen auf eine bestimmte Stelle? Welche anderen Dokumente werden aus einem Dokument referenziert? Schemaorientierte Anfragen – Vergleich von Dokumenten gegen ihre schematische Beschreibung – Beispiele: In welchen Dokumenten sind alle optionalen Attribute mit Werten belegt? In welchen Dokumenten enthält eine Zeichenkette genau die Maximalzahl erlaubter Zeichen? – Analogie zum RDBMS: Anfragen auf Data Dictionary – XML Schema ist selbst auch XML

© Prof. T. Kudraß, HTWK Leipzig 27 Weitere Anfragetypen Namensraumorientierte Anfragen – Suche nach Dokumenten, die Elemente oder Attribute eines bestimmten Namensraums enthalten – Beispiele: Welche Dokumente enthalten Stylesheet-Anteile, also Element des XSL-Namensraums Welche Dokumente enthalten Elemente aus mehr als einem Namensraum? Metadatenorientiert – Dokumente, die seit dem geändert wurden – Dokumente, die von Matthias Conrad gespeichert wurden Kombinationen daraus – Beispiel: werteorientiert + strukturorientiert + textorientiert: //Buch[Preis < 50 AND Titel CONTAINS XML]

© Prof. T. Kudraß, HTWK Leipzig 28 Anfrageergebnisse Sinnvolle Ergebnisse: – ein einzelnes Dokument, so wie es gespeichert wurde – eine Menge von Dokumenten – ein XML-Fragment (z.B. ein einzelnes Element mit seinen Kindern) – eine Menge von XML-Fragmenten – ein Wert (z.B. ein Attributwert, Funktionsergebnis, dynamisch berechnete Summe) – eine Menge von Werten – ein Attribut (Name-Wert-Paar) – eine Menge von Attributen Wie kann ein wohlgeformtes XML-Dokument geliefert werden? – DBMS verpackt Ergebnis in einem wohlgeformten XML- Dokument (z.B. durch Definition einer Wurzel) – Anfrage ist für Gestalt des Ergebnisses verantwortlich

© Prof. T. Kudraß, HTWK Leipzig 29 Andere Operationen Einfügen und Löschen von XML-Dokumenten vergleichbar mit Operationen anderer DBS mehr Möglichkeiten beim Ändern mit XML: – Attributwert ändern – Löschen oder Hinzufügen von Attributen – textuellen Inhalt eines Elements ändern – Kindelemente hinzufügen oder entfernen – Umbenennung von Elementen oder Attributen Operationen aus anderen Datenbanksystemen – Cursor-Konzept zur Verwaltung großer Ergebnismengen – das Laden großer Datenmengen – Definition und Änderung von Schemata

© Prof. T. Kudraß, HTWK Leipzig 30 Schemata in XML-Datenbanken Schemata in Datenbanken – Schema beschreibt Struktur der Instanzen – Unterscheide Typdefinitionen (statisch) und Integritätsbedingungen (laufzeitdynamisch) – Schema auch Behälter für Mengen von Instanzen (z.B. Tabelle in RDB) Definition physischer Eigenschaften (Speicherungsformen, Indexe) Schemata für XML – XML: selbstbeschreibende Instanzen (Interpretation ohne Schema möglich) – optionale Schemata eher mit Integritätsbedingungen in DBMS vergleichbar (Validieren beim Parsen einer XML-Instanz)

© Prof. T. Kudraß, HTWK Leipzig 31 Schemata in XML-Datenbanken (2) Aspekte eines Schemas im XML-Datenbanksystem – Garantieaspekt (Instanz validiert gegen dieses Schema) – Informationsaspekt (Schema enthält Infos über zu erwartende Instanzen) – Modularisierungsaspekt (wiederverwendbare Definitionen) Schema sollte für eine Menge von Instanzen definiert sein Validierung gegen dokumentspezifisches Schema nicht sinnvoll

© Prof. T. Kudraß, HTWK Leipzig 32 Anfragesprachen - Anforderungen deklarativ benutzerfreundliche Formulierung von Anfragen XML-basierte Syntax zur Darstellung der Anfragestruktur protokoll-unabhängig (nicht nur HTTP) integrierte Fehlerbehandlung auf allen Arten von wohlgeformten XML- Dokumenten (text- oder datenorientiert), schematische Beschreibung optional Anfragesprache muss geschlossen sein. Berücksichtigung von Namespaces

© Prof. T. Kudraß, HTWK Leipzig 33 Anfragesprachen für XML-Datenbanken XML Query Working Group (seit 1998) XML-QL war an Hochschulen sehr populärer Sprachvorschlag Industrie: 1999 XPath wird W3C-Empfehlung als Adressierungsmechanismus innerhalb von XSLT und zur Verwendung in XPointer – keine XML-Anfragesprache für DBS Erweiterungen von SQL: SQL/XML XQuery 1.0 W3C Recommendation