Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Native XML Datenbanken vs. ORDBMS für multimediale Dokumente Seminarvortrag von Alexander Loechel 19.02.2004 Seminar: DBMS für spezielle Anwendungen.

Ähnliche Präsentationen


Präsentation zum Thema: "Native XML Datenbanken vs. ORDBMS für multimediale Dokumente Seminarvortrag von Alexander Loechel 19.02.2004 Seminar: DBMS für spezielle Anwendungen."—  Präsentation transkript:

1 Native XML Datenbanken vs. ORDBMS für multimediale Dokumente Seminarvortrag von Alexander Loechel 19.02.2004 Seminar: DBMS für spezielle Anwendungen

2 Gliederung Multimedia Dokumente Multimedia Dokumente –Medientypen und Einteilung von Medientypen, MIME-Typen –Präsentationsformate –Aufbau von multimedialen Dokumenten –Markupsprachen XML XML

3 Gliederung Datenbankmodelle Datenbankmodelle –O bjektrelationale D atenbank M anagement S ysteme Historie Historie Aufbau, Datenhaltung Aufbau, Datenhaltung –XML-Datenbanken Historie Historie Aufbau, Datenhaltung Aufbau, Datenhaltung

4 Gliederung Grundlegender Vergleich beider Datenbankmodelle Grundlegender Vergleich beider Datenbankmodelle –Datenspeicherung –Datenhaltung –Datenaustausch –Anfragesprachen Fazit Fazit

5 Multimedia Dokumente Webseite des World Wide Web Consortium: www.w3c.org

6 Multimedia Dokumente Medientypen Texte (ACSII, Markup Dokumente, xml) Texte (ACSII, Markup Dokumente, xml) Bilder, Grafiken (gif, jpeg, svg, Bitmaps) Bilder, Grafiken (gif, jpeg, svg, Bitmaps) Ton, Musik (wav, mp3) Ton, Musik (wav, mp3) Videos (avi, mpeg) Videos (avi, mpeg) Präsentationen, Animationen (Flash, PDF) Präsentationen, Animationen (Flash, PDF)

7 Multimedia Dokumente Einteilbarkeit dieser Medientypen: Kontinuierliche Medien Diskrete Medien Reales Motiv Videos, Musik, Sprache Bilder Konstruiertes Motiv Animationen, Ton Bilder, Grafiken, Texte

8 Multimedia Dokumente Einteilbarkeit dieser Medientypen: Text Dateien: MarkupsprachenBinärdateien XML, SVG, HTML, X3D, … gif, jpeg, mpeg, avi, wav, mp3

9 Multimedia Dokumente Ein Multimedia Dokument ist ein Textdokument, das optional mit anderen Medien kombiniert sein kann.

10 Multimedia Dokument BegriffText Video / Bild / Audio Dokument+- Multimedia Dokument + optional (kombiniert) Medienobjekt + (ein Typ) Multimediaobjekt + (kombiniert)

11 Multimedia Dokumente Hypermediasysteme: Synthese aus: Hypertextsystemen Hypertextsystemen Multimedia Objekten Multimedia Objekten Typische Hypermediasysteme: (X)HTML (X)HTML SMIL SMIL LaTeX LaTeX

12 Multimedia Dokumente (X)HTML: (eXtensible) HyperText Markup Language (X)HTML ist heute die meist verwendete Hypertextsprache der Welt. Die Syntax und Regeln der Dokumentenbeschreibungs- sprache HTML basieren auf SGML. XHTML ein XML Subset, das die gleichen Tags wie HTML besitzt aber auf den grundlegenden Regeln von XML aufbaut. Mehr Informationen unter: –www.w3.org/MarkUp/ selfhtml.teamone.de/ www.w3.org/MarkUp/selfhtml.teamone.de/www.w3.org/MarkUp/selfhtml.teamone.de/ –Vorlesungen: Hypermediasysteme (Prof. Teege), Dokumentenbeschreibungssprachen (Dr. Schmitz) gelesen an der Fakultät für Informatik UniBw München

13 Multimedia Dokumente SMIL: Synchronized Multimedia Integration Language SMIL ist wie XHTML ein XML Subset, was aber speziell für die zeitlich und räumliche Abfolge von Medienobjekten entwickelt wurde. Aktuelle Version SMIL 2.0 als W3C Recommendation vom 7. August 2001 verfügbar. Mehr Informationen unter: –www.w3.org/AudioVideo/ www.w3.org/AudioVideo/ –Vorlesung: Hypermediasysteme (Prof. Teege) Fakultät für Informatik UniBw München

14 Multimedia Dokumente LaTeX: LaTeX ist ein wissenschaftliches Textsetzungssystem, welches ebenso für multimediale Dokumente verwendet werden kann. Es basiert auf TeX einer Markup Programmiersprache auf SGML Basis. Mehr Informationen unter: –www.latex-project.org/ www.latex-project.org/

15 Multimedia Dokumente Hypermediasysteme sind einfache Systeme zum Verfassen von Multimedia Dokumenten und zur Präsentation dieser. Hypermediasysteme unterscheiden sich großteils durch die verwendete Markup Sprache. Die in Zukunft wichtigste Markup Sprache für Hypermediasysteme wird XML sein.

16 Multimedia Dokumente Die HTML Syntax: <HTML><HEAD><TITLE>Titel</TITLE> </HEAD><BODY><p>Inhalt<ul><li>Listitem</ul></BODY>

17 Multimedia Dokumente Die XHTML-Syntax: <head><title>Title</title> </head><body><p>Inhalt</p><ul><li>Listitem</li></ul></body></html>

18 Multimedia Dokumente Bei den beiden vorhergehenden Folien hat man gesehen, das HTML und XHTML kleine aber entscheidende Unterschiede besitzen: HTML unterscheidet nicht zwischen Groß- und Kleinschreibung, Anfangstags benötigen teilweise nicht zwingend einen Endtag. HTML unterscheidet nicht zwischen Groß- und Kleinschreibung, Anfangstags benötigen teilweise nicht zwingend einen Endtag. XHTML, als XML Subset, achtet auf die Groß- und Kleinschreibung, es werden Namensräume und weitere Ideen aus XML verwendet. XHTML, als XML Subset, achtet auf die Groß- und Kleinschreibung, es werden Namensräume und weitere Ideen aus XML verwendet.

19 XML XML: eXtensible Markup Language XML ist eine neuere Meta Markup Sprache, die erstmals am 10. Februar 1998 als W3C Recommendation spezifiziert wurde. XML basiert auf Ideen von SGML; die Syntax ist restriktiver und setzt eine strikte hierarchische Struktur den XML Dokumenten zugrunde.

20 XML In XML gelten einige Regeln: 1. Jedes Dokument beginnt mit: 1. Jedes Dokument beginnt mit: 2. Alle Dokumente werden als Unicode verarbeitet (nationale Sprachklassen wie ASCII, Latin1, Shift-JIS werden trotzdem unterstützt) 3. XML Tags haben die folgende Form: fürs Begin Tag, fürs End Tag, für Leer / Empty Tags. Alle öffnenden Tags müssen auch wieder geschlossen werden.

21 XML Bei XML kann man zwischen zwei Ausprägungen unterscheiden: Datenorientierte XML-Dokumente Datenorientierte XML-Dokumente Textorientierte XML-Dokumente Textorientierte XML-Dokumente

22 XML Datenorientierte XML-Dokumente: Datenorientierte Dokumente entsprechen grob der XML Sicht auf stark strukturierte Daten. (z.B. Fahrpläne, Telefonbücher) Reihenfolge der Elemente ist für die Semantik nicht relevant. Reihenfolge der Elemente ist für die Semantik nicht relevant. Die Dokumente sind einheitlich und meist einfach strukturiert. Die Dokumente sind einheitlich und meist einfach strukturiert. Einzelne Bestandteile können Datentypen explizit zugeordnet werden. Einzelne Bestandteile können Datentypen explizit zugeordnet werden. Sinntragende Daten finden sich nur in den Blattelementen Sinntragende Daten finden sich nur in den Blattelementen

23 XML Textorientierte XML-Dokumente XML Verpackung von Texten (document centric) Sind selten genau gleich strukturiert Sind selten genau gleich strukturiert Reihenfolge der Elemente ist wichtig Reihenfolge der Elemente ist wichtig Sinntragende Daten finden sich auf allen Ebenen Sinntragende Daten finden sich auf allen Ebenen Verarbeitung via Volltextsuche Verarbeitung via Volltextsuche

24 Multimedia Dokumente & Datenbanken Wichtige Fragestellungen zur Struktur von multimedialen Dokumenten und Datenbanken: Syntax, Semantik Syntax, Semantik Modularisierung Modularisierung Verweise Verweise Kommentare, Metadaten Kommentare, Metadaten

25 Multimedia Dokumente & Datenbanken Probleme von Multimedialen Dokumenten in Bezug auf (XML-) Datenbanken: Ist das Dokument XML oder ein anderes Format? Ist das Dokument XML oder ein anderes Format? Existieren Verweise, wie sind diese zu behandeln? Existieren Verweise, wie sind diese zu behandeln? Dynamische Inhalte? Dynamische Inhalte?

26 Datenbankmodelle Datenbankmodelle: (Objekt-) Relationale Datenbanken (Objekt-) Relationale Datenbanken Native XML-Datenbanken Native XML-Datenbanken

27 Datenbankmodelle (Objekt-) Relationale Datenbanken: Relationale Datenbanken sind heute das meist verbreitete Datenbankmodell, Objektrelationale Datenbanken sind dazu nur eine moderne Weiterentwicklung. Die Mehrheit der aktuellen Relationalen Datenbanken arbeitet heute mit XML Unterstützung. Große ORDBMS: Oracle, DB2 (IBM), MS SQL Server, Sybase

28 Datenbankmodelle In Relationalen Datenbanken werden die Daten traditionell in mehreren flachen Tabellen gespeichert. Die einzelnen Spalten der Tabelle haben einen einzelnen Wert. Bei der Speicherung von XML-Dokumenten unterscheidet man zwischen: Inhaltsorientierte Zerlegung Inhaltsorientierte Zerlegung Strukturorientierte Zerlegung Strukturorientierte Zerlegung Opake Speicherung Opake Speicherung

29 Datenbankmodelle Inhaltsorientierte Zerlegung Inhaltsorientierte Zerlegung Bei der inhaltsorientierten Zerlegung werden XML Strukturen in relationale Strukturen umgesetzt. Aus XML Sicht wird dabei ein Dokument in mehrere Spalten, einer oder mehrerer Zeilen, einer oder mehrerer Tabellen zerlegt. Dies bezeichnet man als: shredding Die umgekehrte Erzeugung von XML- Dokumenten bezeichnet man als: wrapping

30 Datenbankmodelle Strukturorientierte Zerlegung: Strukturorientierte Zerlegung: Die strukturelle Zerlegung orientiert sich im Gegensatz zur inhaltsorientierten Zerlegung nicht am Inhalt eines XML-Dokuments, sondern an seiner Struktur. Ein XML-Dokument lässt sich als Baum auffassen und per DOM verarbeiten. Dieser Baum lässt sich in einer allgemeinen Weise auf ein oder mehrere generische Tabellen abbilden.

31 Datenbankmodelle Opake Speicherung: Opake Speicherung: Bei der opaken Speicherung wird ein XML- Dokument vollständig als Inhalt einer einzelnen Spalte einer Zeile in einer Tabelle abgespeichert. Diese Spalte hat einen allgemeinen Datentyp, der die Abspeicherung langer Zeichenketten erlaubt (z.B. CLOB, VARCHAR).

32 Datenbankmodelle Inhaltsorientierte Zerlegung Struktur- orientierte Zerlegung Opake Speicherung XML-Dokument bleiben erhalten neinneinja Indizierung von Inhalten jajaschwer AnfragespracheSQLSQL In SQL eingebettete Funktionen (SQL/MM) oder Textsuchfunktionen

33 Datenbankmodelle Es ist leicht verständlich, dass (Objekt-) Relationale Datenbanken – aufgrund der zerlegten Datenhaltung in Tabellen – für Multimedia Dokumente eher schlecht geeignet sind, wenn Forderungen wie Originaltreue oder Konsistenz existieren. Bis auf in der opake Speicherung werden die Dokumente aufgelöst. Leider sind auch kaum geeignete Such- und Manipulationsoperationen für Dokumente verfügbar.

34 Datenbankmodelle Native XML-Datenbanken: XML-Datenbanken sind eine neuere Technik, die sich nach der Durchsetzung von XML im Bereich der Datenkommunikation und des Datenaustausch entwickelt haben. In XML-Datenbanken werden die Daten als XML- Dokumente gespeichert, im Gegensatz zu (Objekt-) Relationalen Datenbanken, die dazu Tabellen nutzen.

35 Datenbankmodelle Ausprägungen von XML-Dokumenten und die Möglichkeit für XML-Datenbanken: Datenorientierte XML-Dokumente: Datenorientierte XML-Dokumente: –Mächtigkeit von Relationalen Datenbanken, vergleichbare Anwendungsbereiche Textorientierte XML-Dokumente: Textorientierte XML-Dokumente: –Dokumentverarbeitung, Vorteil für Multimedia Dokumente

36 Datenbankmodelle XML-Datenbanken Behält die Struktur und Inhalt eines XML- Dokuments bei und verändert es nicht, Originaltreue bleibt. Auch das Speichern von nicht XML-Daten (z.B. Bilder), ist möglich. XML-Datenbanken bieten vielfältige Möglichkeiten zur Medienindizierung. Das Speichern von zusätzlichen Metadaten macht es für Multimedia Dokumente sehr effektiv. XML bietet verschiedene Möglichkeiten zur Dokumentenverarbeitung, Manipulation und Suche (Information Retrieval)

37 Vergleich der Datenbankmodelle Objektrelationale Datenbanken gegenüber nativen XML-Datenbanken: Zum direkten Vergleich beider Modelle zieht man alle relevanten Daten der Systeme heran sowie Speicherung, Datenhaltung, Abfrage und Indizierung der Multimedia Dokumente.

38 Vergleich der Datenbankmodelle ORDBMS XML- Datenbanken Datenhaltung Als Einträge in relationalen Tabellen Als XML, bzw. nicht XML-Dokumente Originaltreue von Multimedia Dokumenten Bleibt nur bei opaker Speicherung erhalten Bleibt grundsätzlich erhalten Indizierung von Informationen Grundsätzlich möglich, aber nur für ganze Zellen Wertindex, Textindex, Strukturindex

39 Vergleich der Datenbankmodelle ORDBMS XML- Datenbanken Anfragesprachen / Query Language SQL XQuery, XSQL, XPath, XNode Metadaten Manuell Eingabe Manuell oder durch XML Daten / XML Metadaten Wiederauffinden von Daten Durch Index Durch XML-Baum

40 Fazit Heute haben noch die XML-Datenbanken die besseren Werte bei der Verwaltung von multimedialen Dokumenten, die auf XML basieren. Die Objektrelationalen Datenbanken werden aber in Zukunft bessere Unterstützung bieten.

41 Fazit Multimediale Dokumente auf XML Basis sind in einer XML-Datenbank noch besser aufgehoben, Dokumente auf HTML Basis oder anderen nicht XML Sprachen sind in beiden Datenbankmodellen sinnvoll zu halten. Einzelne Medienobjekte (exklusive Text) sind in (Objekt-) Relationalen Datenbanken heute noch günstiger und effektiver, aber vom System her in beiden Modellen gut aufgehoben.

42 Ausblick Was sind die Themenbereiche die im Bereich Multimedia Datenbankanwendungen noch weiter erforscht werden müssen: Speicherung dynamischer Webseiten (server side skripts: php, perl, JavaServlets) Speicherung dynamischer Webseiten (server side skripts: php, perl, JavaServlets) Vermeidung von Redundanz, zum Speichern verlinkter Medien (z.B. Logo) Vermeidung von Redundanz, zum Speichern verlinkter Medien (z.B. Logo) Indizierung, Ähnlichkeitsfunktionen von Medienobjekten, Marken und Metadaten zu Videos, … Indizierung, Ähnlichkeitsfunktionen von Medienobjekten, Marken und Metadaten zu Videos, …

43 Ende Noch Fragen?


Herunterladen ppt "Native XML Datenbanken vs. ORDBMS für multimediale Dokumente Seminarvortrag von Alexander Loechel 19.02.2004 Seminar: DBMS für spezielle Anwendungen."

Ähnliche Präsentationen


Google-Anzeigen