Native XML Datenbanken vs. ORDBMS für multimediale Dokumente Seminarvortrag von Alexander Loechel 19.02.2004 Seminar: DBMS für spezielle Anwendungen.

Slides:



Advertisements
Ähnliche Präsentationen
XML-basierte Techniken
Advertisements

Dateiformate Tobias Rolle IT takes more than systems …
Entwicklung UnivIS-Anbindung auf Basis von PHP und DOM-XML
Datenbanken Einführung.
XML - Datenbanken am Beispiel Tamino von Sven Neuberg Seminar: Verteilte Datenbanken
Objekt – Relationales – Modell Tomasz Makowski IN
Universität Rostock Fakultät für Informatik und Elektrotechnik Institut für Informatik, Lehrstuhl DBIS Albert-Einstein-Straße 21, D Rostock Putbus,
Was bedeutet XML in Office-Applikationen für Systemadministratoren? Ruprecht Dröge MCSE MCSD MCT Microsoft Pre Sales Consultant.
Anmerkungen zu XML Im September 2000 Entwicklung/Anspruch von XML
Literaturverwaltung und Wissensorganisation
XML - Aufbau und Struktur - mit Einsatz im B2B
IMS Universität Stuttgart 1 Einführung in XML Hannah Kermes HS: Elektronische Wörterbücher Do,
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/7 Information Retrieval auf Texten An ihre Grenzen stoßen relationale Datenbanken bei der.
DOM (Document Object Model)
Seminar XML und Datenbanken Sven Wiegelmann SS 2002.
XINDICE The Apache XML Project Name: Jacqueline Langhorst
Kann eine XML-Datenbank temporal sein? Universität zu Köln Hauptseminar: Datenbanken vs. Markup Dozent: Prof. Dr. Manfred Thaller Referentin: Cigdem Varol.
HTML - Eine erste Annäherung
Eine Einführung in OpenOffice. Was? Freies Office-Paket mit offenem Quellcode Erste funktionierende Version im Oktober 2001 veröffentlicht Basiert auf.
© 2002 Prof. Dr. G. Hellberg 1 XML-Seminar XML-Technologie: XML in Theorie und Praxis Prof. Dr. G. Hellberg XML-Technologie: XML in Theorie und Praxis.
XML in Datenbanksystemen. © Prof. T. Kudraß, HTWK Leipzig 2 2 Warum wird XML eingesetzt? Antworten von Unternehmen: erweiterte Suchmöglichkeiten im Unternehmen.
SQL/XML. © Prof. T. Kudraß, HTWK Leipzig 2 2 Motivation Speicherung von XML in allen großen kommerziellen DBMS vorhanden proprietäre Lösungen für die.
Oberseminar Datenbanken Multimediale Datenbanken Christian Völschow.
Anwendungen. © Prof. T. Kudraß, HTWK Leipzig Historie des WWW Grundlage Internet – Entwickelt Ende der 60er Jahre vom US-Militär (ARPA-Net) – Technische.
Einführung XML XML Einführung Andreas Leicht.
MMQL – Multimedia Query Language Eine Anfragesprache für Multimedia-Ähnlichkeitsanfragen Christian Mantei.
Introducing the .NET Framework
Access 2000 Datenbanken.
© data2type 2005, 1 Publishing mit XML Einsatz von XSL für das multimediale, automatisierte Publishing.
Tobias Högel & Dennis Böck,
Einführung und Überblick
1 Grundlagen und Anwendung der Extensible Markup Language (XML ) Peter Buxmann Institut für Wirtschaftsinformatik Johann Wolfgang Goethe-Universität Frankfurt.
... und alles was dazugehört
Visualisierung objektrelationaler Datenbanken
Architektur und Funktionalitäten der Oracle XML DB - ein Überblick mit ausgewählten praktischen Beispielen - im Rahmen des 17. Workshop Grundlagen von.
Vortrag HTML, XHTML, DHTML
Vom XML Schema zur relationalen Datenbank Seminararbeit zum Multimedia-Seminar im SS 2002 Erstellt von: Thomas Dickel.
Hypertext Markup Language
Seminar XML-Technologien: VoiceXML/SMIL 1 Was ist SMIL ? Synchronized Multimedia Integration Language Ausprache wie das englische Wort smile {smaIl} August.
HTML-Editoren Eine Präsentation von Erik Kulisch.
Proseminar: „Webtechnologien für Ecommerce“
Java für Fortgeschrittene
Sesame Florian Mayrhuber
Vorlesung #4 Überführung des ER-Modells in das relationale Modell
Allgemeines zu Datenbanken
Ausgabe vom Seite 1, XML Eine Einführung XML - Eine Einführung.
Oliver Spritzendorfer Thomas Fekete
XML und Datenbanken © 2006 Markus Röder
XML in relationalen Datenbanken
Normalisierungsprozess
XML (Extensible Markup Language)
Dublin Core IT-Zertifikat Daten- und Metadatenstandards.
© 2001 Sven Dammann1 Aufbau Integrierter Informationssysteme XML Bearbeitung und relationale Abbildung Sven Dammann Martin-Luther-Universität Halle-Wittenberg.
Digitale Medien I Programmablauf der Vorlesung am 05. Juli 2014 Dozent: Gerhard Fleige Digitale Medien I Samstag, 05. Juli 2014 Die nachfolgenden Folien.
Multimedia in Java Thomas Witschel, Kerstin Steinert & Erik Reinhard.
HTML Hypertext Markup Language
SQL - Structured Query Language  AIFB SS (1|3) 2.1 Allgemeines zu SQL (1|3) Benennung: SQL: „structured query language" ursprünglich: SEQUEL –
PHP:: Hypertext Preprocessor Einführung Praxis. PHP:: Hypertext Preprocessor Jetzt mal von der anderen Seite © All rights reversed2 PHP:: Hypertext Preprocessor.
IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle XML-BasicsWS 08/09.
Datenbanken im Web 1.
Seminar zur Geoinformation Folie 1 Inhalt: –XML –XML- SCHEMA –XSL –Syntax –GML Seminar zur Geoinformation Datenaustausch mit XML / GML im InternetDatenaustausch.
1 6.4 Verwaltung semistrukturierter Daten - was ist das? Datenverwaltung für XML-Dokumente - Daten in XML-Gewand - eigentlich XML-Dokumente - Abbildung.
Datenbank System (DBS) - Warum?
Das Internet Ein Netzwerk, das viele Rechner miteinander verbindet
Datentransformation mit XSLT Seminarvortrag von Johannes Engels.
XML-Erweiterungen in ORDBMS Seminar: DBMS für spezielle Anwendungen Florian Brieler.
Entwicklungsgeschichte
Alles wird gut! Suche im MyCoRe Jens Kupferschmidt
Von Wietlisbach, Lenzin und Winter
Von Wietlisbach, Lenzin und Winter
 Präsentation transkript:

Native XML Datenbanken vs. ORDBMS für multimediale Dokumente Seminarvortrag von Alexander Loechel Seminar: DBMS für spezielle Anwendungen

Gliederung Multimedia Dokumente Multimedia Dokumente –Medientypen und Einteilung von Medientypen, MIME-Typen –Präsentationsformate –Aufbau von multimedialen Dokumenten –Markupsprachen XML XML

Gliederung Datenbankmodelle Datenbankmodelle –O bjektrelationale D atenbank M anagement S ysteme Historie Historie Aufbau, Datenhaltung Aufbau, Datenhaltung –XML-Datenbanken Historie Historie Aufbau, Datenhaltung Aufbau, Datenhaltung

Gliederung Grundlegender Vergleich beider Datenbankmodelle Grundlegender Vergleich beider Datenbankmodelle –Datenspeicherung –Datenhaltung –Datenaustausch –Anfragesprachen Fazit Fazit

Multimedia Dokumente Webseite des World Wide Web Consortium:

Multimedia Dokumente Medientypen Texte (ACSII, Markup Dokumente, xml) Texte (ACSII, Markup Dokumente, xml) Bilder, Grafiken (gif, jpeg, svg, Bitmaps) Bilder, Grafiken (gif, jpeg, svg, Bitmaps) Ton, Musik (wav, mp3) Ton, Musik (wav, mp3) Videos (avi, mpeg) Videos (avi, mpeg) Präsentationen, Animationen (Flash, PDF) Präsentationen, Animationen (Flash, PDF)

Multimedia Dokumente Einteilbarkeit dieser Medientypen: Kontinuierliche Medien Diskrete Medien Reales Motiv Videos, Musik, Sprache Bilder Konstruiertes Motiv Animationen, Ton Bilder, Grafiken, Texte

Multimedia Dokumente Einteilbarkeit dieser Medientypen: Text Dateien: MarkupsprachenBinärdateien XML, SVG, HTML, X3D, … gif, jpeg, mpeg, avi, wav, mp3

Multimedia Dokumente Ein Multimedia Dokument ist ein Textdokument, das optional mit anderen Medien kombiniert sein kann.

Multimedia Dokument BegriffText Video / Bild / Audio Dokument+- Multimedia Dokument + optional (kombiniert) Medienobjekt + (ein Typ) Multimediaobjekt + (kombiniert)

Multimedia Dokumente Hypermediasysteme: Synthese aus: Hypertextsystemen Hypertextsystemen Multimedia Objekten Multimedia Objekten Typische Hypermediasysteme: (X)HTML (X)HTML SMIL SMIL LaTeX LaTeX

Multimedia Dokumente (X)HTML: (eXtensible) HyperText Markup Language (X)HTML ist heute die meist verwendete Hypertextsprache der Welt. Die Syntax und Regeln der Dokumentenbeschreibungs- sprache HTML basieren auf SGML. XHTML ein XML Subset, das die gleichen Tags wie HTML besitzt aber auf den grundlegenden Regeln von XML aufbaut. Mehr Informationen unter: – selfhtml.teamone.de/ –Vorlesungen: Hypermediasysteme (Prof. Teege), Dokumentenbeschreibungssprachen (Dr. Schmitz) gelesen an der Fakultät für Informatik UniBw München

Multimedia Dokumente SMIL: Synchronized Multimedia Integration Language SMIL ist wie XHTML ein XML Subset, was aber speziell für die zeitlich und räumliche Abfolge von Medienobjekten entwickelt wurde. Aktuelle Version SMIL 2.0 als W3C Recommendation vom 7. August 2001 verfügbar. Mehr Informationen unter: – –Vorlesung: Hypermediasysteme (Prof. Teege) Fakultät für Informatik UniBw München

Multimedia Dokumente LaTeX: LaTeX ist ein wissenschaftliches Textsetzungssystem, welches ebenso für multimediale Dokumente verwendet werden kann. Es basiert auf TeX einer Markup Programmiersprache auf SGML Basis. Mehr Informationen unter: –

Multimedia Dokumente Hypermediasysteme sind einfache Systeme zum Verfassen von Multimedia Dokumenten und zur Präsentation dieser. Hypermediasysteme unterscheiden sich großteils durch die verwendete Markup Sprache. Die in Zukunft wichtigste Markup Sprache für Hypermediasysteme wird XML sein.

Multimedia Dokumente Die HTML Syntax: <HTML><HEAD><TITLE>Titel</TITLE> </HEAD><BODY><p>Inhalt<ul><li>Listitem</ul></BODY>

Multimedia Dokumente Die XHTML-Syntax: <head><title>Title</title> </head><body><p>Inhalt</p><ul><li>Listitem</li></ul></body></html>

Multimedia Dokumente Bei den beiden vorhergehenden Folien hat man gesehen, das HTML und XHTML kleine aber entscheidende Unterschiede besitzen: HTML unterscheidet nicht zwischen Groß- und Kleinschreibung, Anfangstags benötigen teilweise nicht zwingend einen Endtag. HTML unterscheidet nicht zwischen Groß- und Kleinschreibung, Anfangstags benötigen teilweise nicht zwingend einen Endtag. XHTML, als XML Subset, achtet auf die Groß- und Kleinschreibung, es werden Namensräume und weitere Ideen aus XML verwendet. XHTML, als XML Subset, achtet auf die Groß- und Kleinschreibung, es werden Namensräume und weitere Ideen aus XML verwendet.

XML XML: eXtensible Markup Language XML ist eine neuere Meta Markup Sprache, die erstmals am 10. Februar 1998 als W3C Recommendation spezifiziert wurde. XML basiert auf Ideen von SGML; die Syntax ist restriktiver und setzt eine strikte hierarchische Struktur den XML Dokumenten zugrunde.

XML In XML gelten einige Regeln: 1. Jedes Dokument beginnt mit: 1. Jedes Dokument beginnt mit: 2. Alle Dokumente werden als Unicode verarbeitet (nationale Sprachklassen wie ASCII, Latin1, Shift-JIS werden trotzdem unterstützt) 3. XML Tags haben die folgende Form: fürs Begin Tag, fürs End Tag, für Leer / Empty Tags. Alle öffnenden Tags müssen auch wieder geschlossen werden.

XML Bei XML kann man zwischen zwei Ausprägungen unterscheiden: Datenorientierte XML-Dokumente Datenorientierte XML-Dokumente Textorientierte XML-Dokumente Textorientierte XML-Dokumente

XML Datenorientierte XML-Dokumente: Datenorientierte Dokumente entsprechen grob der XML Sicht auf stark strukturierte Daten. (z.B. Fahrpläne, Telefonbücher) Reihenfolge der Elemente ist für die Semantik nicht relevant. Reihenfolge der Elemente ist für die Semantik nicht relevant. Die Dokumente sind einheitlich und meist einfach strukturiert. Die Dokumente sind einheitlich und meist einfach strukturiert. Einzelne Bestandteile können Datentypen explizit zugeordnet werden. Einzelne Bestandteile können Datentypen explizit zugeordnet werden. Sinntragende Daten finden sich nur in den Blattelementen Sinntragende Daten finden sich nur in den Blattelementen

XML Textorientierte XML-Dokumente XML Verpackung von Texten (document centric) Sind selten genau gleich strukturiert Sind selten genau gleich strukturiert Reihenfolge der Elemente ist wichtig Reihenfolge der Elemente ist wichtig Sinntragende Daten finden sich auf allen Ebenen Sinntragende Daten finden sich auf allen Ebenen Verarbeitung via Volltextsuche Verarbeitung via Volltextsuche

Multimedia Dokumente & Datenbanken Wichtige Fragestellungen zur Struktur von multimedialen Dokumenten und Datenbanken: Syntax, Semantik Syntax, Semantik Modularisierung Modularisierung Verweise Verweise Kommentare, Metadaten Kommentare, Metadaten

Multimedia Dokumente & Datenbanken Probleme von Multimedialen Dokumenten in Bezug auf (XML-) Datenbanken: Ist das Dokument XML oder ein anderes Format? Ist das Dokument XML oder ein anderes Format? Existieren Verweise, wie sind diese zu behandeln? Existieren Verweise, wie sind diese zu behandeln? Dynamische Inhalte? Dynamische Inhalte?

Datenbankmodelle Datenbankmodelle: (Objekt-) Relationale Datenbanken (Objekt-) Relationale Datenbanken Native XML-Datenbanken Native XML-Datenbanken

Datenbankmodelle (Objekt-) Relationale Datenbanken: Relationale Datenbanken sind heute das meist verbreitete Datenbankmodell, Objektrelationale Datenbanken sind dazu nur eine moderne Weiterentwicklung. Die Mehrheit der aktuellen Relationalen Datenbanken arbeitet heute mit XML Unterstützung. Große ORDBMS: Oracle, DB2 (IBM), MS SQL Server, Sybase

Datenbankmodelle In Relationalen Datenbanken werden die Daten traditionell in mehreren flachen Tabellen gespeichert. Die einzelnen Spalten der Tabelle haben einen einzelnen Wert. Bei der Speicherung von XML-Dokumenten unterscheidet man zwischen: Inhaltsorientierte Zerlegung Inhaltsorientierte Zerlegung Strukturorientierte Zerlegung Strukturorientierte Zerlegung Opake Speicherung Opake Speicherung

Datenbankmodelle Inhaltsorientierte Zerlegung Inhaltsorientierte Zerlegung Bei der inhaltsorientierten Zerlegung werden XML Strukturen in relationale Strukturen umgesetzt. Aus XML Sicht wird dabei ein Dokument in mehrere Spalten, einer oder mehrerer Zeilen, einer oder mehrerer Tabellen zerlegt. Dies bezeichnet man als: shredding Die umgekehrte Erzeugung von XML- Dokumenten bezeichnet man als: wrapping

Datenbankmodelle Strukturorientierte Zerlegung: Strukturorientierte Zerlegung: Die strukturelle Zerlegung orientiert sich im Gegensatz zur inhaltsorientierten Zerlegung nicht am Inhalt eines XML-Dokuments, sondern an seiner Struktur. Ein XML-Dokument lässt sich als Baum auffassen und per DOM verarbeiten. Dieser Baum lässt sich in einer allgemeinen Weise auf ein oder mehrere generische Tabellen abbilden.

Datenbankmodelle Opake Speicherung: Opake Speicherung: Bei der opaken Speicherung wird ein XML- Dokument vollständig als Inhalt einer einzelnen Spalte einer Zeile in einer Tabelle abgespeichert. Diese Spalte hat einen allgemeinen Datentyp, der die Abspeicherung langer Zeichenketten erlaubt (z.B. CLOB, VARCHAR).

Datenbankmodelle Inhaltsorientierte Zerlegung Struktur- orientierte Zerlegung Opake Speicherung XML-Dokument bleiben erhalten neinneinja Indizierung von Inhalten jajaschwer AnfragespracheSQLSQL In SQL eingebettete Funktionen (SQL/MM) oder Textsuchfunktionen

Datenbankmodelle Es ist leicht verständlich, dass (Objekt-) Relationale Datenbanken – aufgrund der zerlegten Datenhaltung in Tabellen – für Multimedia Dokumente eher schlecht geeignet sind, wenn Forderungen wie Originaltreue oder Konsistenz existieren. Bis auf in der opake Speicherung werden die Dokumente aufgelöst. Leider sind auch kaum geeignete Such- und Manipulationsoperationen für Dokumente verfügbar.

Datenbankmodelle Native XML-Datenbanken: XML-Datenbanken sind eine neuere Technik, die sich nach der Durchsetzung von XML im Bereich der Datenkommunikation und des Datenaustausch entwickelt haben. In XML-Datenbanken werden die Daten als XML- Dokumente gespeichert, im Gegensatz zu (Objekt-) Relationalen Datenbanken, die dazu Tabellen nutzen.

Datenbankmodelle Ausprägungen von XML-Dokumenten und die Möglichkeit für XML-Datenbanken: Datenorientierte XML-Dokumente: Datenorientierte XML-Dokumente: –Mächtigkeit von Relationalen Datenbanken, vergleichbare Anwendungsbereiche Textorientierte XML-Dokumente: Textorientierte XML-Dokumente: –Dokumentverarbeitung, Vorteil für Multimedia Dokumente

Datenbankmodelle XML-Datenbanken Behält die Struktur und Inhalt eines XML- Dokuments bei und verändert es nicht, Originaltreue bleibt. Auch das Speichern von nicht XML-Daten (z.B. Bilder), ist möglich. XML-Datenbanken bieten vielfältige Möglichkeiten zur Medienindizierung. Das Speichern von zusätzlichen Metadaten macht es für Multimedia Dokumente sehr effektiv. XML bietet verschiedene Möglichkeiten zur Dokumentenverarbeitung, Manipulation und Suche (Information Retrieval)

Vergleich der Datenbankmodelle Objektrelationale Datenbanken gegenüber nativen XML-Datenbanken: Zum direkten Vergleich beider Modelle zieht man alle relevanten Daten der Systeme heran sowie Speicherung, Datenhaltung, Abfrage und Indizierung der Multimedia Dokumente.

Vergleich der Datenbankmodelle ORDBMS XML- Datenbanken Datenhaltung Als Einträge in relationalen Tabellen Als XML, bzw. nicht XML-Dokumente Originaltreue von Multimedia Dokumenten Bleibt nur bei opaker Speicherung erhalten Bleibt grundsätzlich erhalten Indizierung von Informationen Grundsätzlich möglich, aber nur für ganze Zellen Wertindex, Textindex, Strukturindex

Vergleich der Datenbankmodelle ORDBMS XML- Datenbanken Anfragesprachen / Query Language SQL XQuery, XSQL, XPath, XNode Metadaten Manuell Eingabe Manuell oder durch XML Daten / XML Metadaten Wiederauffinden von Daten Durch Index Durch XML-Baum

Fazit Heute haben noch die XML-Datenbanken die besseren Werte bei der Verwaltung von multimedialen Dokumenten, die auf XML basieren. Die Objektrelationalen Datenbanken werden aber in Zukunft bessere Unterstützung bieten.

Fazit Multimediale Dokumente auf XML Basis sind in einer XML-Datenbank noch besser aufgehoben, Dokumente auf HTML Basis oder anderen nicht XML Sprachen sind in beiden Datenbankmodellen sinnvoll zu halten. Einzelne Medienobjekte (exklusive Text) sind in (Objekt-) Relationalen Datenbanken heute noch günstiger und effektiver, aber vom System her in beiden Modellen gut aufgehoben.

Ausblick Was sind die Themenbereiche die im Bereich Multimedia Datenbankanwendungen noch weiter erforscht werden müssen: Speicherung dynamischer Webseiten (server side skripts: php, perl, JavaServlets) Speicherung dynamischer Webseiten (server side skripts: php, perl, JavaServlets) Vermeidung von Redundanz, zum Speichern verlinkter Medien (z.B. Logo) Vermeidung von Redundanz, zum Speichern verlinkter Medien (z.B. Logo) Indizierung, Ähnlichkeitsfunktionen von Medienobjekten, Marken und Metadaten zu Videos, … Indizierung, Ähnlichkeitsfunktionen von Medienobjekten, Marken und Metadaten zu Videos, …

Ende Noch Fragen?