Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

1 XML und Datenbanken Kapitel 7: Modellierung, Teil 2 Meike Klettke Universität Rostock Fakultät für Informatik und Elektrotechnik

Ähnliche Präsentationen


Präsentation zum Thema: "1 XML und Datenbanken Kapitel 7: Modellierung, Teil 2 Meike Klettke Universität Rostock Fakultät für Informatik und Elektrotechnik"—  Präsentation transkript:

1 1 XML und Datenbanken Kapitel 7: Modellierung, Teil 2 Meike Klettke Universität Rostock Fakultät für Informatik und Elektrotechnik

2 2 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Inhalt Teil 1: n Motivation, warum ein Schema erforderlich ist n Schemata für XML-Dokumente –DTDs –XML Schema Teil 2: n konzeptuelle Modellierung –1. Vorteile einer Modellierung –Methoden zur konzeptuellen Modellierung 2. Verwendung des Entity-Relationship-Modells 3. Einsatz von UML 4. Graphbasierte Verfahren 5. eigener Ansatz n 6. Ableitung von Schemainformationen aus XML-Dokumenten n 7. Metriken n 8. Weiterführende Literatur - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

3 3 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken 1. Vorteile einer konzeptuellen Modellierung Wunschvorstellung: –Modellierung auf einem höheren Niveau, das von der konkreten Realisierung im Schema zunächst unabhängig ist –soll von Domainexperten verstanden werden –direkte Übersetzung in ein XML-Schema möglich –Enthält keine Implementierungsdetails –Schrittweise Konkretisierung –Graphische Darstellung Ziel: –höhere Qualität der Dokumente - exakteres Vorgehen es gibt noch keine akzeptierte Modellierungssprache für den Entwurf von XML/DTD/XML-Schemata. Häufig wird auch Reverse-Engineering angewendet, aus XML- Dokumenten erfolgt die Ableitung der DTD durch Tools. - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

4 4 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Modelle n Modelle werden heute in allen Wissenschaftsgebieten eingesetzt n weit akzeptierte allgemeine Modelltheorie wurde 1973 von Herbert Stachowiak vorgeschlagen. n Modellbegriff darin ist domänenübergreifend anwendbar, Modell hat drei Eigenschaften: –Abbildung: Modell ist immer ein Abbild von etwas, eine Repräsentation natürlicher oder künstlicher Originale, die selbst wieder Modelle sein können. –Verkürzung: Ein Modell erfasst nicht alle Attribute des Originals, sondern nur die jeweils relevanten –Pragmatismus: Orientierung am Nützlichen, Fragen wie Für wen?, Warum? und Wozu? werden berücksichtigt

5 5 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Beispiel eines Modells n maßstabgetreues 1:100-Modell des Stephansdoms n originalgetreue, detailreiche Modell für blinde und sehbehinderte Menschen n Auch Kindern wird es damit erleichtert, die Dimensionen der Kirche zu "begreifen"

6 6 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Modellierungsmethode für XML n einige Vorschläge für XML-Modelle und Modellierungmethoden n Ziele dabei sollen sein: –so einfach wie möglich –so komplex wie nötig –Vollständige XML-Schema-Unterstützung –Verwendung von Defaultwerten und Voreinstellungen entgegengesetzte Eigenschaften

7 7 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Möglichkeiten zur Modellierung ?? konzeptuelle Ebene datenzentriert semi- strukturiert dok-zentriert XML-Editoren baumbasierte ORMER Modellierung von Struktur UML Struktur und Inhalt Modellierung von Struktur und Inhalt Modellierung von ?? konzeptuelle Ebene Konzeptueller Entwurf von XML- Dokumenten - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

8 8 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken 2. Entity-Relationship-Modell für den Datenbankentwurf/ 1 n Für den Datenbankentwurf NameOrt NameISBN TitelISBN Verlag gibt_heraus Buch schreibt Autor ISBNID NameVornameID ISBN Buch Autor Verlag schreibt [1,n] [1,1] [1,n] Name Ort Titel gibt_ heraus [0,n] Name Vorname ID - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

9 9 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Entity-Relationship-Modell für den Datenbankentwurf/ 2 n jede Darstellung im ER findet Entsprechung in relationalen Datenbanken n Entwurf auf einen abstrakteren Level (konzeptuell) n Eindeutige Abbildung der Entity-Relationship-Diagrammes n Alle relevanten Informationen einer relationalen Datenbank können aus dem Entwurf abgeleitet werden - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

10 10 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Entity-Relationship Modell für DTDs n Für den Entwurf von DTDs ISBN Buch Autor Verlag schreibt [1,n] [1,1] [1,n] Name Ort Titel gibt_ heraus [0,n] Name Vorname ID - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

11 11 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Entity-Relationship Modell für XML-Schemata /1 ISBN Buch Autor Verlag schreibt [1,n] [1,1] [1,n] Name Ort Titel gibt_ heraus [0,n] Name Vorname ID - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

12 12 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Entity-Relationship Modell für XML-Schemata/ 2 n Abbildung nicht einfach nachvollziehbar n Unterschiedliche Behandlung der Kardinalitäten 1:n und n:m n Abbildung der Schlüssel auf ID (nicht das identische Konzept) n Keine Möglichkeit zur Darstellung von Alternativen, Mixed Content und ANY n Entity-Relationship-Modell bietet Konzepte, die sich nicht einfach abbilden lassen und es gibt Konzepte in XML, die sich nicht im Entity-Relationship-Modell darstellen lassen n Verwendet werden kann also erweiterte Untermenge - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

13 13 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken 3. Einsatz von UML – Klassendiagrammen /1 n Darstellung von Elementdeklarationen durch Klassen ort plz strasse hausnummer postfach [0..1] adresse hausnummer, postfach?>

14 14 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Einsatz von UML – Klassendiagrammen /2 n Darstellung vom Inhaltsmodell Sequenz n Deklaration von Attributen n (UML-Konstrukt: Aggregation, Teil-Ganzes-Beziehungen zwischen einem Aggregat und seinen Teilen) autor CDATA #IMPLIED> datum CDATA #IMPLIED hotelnamekategorieadresse 0..1 hotel > url:CDATA > datum[0..1]:CDATA > autor [0..1] CDATA - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

15 15 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Einsatz von UML – Klassendiagrammen /3 n Darstellung von Alternativen n (UML-Konstrukt: Generalisierung, Ist-Ein-Beziehungen zwischen Klassen) pension | ferienwohnung )>

16 16 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Komplexeres Beispiel preisehotelnametelefon 0..1 adresse 1..n kategorie {choice : 0.. n} plzortstrassehausnummerdoppelzimmerapartment > #PCDATA einzelzimmer {sequence : 1} hotel > url:CDATA > datum[0..1]:CDATA > autor [0..1] CDATA {sequence : 1} - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

17 17 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Bewertung n In beiden Fällen n erweiterte Untermenge wird eingesetzt, das heißt: n Einige Konstrukte des ERM bzw. aus UML lassen sich nicht adäquat abbilden –Beispiel n:m-Kardinalitäten n Andere Bestandteile einer DTD oder eines XML Schemas lassen sich nicht geeignet darstellen –Beispiel mixed content - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

18 18 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken 4. Verwendung von Editoren n Visualisierung der Baumstruktur der XML-Dokumente oder der Graphstruktur der Schemata n Beispiel XML Spy - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

19 19 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken 5. CoDEX-Modell (für Entwurf und Evolution) n Grundbestandteile: –Elemente, –Attributgruppen, –einfache und komplexe Typen, –Module n weitere spezielle Knoten für Inhaltsmodelle –Sequenz, Alternative, mixed Content n Verbindungen dazwischen: gerichtete und ungerichtete Kanten n Rootknoten= Einstiegsknoten n Beschreibungen zu den Knoten (z.B. Wertebereichsbeschreibungen, facets)

20 20 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken CoDEX - Beispiel n Graph, verschiedene Knotenarten von Knoten (Elemente, Module, Inhaltsmodelle, Typen) n Rootknoten (ausgezeichnete Elemente oder Module) n Operationen darauf: –Eigenschaften testen (erlaubte Zustände) –Übersetzung in XML- Schema, dazu Übersetzungsreihenfolge bestimmen

21 21 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Verwendung von Modulen im CoDEX-Modell n Graphische Notation: wie UML-packages n Zuordnung von XML-Schemata (können auch durch den CoDEX-Editor erzeugt sein)

22 22 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Model Driven Engineering n Automatische Modellvervollständigung n Beispiel: n Ergänzen von –simple Types –complex Types –Inhaltsmodellen

23 23 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Eigenschaften der Modellierungsmethode n Einfache graphische und formale Notation n Übersetzung in XML-Schemata n Vorteile: –Vollständige Modellierung von XML-Schemata möglich (einiges fehlt in der Implementierung: Typhierarchien, list, union) –Modularisierung möglich n Nachteile: –kein richtiges konzeptionelles Modell, es fehlt die Vereinfachung n dafür aber automatische Vervollständigung vereinfachter Modelle n Weitere Eigenschaften –Reverse-Engineering: vorhandenes XML-Schema -> CoDEX –Einsatz des Verfahrens zur Evolution (Weiterentwicklung, Propagieren der Änderungen,...)

24 24 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Formales Modell von CoDEX n Graph, mehrere Arten von Knoten –Elemente –Attributgruppen, –Module –einfache Typen –komplexe Typen –Inhaltsmodelle (sequence, choice, all) n zwei Arten von Kanten: gerichtet und ungerichtet –ungerichtete Kanten nur während des Entwurfes n Rootknoten (gekennzeichnete Elemente oder Module) - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

25 25 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Übersetzung: CoDEX in XML- Schema n zunächst: –Modellprüfung und –Modellvervollständigung n dann Übersetzung: –Darstellen der Adjazenzmatrix zum Graphen, in dieser sind die Knoten und ihre Kanten enthalten –Übersetzung beginnt bei den Rootkonzepten –im nächsten Schritt Übersetzung der Konzepten, von denen eine Kante zu den Rootkonzepten besteht –Übersetzung erfolgt bis alle Knoten des Graphen übersetzt sind –erzeugt wird Schema im Modellierungsstil Venetian Blind - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

26 26 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Weitere Eigenschaften des Entwurfstools n Reverse-Engineering ist möglich n erster Schritt: –Umwandlung eines Schemas in Modellierungsstil Venetian Blind n zweiter Schritt: –Erstellen des zugehörigen CoDEX-Modells (Verwenden eines automatischen Layouts) - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

27 27 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken damit n verschiedene Entwurfsverfahren vorgestellt n alle haben auch Nachteile –entweder nicht alles darstellbar, was XML-Schema darstellen kann oder –nicht einfach genug, weil zu detailliert n bisher außer den XML-Editoren keine Methode etabliert n jetzt: weiterer Punkt, wenn zu XML-Dokumenten kein Schema bekannt ist, so kann dieses aus den Dokumenten abgeleitet werden n Verfahren dazu folgen anschließend

28 28 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Ableitung von Schema-Informa- tionen aus Dokumentkollektionen n Ableitung eines Schemas für ein oder mehrere gegebene XML-Dokumente n Reverse-Engineering n Beispielkollektion ausreichend groß und vielfältig n Sonst ist die abgeleitete DTD zu speziell n abgeleitete Schemabeschreibung soll durch einen Anwender überprüft werden - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

29 29 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Schemaableitung (DTD) Die folgenden 7 Folien stammen im Wesentlichen aus dem Hauptseminarvortrag von Matthias Brückner. Mögliche Herangehensweisen n Umwandlung der textuellen Repräsentation der Dokumente (XTRACT) n Betrachtung der Dokumente als XML–Trees (DTD-Miner) Eingabe n Menge von XML-Dokumenten Ausgabe n DTD für die gegebene Dokumentkollektion n Ergebnis soll –allgemein gehalten sein (für weitere XML-Dokumente), aber –auch speziell genug für die betreffende XML-Kollektion - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

30 30 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken DTD-Miner n DTD Generation Module –Document Tree Extraction Sub-Module Umwandlung der XML Dokumente in eine Baumstruktur –Spanning Graph Construction Sub-Module Zusammensetzen der Dokumentbäume zu einem zusammenhängenden Graphen –DTD Construction Sub-Module Ableiten einer DTD aus dem zusammenhängenden Graphen Anwendung von Heuristiken - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

31 31 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken DTD-Miner (2) n XMLTrees –Elemente Knoten –Parent-Child Beziehungen gerichtete Kanten –Jeder Baum erhält eine Eindeutige DocID –Jedem Knoten wird eindeutige NodeID zugeordnet - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

32 32 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken DTD-Miner (3) - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

33 33 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken DTD-Miner (4) n Der zusammenhängende Graph –XMLTrees werden nacheinander zusammengelegt –Gleiche Childelemente auf gleichen Knoten abgebildet –Abspeichern der NodeIDs in den Knoten und in den entspringenden Kanten –beim mehrfachen Auftreten eines Childelementes wird eine zusätzliche Kante eingefügt - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

34 34 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken DTD-Miner (5) - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

35 35 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken DTD-Miner (6) n Heuristische Regeln 1.Define Optionality Bestimmung, ob Element opional ist, oder nicht 2.Merge Repeat Bestimmung sich wiederholender Alternativen 3.Define Group Bestimmung sich wiederholender Gruppen - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

36 36 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken DTD-Miner (7) optionales Element, wenn für alle Kanten, die zwischen zwei Knoten existieren gilt: die Vereinigung der Kantenlabels ist eine echte Teilmenge der Labels des Startknoten (der Zielknoten ist dann optional) mehrfach auftretendes Element, Mehrere Kanten zwischen zwei Knoten - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

37 37 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken DTD-Miner (8) Zur Bestimmung der optionalen Elemente: Zwischen Knoten a und d existiert eine Kante mit dem Kantenlabel 1. Die (Mengen-) Vereinigung aller Kantenlabels ist dann {1} und es gilt: {1} {1,7}, also ist d optional. Weiteres Beispiel: Zwischen b und c existieren 3 Kanten, die Vereinigung der Kantenlabels ist {2,8} {2} {2} = {2,8} Diese Menge ist keine echte Teilmenge der Knotenlables ({2,8} {2,8}), damit ist das Element c nicht optional. - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

38 38 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Beispiel zur Schemaableitung /1 - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

39 39 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Beispiel zur Schemaableitung /2 - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

40 40 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Beispiel zur Schemaableitung /3 mehrfaches Auftreten: mehrfache Kanten zwischen zwei Knoten optionales Auftreten: Kantenbeschriftung enthält nicht alle IDs des Knotens, von dem die Kante ausgeht - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

41 41 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Beispiel zur Schemaableitung /4 abgeleitete DTD

42 42 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Teilaufgaben XML-Dokumente beschreibung Schema- beschreibung Überprüfung Änderung Erweiterung Ableitung Schema- durch Tools durch den Benutzer - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

43 43 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Differenzen zwischen abgeleiteter DTD und Original-DTD Original-DTDAbgeleitete DTD zu spezieller Quantifizierer ) fehlende Elemente anderes Inhaltsmodell Ursache: zu wenige XML-Dokumente, enthalten nicht alle Spezialfälle der Anwendung - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

44 44 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Metriken - Motivation /1 Viele XML Anwendungen benötigen ein Schema, es gibt verschiedene Möglichkeiten, es zu bekommen: Benutzer kann dieses direkt definieren es kann mit Hilfe von Entwurfswerkzeugen abgeleitet werden, z.B. aus einem ERM ein existierendes Schema kann verwendet (und angepasst) werden es kann aus Beispiel-XML-Dokumenten abgeleitet werden - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

45 45 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Metriken - Motivation /2 Evaluation des Schema Dabei stellen sich Fragen wie: Ist das Schema einfach zu verstehen? Ist das Schema einfach zu verwenden? Ist das Schema einfach zu verändern? Metriken versuchen, diese Fragen zu beantworten und verschiedene Eigenschaften eines Schemas abzuschätzen - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

46 46 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Metriken - Motivation /3 Zwei Fragestellungen existieren: 1. Erfüllt ein Schema die Anforderungen einer Anwendung 2. Ist das Schema einfach zu verstehen/zu warten/.. Metriken beantworten (nur) die zweite Frage. Schema1 Schema2 Metriken XML Anwendung - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

47 47 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Softwaremetriken n Verwendung von Metriken zur Qualitätsbewertung Qualitätsmodell Metriken Merkmal Teilmerkmal ISO/IEC 9126 Funktionalität Zuverlässigkeit Benutzbarkeit Effizienz Änderbarkeit Übertragbarkeit Merkmale der ISO 9126

48 48 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Software Metriken Die gleiche Methode gibt es im Bereich Software Merkmale Untermerkmale Metriken Funktionalität Zuverlässigkeit Benutzbarkeit Effizienz Änderbarkeit Übertragbarkeit Analysierbarkeit Veränderbarkeit Stabilität Testbarkeit Verständlichkeit Erlernbarkeit Bedienbarkeit McCabe-Metrik Fan-Out-Metrik Halstedt Metrik

49 49 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Klassifikation von Software Metriken n Produktmetriken bewerten das Schema von XML-Dokumenten n Ressourcenmetriken bewerten die Ressourcen, die zur Verarbeitung von XML- Dokumenten erforderlich sind n Prozessmetriken bewerten den Entwurfsprozess eines Schemas - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

50 50 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Produktmetriken -1 n Visualisieren einer DTD durch einen Graphen n Ableitung von Produktmetriken aus dem Graphen public. section conf. ref. contenttitleauthors articlebook isbn - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

51 51 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Produktmetriken - 2 Folgende Produktmetriken werden im nächsten Teil vorgestellt: n Größe n Strukturkomplexität n Strukturtiefe n Fan-In n Fan-Out Sie bewerten die Eigenschaften Verwendbarkeit und Änderbarkeit. - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

52 52 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Größe Bewertet wird Anzahl der Knoten (Elemente, Attribute, Entities) Diese beeinflusst die Verständlichkeit und Verwendbarkeit public. section conf. ref. contenttitleauthors articlebook isbn - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

53 53 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Strukturkomplexität (Alle Merkmale, die ein Schema komplex machen) Quantifizierer + und * same content elements Rekursionen und IDREF-Attribute beeinflusst die Verständlichkeit und Verwendbarkeit public. section conf. ref. contenttitleauthors articlebook isbn - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

54 54 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Strukturtiefe Tiefe=0 Tiefe=1 Tiefe=2 Tiefe=3 Tiefe für jeden Knoten Maximale Tiefe des Graphen beeinflusst Effizienz, Verwendbarkeit (Pfadlänge zur Adressierung von Elementen/Attribute hängt davon ab) public. section conf. ref. contenttitleauthors articlebook isbn - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

55 55 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Fan-Out-Metrik Anzahl von Kindknoten Gibt an, welche Elementdeklarationen komplex sind beeinflusst die Verständlichkeit und Verwendbarkeit public. section conf. ref. contenttitleauthors articlebook isbn - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

56 56 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Fan-In-Metrik Anzahl der Vorgängerknoten Wie oft wird ein Element wiederverwendet Beeinflusst die Veränderbarkeit eines Schemas public. section conf. ref. contenttitleauthors articlebook isbn - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

57 57 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Produktmetriken für das Beispiel GrößeKomplexitätMax TiefeMax Fan- Out Max-Fan-In public.bookisbnarticletitleauthorconf.contentsectionref. Tiefe (Zyklus) Fan-Out Fan-In n Metriken des gesamten Schemas: n Metriken der einzelnen Elemente und Attribute - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

58 58 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Ressourcenmetriken Bewerten die Ressourcen, die erforderlich sind, um Schema auswerten zu können: n Speicherplatzbedarf n Zugriff durch XPath (Zeit) n Auswertung durch DOM-Prozessoren (Zeit, Speicherplatz) n Auswertung durch SAX-Prozessoren (Zeit) und damit die Eigenschaften Funktionalität und Effizienz - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

59 59 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Speicherplatzbedarf n Kurze Tagnamen (für Elemente und Attribute verringern den Speicherplatzbedarf) Dieses Merkmal ist aber gegenläufig zur Lesbarkeit, sorgfältiges Abwägen beider Eigenschaften n Darstellung von Attributen ist kompakter als von Elementen n Keine tiefen Schachtelungen - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

60 60 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Zugriff durch XPath n Flache Hierarchien bedeuten auch keine langen Pfade zum Zugriff auf Elemente und Attribute (Eigenschaft Tiefe der Produktmetriken) n Wichtig ist, dass alle Informationen, die ausgewertet werden sollen, mit Markup versehen sind (feingranular getagt) n Beispiel (oder besser Gegenbeispiel) Von Mai bis September 99 Euro, Im Winterhalbjahr ab 79 Euro. Das ist bei Preisberechnungen nicht auswertbar - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

61 61 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Abschätzung XPath/XQuery- Anfragen n bestimmte Eigenschaften der Produktmetriken lassen sich einsetzen, um den Aufwand von XPath/XQuery-Anfragen abzuschätzen n Beispiel: –Tiefe = maximale Pfadlänge = Anzahl der einzelnen Schritte = Anzahl der Joins bei generischer Speicherung –Größe: Anzahl der zu speichernden Tupel bei generischer Speicherung - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

62 62 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Auslesen mit DOM- und SAX- Prozessoren n Attribute leichter als Elemente auslesbar n Besonders bei SAX wichtig: –Eindeutige Tagnamen, damit das Auslesen möglichst unabhängig von den Umgebungsinformationen erfolgen kann - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

63 63 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Zusammenfassung n Hier gibt es noch sehr wenige Arbeiten n Universelle Metriken sind schwer zu bestimmen n Metriken sind besonders im Zusammenhang mit einer Anwendung (Speicherung von XML, Anfragerealisierung, Transformation,...) sinnvoll. Not everything that counts can be counted, and not everything that can be counted counts. Albert Einstein - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

64 64 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Tools Editoren (Transformation von Schemasprachen, Ableiten von Schema aus Dokumenten, Test der Gültigkeit bzgl. eines Schemas) XMLSpy ( ) XML Authority (www.extensibility.com/xml_resources/modeling.htm)www.extensibility.com/xml_resources/modeling.htm XML-Prozessoren XML Schema Quality Checker von IBM alphaworks (www.alphaworks.ibm.com/tech/xmlsqc)www.alphaworks.ibm.com/tech/xmlsqc XML Schema Validator von Oracle (technet.oracle.com/tech/xml/).oracle.com/tech/xml/ - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

65 65 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Literatur /1 XML Schema: –www.w3.orgwww.w3.org –Web & Datenbanken – Erhard Rahm, Gottfried Vossen, Kapitel 2 oder –Harald Schöning XML und Datenbanken –Eric van der Vilst: XML Schema konzeptueller Entwurf –mit ER: Sebastian Dolke, Hauptseminar 2002 –mit UML Alf-Christian Schering, Hauptseminar 2002 –Kazakos et al: "Datenbanken und XML" –... XML-Editoren –Vergleich verschiedener Editoren: Mintert, Wilde, Behme: iX (8) Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur

66 66 Meike Klettke Universität Rostock Vorlesung XML und Datenbanken 4) Generieren von XML-Dokumenten aus Datenbanken Literatur /2 Schemaableitung n XTRACT: A System for Extracting Document Type Descriptors from XML Documents – Minos Garofalakis, Aristides Gionis, Rajeev Rastogi, S. Seshadri, Kyuseok Shim n DTD-Miner : A Tool for Mining DTD from XML Documents Chuang-Hue Moh, Ee-Peng Lim, Wee-Keong Ng n Diplomarbeit: Christian Romberg n Matthias Brückner, Hauptseminar 2002 Metriken n Sahuguet/Choi n Diplomarbeit: Lars Schneider - Vorteile der Modellierung - ERM - UML - Editoren - EMX - Reverse- Engineering - Metriken - Literatur


Herunterladen ppt "1 XML und Datenbanken Kapitel 7: Modellierung, Teil 2 Meike Klettke Universität Rostock Fakultät für Informatik und Elektrotechnik"

Ähnliche Präsentationen


Google-Anzeigen