Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Interoperable Informationssysteme - 1 Klemens Böhm Interoperable Informationssysteme.

Ähnliche Präsentationen


Präsentation zum Thema: "Interoperable Informationssysteme - 1 Klemens Böhm Interoperable Informationssysteme."—  Präsentation transkript:

1 Interoperable Informationssysteme - 1 Klemens Böhm Interoperable Informationssysteme

2 Interoperable Informationssysteme - 2 Klemens Böhm Aufbau der heutigen Sitzung l Motivation für die Vorlesung als Ganzes in eher abstrakter Form, roter Faden, u Interoperabilität, u Heterogenität, u semistrukturierte Datenmodelle, u XML. l Auflistung der Inhalte der Vorlesung, l Beginn des ersten Teils.

3 Interoperable Informationssysteme - 3 Klemens Böhm Einleitung l Was ist Interoperabilität? l Was sind semistrukturierte Datenmodelle? l Zusammenhang Interoperabilität – semistrukturierte Datenmodelle? Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung

4 Interoperable Informationssysteme - 4 Klemens Böhm Problem l Grosse Datenmengen sind verfügbar. l Daten werden unterschiedlich modelliert. l Systeme zur Datenverwaltung haben unterschiedliche Fähigkeiten. l Informationssysteme existieren nebeneinander u innerhalb einer Organisation/Firma, u teilweise innerhalb, teilweise ausserhalb der Organisation (z.B. Vergleich Kundenliste - Top500-Liste), u sämtlich ausserhalb des Unternehmens Information Brokering, Virtual Enterprises, z.B. Dienst, der verschiedene Auctioning-Angebote zusammenfasst. Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung

5 Interoperable Informationssysteme - 5 Klemens Böhm Problem l Man will integrierten Zugriff. l Jene Unterschiede/Charakteristika der Sourcen sollten transparent sein; Benutzer soll sich nicht darum kümmern müssen u wie Daten modelliert sind, u welches System verwendet wird, u wo Daten gespeichert sind. l Integrierter Zugriff - Anfragen über mehrere Sourcen, Überbrückung der Heterogenität. Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung

6 Interoperable Informationssysteme - 6 Klemens Böhm Interoperable Datenbanken l Definition gemäss Computing Dictionary: A database front-end which communicates with multiple heterogeneous databases and makes them appear as a single homogeneous entity with semantic calls. l Hier jedoch keine Beschränkung auf Datenbanken bzw. relationales Datenmodell, sondern Betrachtung von beliebigen Sourcen, z.B. auch Dokument- Server, File-Systeme, Web-Server. Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung

7 Interoperable Informationssysteme - 7 Klemens Böhm Integrierter Zugriff l Benutzeroberfläche, die das Absetzen von Anfragen erlaubt, die für alle Komponenten bestimmt ist, l Transformation der Daten in einheitliches Datenmodell, Entwicklung von Anwendungen gegen diese Modellierung. Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung

8 Interoperable Informationssysteme - 8 Klemens Böhm Interoperabilität und XML l Notwendigkeit, möglichst allgemeines Datenmodell zu verwenden. l XML hat sich als universelles Daten-Austauschformat etabliert, l Verwendung von XML als Modell für den integrierten Zugriff. Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung

9 Interoperable Informationssysteme - 9 Klemens Böhm Heterogenität l Warum sprechen wir über Heterogenität? Heterogenität ist der Grund dafür, dass unser Problem schwierig ist; wären Systeme nicht heterogen, hätte man das Problem nicht. l Heterogenität – Motivation für semistrukturierte Datenmodelle, herkömmliche Datenmodelle sind z.T. lästiges Korsett. Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung

10 Interoperable Informationssysteme - 10 Klemens Böhm Heterogenität l Anwendungsunabhängige Unterschiede: u Datenmodell (z.B. relational vs. objektorientiert), u Anfragesprache. l Unterschiede bei der Modellierung (im gleichen Modell): u Weglassen von Information, u explizite Strukturierung, z.B. Name vs. Vorname - Nachname, u unterschiedliche Bedeutung der Attribute (trotz gleicher Bezeichnung, z.B. Preis - netto oder brutto?) l Unterschiede auf Instanzenebene, z.B. Beträge in CHF - Beträge in Lira. Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung

11 Interoperable Informationssysteme - 11 Klemens Böhm Heterogenität - Beispiel KlemensBrunoBöhmBad Homburg, Zürich65000 CHF WigbertF.BöhmStuttgart35000 DMProf. Stein Jörg HansJörgSchekZürich> CHF MohanAlmaden TorstenGrabsZürich< CHF l Unterschiedliche Zahl von Wohnorten l Unterschiedliche Darstellung des Zweitnamens l Unterschiedliche Währung beim Jahreseinkommen (Konvertierung = Informationsverlust) l Uneinheitliche Darstellung zusammengesetzter Vornamen l Jahreseinkommen nicht immer als exakter Wert l Fehlende/nicht bekannte Werte Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung

12 Interoperable Informationssysteme - 12 Klemens Böhm Datenmodell, Schema, Typ (1) l Diese Folie – Begriffe für Erklärung semistrukturierter Datenmodelle. l Definition Datenmodell laut Ullman: Formalismus und Notation zur Beschreibung von Datenstrukturen und eine Menge von Operationen, die zum Manipulieren und Validieren der Daten verwendet werden. Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung

13 Interoperable Informationssysteme - 13 Klemens Böhm Datenmodell, Schema, Typ (2) l Typ - Menge von Werten, mit denen eine Variable oder eine Konstante belegt sein darf; l Schema laut Ullman: Spezifikation der Typen von Entities in Datenbank und der Beziehungen zwischen Instanzen dieser Typen; Art, wie Entities und Beziehungen auf einer Abstraktionsebene auf der nächstniedrigeren ausgedrückt werden. Beispiel: Array u Konzeptionelles Schema: integer array A[1..n; 1..m] u Physisches Schema: A[i, j] ist an Position a 0 + 4(m(i-1)+j-1) Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung

14 Interoperable Informationssysteme - 14 Klemens Böhm Semistrukturierte Daten l Verallgemeinerung bekannter Datenmodelle, l Motivation: u kein explizites Schema vorhanden, (implizites) Schema kann sich (im Laufe der Zeit) ändern, u keine starke Typisierung, d.h. Attribut kann (für unterschiedliche Objekte) unterschiedlichen Typ haben, u Reihenfolge, z.B. Reihenfolge der Kapitel eines Dokuments. Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung

15 Interoperable Informationssysteme - 15 Klemens Böhm Semistrukturierte Daten - Fortsetzung l Semistrukturierte Daten sind allgegenwärtig: u Dokumente z.B. Gesetzestexte, Wörterbucheinträge, HTML-Dokumente, u Daten u universelles Austauschformat, z.B. für E-Commerce. l Welche Rolle spielt XML? u Zahlreiche Tools, u zahlreiche DTDs, u Standard des W3C, u Grundlage zahlreicher weiterer Standards. Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung

16 Interoperable Informationssysteme - 16 Klemens Böhm Semistrukturierte Daten (3) l Zusammenhang Querying- und Transformationsmechanismen und Interoperabilität, l Indexierung semistrukturierter Daten: u Beschleunigung des deklarativen Zugriffs, viele Anfragen ohne Indexstrukturen praktisch nicht evaluierbar, u Index ist verkürzte Beschreibung des Datenbank-Inhalts (aus einer bestimmten Sicht). Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung

17 Interoperable Informationssysteme - 17 Klemens Böhm Markup l Zusätzliche Information, die in Dokumenttext eingefügt wird. l Jedes Textverarbeitungssystem generiert Markup, z.B. \par (in RTF) identifiziert Anfang eines neuen Absatzes, \sb240 spezifiziert 12-pt Space. l Benutzer gibt Markup nur in seltenen Fällen selbst ein, z.B. mit LaTeX. l Generalized Markup: u spezifiziert nicht das Aussehen des Dokuments, identifiziert Strukturbestandteile des Dokuments, \sb240 ist kein Generalized Markup. Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung

18 Interoperable Informationssysteme - 18 Klemens Böhm Markup - HTML als Beispiel The Autobiography of Benjamin Franklin Benjamin Franklin 8.99 … Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung

19 Interoperable Informationssysteme - 19 Klemens Böhm The Autobiography of Benjamin Franklin Benjamin Franklin 8.99 … Logischer Markup mit XML Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung

20 Interoperable Informationssysteme - 20 Klemens Böhm Warum will man mit Generalized Markup arbeiten? (1) l Trennung zwischen logischer und Layout-Struktur führt zu höherer Flexibilität, insbesondere u kann man unterschiedliche Darstellungen für unterschiedliche Benutzer und unterschiedliche Anforderungen erzeugen, Beispiel: Lektor soll alle Eigennamen im Wörterbuch ueberpruefen. u hat man bessere Strukturierungsmöglichkeiten (Strukturierung muss nicht immer explizit dargestellt werden, feinere Typisierung). Beispiel: Differenzierung Vorname – Nachname. Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung

21 Interoperable Informationssysteme - 21 Klemens Böhm Warum will man mit Generalized Markup arbeiten? (2) l Dokument mit logischem Markup enthält i.a. mehr Information, leichteres kooperatives Arbeiten bzw. bessere Dokumentation eigener Arbeitsschritte. l Konsistenz der Dokumente: u 'intra-document consistency', u 'inter-document consistency'. Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung

22 Interoperable Informationssysteme - 22 Klemens Böhm Was leistet XML? (1) l Ziel von XML – nicht Standardisierung des Generalized Markups. l Man will unterschiedliche Dokumenttypen haben, mit jeweils unterschiedlichem Markup. l Beispiele: u Inventarliste Buchhandlung, u Kochrezept. Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung

23 Interoperable Informationssysteme - 23 Klemens Böhm Was leistet XML? (2) l Ziel von XML: u der Darstellung von Generalized Markup im Dokument (Syntaxebene), u Festlegung, welcher Markup wo im Dokument zulässig, z.B. Kochrezept muss Zutaten enthalten, Zutaten müssen vor der Zubereitung kommen. Nicht obligatorisch, solche Festlegungen zu treffen. Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung

24 Interoperable Informationssysteme - 24 Klemens Böhm Dokumenttypdefinition Dokumenttypdefinition (DTD) l ist im wesentlichen Menge von Regeln/ Grammatik, l DTD gibt vor, was für Markup (an welcher Stelle genau im Dokument des Typs) vorkommen darf. Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung

25 Interoperable Informationssysteme - 25 Klemens Böhm Beispiel: Bookstore DTD Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung

26 Interoperable Informationssysteme - 26 Klemens Böhm Logische Dokumentstruktur... The Autobio- graphy of... bookstore book title book author price title author price first- name last- name name Benjamin Franklin 8.99 Plato 9.99 The Gorgias Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung

27 Interoperable Informationssysteme - 27 Klemens Böhm Inhalt der Vorlesung (1) l Datenmodell 1: OEM l Queries 1: Deklarativer Zugriff auf semistrukturierte Daten Anforderungen, Flexibilität, zwei Sprachen l Datenmodell 2: XML Abgrenzung zum relationalen Modell, Zusammenhang XML – Dokumente, Praxis-Features: Kodierung von Chars, Entities, vordefinierte Typen l Datenmodell 3: XML und verwandte Standards DOM, SAX, XPointer, XLink Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung

28 Interoperable Informationssysteme - 28 Klemens Böhm Inhalt der Vorlesung (2) l Schema und Typen Motivation, DataGuides, Datalog, Simulationen l Systeme 1: Indexstrukturen für semistrukturierte Daten unterschiedliche Indices unterstützen unterschiedliche Anfragen, DataGuides, PAT-Trees, STORED, XML-Features von SQL Server, Evaluierung von XML-Queries l Datenmodell 4: Metadaten MPAA, Dublin Core, RDF l Queries 2: Transformationsmechanismen für semistrukturierte Daten XSLT, YAT Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung

29 Interoperable Informationssysteme - 29 Klemens Böhm Inhalt der Vorlesung (3) l Systeme 2: Query Processing in verteilten, heterogenen Umgebungen Query-Evaluierung, Queryoptimierung l Systeme 3: Infrastrukturen für die Integration heterogener Informationssysteme Harmony – was bekommt man, was muss man selbst leisten? A0-Algorithmus l Systeme 4: Erweiterbare Query-Optimierung Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung

30 Interoperable Informationssysteme - 30 Klemens Böhm Abgrenzung gegenüber anderen Lehrveranstaltungen l Zusammenhang zu Data Warehousing: u Data Warehouse - Materialisierung integrierter Sicht bzw. Teilen davon, insbes. Aggregate, bzw. historischer Entwicklung der Daten, u multidimensionales Datenmodell (Datenmodell wurde nicht entworfen, um mit Heterogenität gut umzugehen.) u Konsistenzerhaltung, effiziente Berechnung der materialisierten Sicht, physischer Entwurf, u neue Operatoren auf höherem Abstraktionsniveau. l Zusammenhang zu Objekten höherer Ordnung - Mechanismen zum Kommunikationsaufbau zwischen Informationsobjekten. Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung

31 Interoperable Informationssysteme - 31 Klemens Böhm Abgrenzung gegenüber anderen Lehrveranstaltungen l Materialisierungen, physischer Entwurf - hier kein Thema, alle Sichten sind virtuell. l Anderes Datenmodell. l Hier vorgestellte Konzepte sind orthogonal zu den Mechanismen zur Verwaltung von Objekten höherer Ordnung. Inter- operabilität Hetero- genität Semistrukt. Daten- modelle XML Inhalt der Vorlesung


Herunterladen ppt "Interoperable Informationssysteme - 1 Klemens Böhm Interoperable Informationssysteme."

Ähnliche Präsentationen


Google-Anzeigen