Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
Veröffentlicht von:Ebert Kesler Geändert vor über 10 Jahren
1
Konzeptbasierte Anfrageverarbeitung in Mediatorsystemen
BTW 2003, Leipzig, Konzeptbasierte Anfrageverarbeitung in Mediatorsystemen Kai-Uwe Sattler Ingolf Geist Rainer Habrecht Eike Schallehn Institut für Technische und Betriebliche Informationssysteme Universität Magdeburg wwwiti.cs.uni-magdeburg.de/iti_db/
2
Überblick Motivation Konzeptbasiertes Integrationsmodell Anfragemodell
Yacob-Mediator Anfrageverarbeitung Zusammenfassung & Ausblick Kai-Uwe Sattler
3
Problemstellung Integration heterogener Datenquellen Charakteristika
Beispiel: kulturhistorische Datenbanken ( …) Charakteristika Potentiell große Anzahl von Quellen … mit häufigen Änderungen (Quellen, Inhalte, …) … und disjunkten oder überlappenden Domänen Einsatz von Mediatorsystemen Formulierung von Anfragen über globalem Mediatorschema Anfragezerlegung und Ergebniskomposition Kai-Uwe Sattler
4
Motivation In Szenarien mit schwach gekoppelten Domänen Hintergrundwissen zur Anfrageformulierung Strukturelle Korrespondenzen nicht im Mittelpunkt sondern semantische Korrespondenzen („a little less structure a little more semantics“) Globales Domänen-modell etching xylography graphics drawing painting table chair fine arts furniture cultural asset motif still life landscape coat of arms mountains river/sea flowers fruits artist name portrays Quellsysteme mit lokalen Modellen ... ... Kai-Uwe Sattler
5
Konzeptbasiertes Integrationsmodell
Repräsentation des Hintergrundwissens: Vokabular, Konzepthierarchie, Ontologie, … Ontologie als globales Schema Local as View Ontologie für gegebenen Anwendungsbereich Konzepte, Eigenschaften, Beziehungen Konzepte als begriffliche „Anker” Korrespondenzen zwischen globalen Konzepten und lokaler Repräsentation: „Objekt x in Quelle y ist Instanz von Konzept c” Kai-Uwe Sattler
6
Integrationsmodell /2 Konzeptebene Datenebene Basis: RDF Schema (RDFS)
Klassen, Properties, Constraints Erweiterungen Konzept als RDFS-Klasse: Begriff, zu dem abfragbare Instanzen (Extension) in Quellsystemen vorliegen (Bsp.: „Gemälde“) Kategorie als RDFS-Klasse: Begriff für Attributausprägung in Quellsystemen (Bsp.: Motiv „Stillleben“) Datenebene Objekte als XML-Elemente Austausch Quelle ↔ Mediator Anfragen, Ergebnisrepräsentation Kai-Uwe Sattler
7
Konzeptschema cultural asset artist name motif portrays furniture
fine arts coat of arms landscape still life mountains river/sea chair table flowers fruits graphics drawing painting etching xylography concept property category subClassOf Kai-Uwe Sattler
8
Anfragemodell Operationen auf Konzeptebene Operationen auf Datenebene
Auswahl von Konzepten / Kategorien Mengenoperationen Traversierung von Beziehungen Schemaanfragen: Attribute eines Konzeptes Operationen auf Datenebene Selektionen, Verbunde, Vereinigung, … Übergang von Konzept- zur Datenebene Ermittlung der Instanzen eines Konzepts Kai-Uwe Sattler
9
CQuery XQuery-basierte Anfragesprache Erweiterungen
FLWR-Ausdrücke, XML-Konstruktion Konzeptschema und Quelldaten als virtuelles XML-Dokument Erweiterungen Konzeptschema als Pseudoelement concept (Bsp.: FOR $c IN concept …) Traversierung von Beziehungen als Dokumentpfade (Bsp: subClassOf) Inverse Traversierung (Bsp.: !subClassOf) Transitive Hülle bzgl. einer Beziehung (Bsp.: !subClassOf+) Funktion extension() liefert Instanz eines Konzepts Kai-Uwe Sattler
10
CQuery: Anfrageformulierung
Auswahl von Konzepten FOR $c IN concept[name=´painting´]/* Ermittlung der Extension(en) LET $e := extension($c) Filterung der Daten WHERE $e/artist ~= ´Gogh´ Verknüpfung bzw. Projektion RETURN <painting><title>$e/name</title> <artist>$e/artist</artist></painting> Kai-Uwe Sattler
11
CQuery: Beispiele Kulturgüter außer Möbel mit Blumen FOR $c IN concept[name=´cultural asset´]/* EXCEPT concept[name=´furniture´]/* LET $e := extension($c), $p := $c/properties WHERE $e/$p ~= ´flowers´ RETURN <item> $e </item> Gemälde mit Stillleben FOR $c IN concept[name=´painting´] LET $e := extension($c), $m := $c/portrays[name=´still life´] WHERE $e/portrays = $m RETURN <item> $e </item> Kai-Uwe Sattler
12
Yacob-Mediator Mediatorsystem
Implementierung von CQuery Datenmodell: XML Transformation über XSLT Integrationsmodell: RDF Schema + Erweiterungen Konzeptschema Abbildungsinformationen für Quellen Quellsysteme/Wrapper XML als Austauschformat mit beliebiger DTD XPath-Subset als Anfragesprache Implementierung als Web Services Kai-Uwe Sattler
13
Konzeptmodell-Komponente
Yacob: Architektur Query Interface Ausführungs- komponente Planungskomponente Transformations- komponente Parser RDF-DB Rewriter Jena API XSLT Processor RDQL Query Execution Konzeptmodell-Komponente Xindice Data Access Cache-DB Web Service Client Zugriffskomponente SOAP/HTTP Web Service Web Service Web Service Kai-Uwe Sattler
14
Anfrageverarbeitung FOR $c IN concept[name=´painting´]/* LET $e := extension($c) WHERE $e/artist ~= ´Gogh´ RETURN <item> $e </item> ConceptSel Concepts TransClosure XPath ExtensionalUnion GetExtension InstanceSel Quelle #1 Kai-Uwe Sattler
15
Mapping von Konzepten Konzept-Mapping: Property-Mapping:
Lokales XML-Element als „Instanz“ eines globalen Konzeptes Property-Mapping: Pfad zum lokalen Element als Repräsentation eines globalen Properties Kategorie-Mapping: Lokale Literale für globale Kategorien ermöglichen Ableitung der XSLT-Transformation Kai-Uwe Sattler
16
Mapping von Konzepten /2
cultural asset artist name motif portrays /einzelobjekt type=´Painting´ /einzelobjekt/bezeich Stilleben fine arts still life painting XSLT- Stylesheet Kai-Uwe Sattler
17
Anfrageverarbeitung /2
Query-Rewriting Algebraische Optimierung Reduzierung der Konzeptmengen Mehrere Konzepte aus einer Quelle disjunktive Verknüpfung Behandlung von Konzepthierarchien aus einer Quelle Anfrageübersetzung auf Basis der Konzept-Mappings Semantisches Caching Unterstützung interaktiver Formulierung von Anfragen Zwischenspeichern von Anfrageergebnissen in lokaler XML-DB und Assoziation mit Konzepten Indizierung und Auswahl der Cache-Einträge über XPath-Ausdrücke Kai-Uwe Sattler
18
Benutzerschnittstelle
Kai-Uwe Sattler
19
Zusammenfassung & Ausblick
Repräsentation von Domänenwissen in Mediatoren zur Integration neuer Quellen Anfrageformulierung Nutzung von Semantic Web-Technologien RDF Schema als Ontologiesprache Anfragesystem für CQuery Verbindung von Konzept- und Instanzanfragen Ausblick Einsatz mächtigerer Ontologiemodelle (OWL, DAML+OIL?) Iterative Anfrageverfeinerung Semantisches Caching Kai-Uwe Sattler
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.