Catalog Integration Made Easy P.J. Marrón, G. Lausen und M. Weber Universität Freiburg.

Slides:

Advertisements

Ähnliche Präsentationen

MOBILE SICHERHEIT: THE GOOD, THE BAD & THE UGLY QUELLE: TOSHIBA EUROPE GMBH.

Advertisements

Eine Grundlage zum Unternehmenserfolg? Master-Thesis

Partitionierungstechniken in Datenbanksystemen

Anzahl der ausgefüllten und eingesandten Fragebögen: 211

Christian Schindelhauer

Johannes-Kepler-Gymnasium

Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil3.

LS 2 / Informatik Datenstrukturen, Algorithmen und Programmierung 2 (DAP2)

Grundzüge der Mikroökonomie (Mikro I) Kapitel 3

Beat- und Metrumsextraktion mit gaußifizierten Einsatzzeiten Klaus Frieler Universität Hamburg Musikwissenschaftliches Institut Seminar , SoSe 08.

eine Plattform für annotierte Korpora in XML

T-XPath Ein zeitliches Modell für XML-DBS M. Kalb, G. SpechtK. Schneider Universität Ulm EML Heidelberg.

8 Behandlung von Begriffen 8.1 Grundlagen aus Logik und Psychologie

Einige entscheidbare bzw. rekursiv aufzählbare Sprachen

Übungsblatt 05 Lehrstuhl für Kommunal- und Umweltökonomie

Übungsblatt 06 Lehrstuhl für Kommunal- und Umweltökonomie

Projektzeiterfassung exos ® 9300 Die Projektzeiterfassung mit exos9300 bietet für ihr Unternehmen ein modernes, leistungsfähiges und flexibles Controllingsystem,

Exos ® 9300 Web Client Mit dem Web Client verwalten Vorgesetzte und Mitarbeiter ihre Personen-, Auftrags- und Projektzeitdaten selbständig. Der sichere.

Mobile Datenerfassung exos® 9300

exos® 9300 Besucherverwaltung

„Wissenschaftliches Arbeiten“ Was soll denn das sein?

IMS Universität Stuttgart 1 Einführung in XML Hannah Kermes HS: Elektronische Wörterbücher Do,

Sortieren mit Binären Bäumen

FH-Hof Effizienz - Grundlagen Richard Göbel. FH-Hof Inhalt Einführung Aufwand für Anfragen ohne Indexierung Indexstrukturen für Anfragen an eine Tabelle.

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/7 Datenbanken werden als Anhäufung von Werten eines Wertebereiches aufgefasst und Datenbankabfragen.

Rechneraufbau & Rechnerstrukturen, Folie 2.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 2.

Bau effizienter und effektiver Metasuchmaschinen

Sebastian Grahn Sebastian Kühn

Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil2.

Katharina Bellon Technische Universität Kaiserslautern Fachbereich Informatik Lehrgebiet Datenverwaltungssysteme Verarbeitung von XML-Strömen.

(Ron Rivest, Adi Shamit, Leonard Adleman , 1977)

Datenmanagement in Sensornetzen PRESTO - Feedback gesteuertes Datenmanagement - SS 2007 Sören Wenzlaff.

Software Design Patterns Extreme Programming (XP).

Open Source Prozessor Leon2 Peer Royla und Marco Siebert RST-Labor WS 04/05 Prof. Dr.-Ing. Thomas Risse.

Die Simulation von Planetenbewegungen

Was versteht man unter XML Schema?

1 Zwischenstandsbericht III Olaf Watteroth Computer Systems and Telematics Institute of Computer Science Freie Universität Berlin

X Filter …als Beispiel effizienter Filterung von XML-Dokumenten in SDI-Systemen.

Datenverteilung in Ad-hoc Netzen 1/24 Adaptive Datenverteilung in mobilen Ad-hoc Netzen unter Verwendung des Area Graph basierten Bewegungsmodells S. Bittner,

Entwurf und Realisierung einer digitalen Bibliothek zur Verwaltung von Notenhandschriften Dipl.-Ing. Temenushka Ignatova Datenbank- und Informationssysteme,

10-15 % des Einkaufsvolumens führen zu % der Prozesskosten %

Einführung in die Programmiersprache C 3.Tag Institut für Mathematische Optimierung - Technische Universität Braunschweig.

Übungsblatt 05 Lehrstuhl für Kommunal- und Umweltökonomie

Wir üben die Malsätzchen

Datenbanktechnologie Daniel Ebner SS Mai Ulrike Lohner.

Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/

Information und Kommunikation Hartmut Klauck Universität Frankfurt SS

Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/

Polynome und schnelle Fourier-Transformation

Vorstellung des Projektergebnisses. Agenda I. Bla II. Änderungen beim Design III. Zeitliche Aufwände IV. Komplexität V. Produktpräsentation VI. Mögliche.

Formale Sprachen Grammatiken und die Chomsky-Hierarchie

Resultate Umfrage Partizipation Arbeitsgruppe DeLL Befragt wurden im Dezember 2010 alle 3., 4. und 5. Klassen Es wurde differenziert nach Ebenen: Schule,

Auswertung der Befragung des Lehrerkollegiums zur Cafeteria

Internet Identity Bug oder Feature des Web 2.0? Ralf Bendrath Universität Bremen Sonderforschungsbereich Staatlichkeit im Wandel.

XML - Grundlagen, Verarbeitung und Anwendungen Seminar im SS 2010 Martin Heine Jutta Mülle Guido Sautter Universität Karlsruhe (TH) Institute für Programmstrukturen.

ein Frontend für den computergestützten Fremdsprachenerwerb: Texte und Bilder aus dem Web für das Selbststudium Oliver Streiter, Chiara Vettori,

Institute of Scientific Computing – University of ViennaP.Brezany Integration von föderierten Datenbanken Peter Brezany Institut für Scientific Computing.

1 Albert-Ludwigs-Universität Freiburg Rechnernetze und Telematik Prof. Dr. Christian Schindelhauer Informatik III Christian Schindelhauer Wintersemester.

Arne Vater Wintersemester 2006/ Vorlesung

Integritätserhaltung und -Überprüfung in deduktiven Datenbanken

SFZ FN Sj. 13/14 Python 3 Rekursion Inf K1/2 Sj 13/14

Eike Schallehn, Martin Endig

Eike Schallehn, Martin Endig

© 2001 Sven Dammann1 Aufbau Integrierter Informationssysteme XML Bearbeitung und relationale Abbildung Sven Dammann Martin-Luther-Universität Halle-Wittenberg.

Ausbildungsrede Spreeredner Berlin 25. Februar 2010 Wie man einen Bewertungswettbewerb gewinnen kann.

Mönchengladbach Tchibo Filial-Manager Erste Ideen.

Dr. Wolfram Amme, Semantik funktionaler Programme, Informatik II, FSU Jena, SS Semantik funktionaler Programme.

Gliederung 0. Motivation und Einordnung 1. Endliche Automaten

Präsentation transkript:

Catalog Integration Made Easy P.J. Marrón, G. Lausen und M. Weber Universität Freiburg

Integration elektronischer Kataloge eCatalogs sind die Grundlage des eBusiness. Gewünscht sind integrierte Kataloge. … diese funktionieren aber derzeit noch nicht zufriedenstellend: Physische Integration hat Nachteile, Logische Integration ebenso. Schön wäre eine Integration (fast) ohne Aufwand. das genau kann eine adaptive Auswertung leisten.

lokaler Katalog globaler Katalog products jammer name price company department price mobile product jammer personel name computing … company Anfrage: /department/mobile//jammer/price ?

Übersicht I. Adaptive Auswertung von XPath i. XPath ii. XPath Subanfrage-Transformationen iii. Bewertung von Transformationen II. Integration elektronischer Katalog i. Architektur ii. Experimente III. Zusammenfassung

Für das Resultat res(Q) der Query Q gilt: res(Q) = L n (C n ) = C n+1. Der Ausgabe-Kontext einer Subquery ist induktiv definiert zu: C 1 = root, C i+1 = L i (C i ), 1 <= i <= n. Ein Location-Step hat die Form: axis::nodetest[predicate-expression] Jeder Location-Step L i definiert eine XPath-Subquery q i der Form: q i = (C i, L i, C i+1 ), wobei C i der Input-Kontext und C i+1 der Ausgabe-Kontext. (i) XPath Eine XPath-Query Q ist ein Location-Path der Form: L 1 /L 2 /.../L n, wobei jedes L i eine Funktion geschrieben als Location-Step.

A B C A C A C A D B C B angenommene Dokumentenstruktur: (ii) XPath Subanfrage-Transformation tatsächliche Struktur: "eliminate""generalize" "eliminate" "generalize and eliminate" /A/C/A//B/C /A/C /A//B Anfrage: /A/B/C Transformation

No transformation (n): verarbeite Subanfrage unverändert, Subquery generalization (g): ändern der Achse: child descendent parent ancestor Subquery elimination (e): übergehe die Subanfrage. (ii) Subanfrage Transformation:

(iii) Bewertung von Transformationen Sei q i = (C i, L i, C i+1 ). Anwendung der 3 Transformationsregeln "keine Transformation", "Generalisierung", und "Eliminierung" ergibt 3 Versionen von q i mit den entsprechenden Ausgabe-Kontexten NC i+1, GC i+1, EC i+1. Somit: C i+1 = NC i+1 U GC i+1 U EC i+1. Bewertung der Antworten in C i+1 mittels einer Fitness-Funktion in Abhängigkeit der angewandten Transformationsregel und der bereits berechneten Bewertung des Eingabe-Kontextes C i.

Verwendete Fitness-Funktion Jeder Knoten n erhält einen Fitnesswert v n. Sei C i der aktuelle Eingabe-Kontext. Sei n є C i und C i+1 = NC i+1 U GC i+1 U EC i+1. Sei m є C i+1. v m ist das Maximum von: wenn m є NC i+1, dann v m = b 2 + v n. wenn m є GC i+1, dann v m = b + v n. wenn m є EC i+1, dann v m = 1 + v n. Und b = 10.

Rechtfertigung der Fitness-Funktion Wir müssen Worte aus {n, g, e}* bewerten. Intuitiv sollte n >> g, n >> e sein. Jedoch warum g >> e? Formal können wir auf den Worten eine gewünschte Ordnung definieren und die Fitness Funktion entsprechend definieren (sofern unsere Ordnung konsistent mit n >> g, n >> e ist).

Beispiel einer Ordnung: eee < perm{g,e,e} < perm{e,g,g} < ggg < perm{e,e,n} < perm{e,n,g} < perm{g,g,n} < perm{e,n,n} < perm{n,n,g} < nnn Seien e, g, n die entsprechenden Fitnessbewertungen. Dann können sie berechnet werden wie folgt: 3e g 2e+g e … n-3g+2e > 0 2n+g<3n Allgemein: n > g, g > e, n – q l g + (q l - 1) e > 0, wobei q l Länge der Anfrage. n=5, g=2, e=1

II. Integration elektronischer Kataloge global catalog Schema G local catalog L2 local catalog L1 local catalog L3 Q(G) R(L3) R(L1,L2,L3) R(L1) R(L2)

NodesDepthOutdeg Global Alternate Reichelt8959 K & M Artificial2736 Alt.Rei.K&MArt. Global Level Query Node Alt.Rei.K&MArt. Alt Rei K&M Art Anfragen an den globalen KatalogAnfragen an einen lokalen Katalog Fehlerraten (in %) bei Kataloge:

III. Zusammenfassung XPath ist die derzeit am intensivsten studierte Anfragesprache für XML. Eine adaptive Auswertung von XPath ist praktisch gut motivierbar. Qualität der adaptiver Auswertung empirisch belegt. Verschiedene Möglichkeiten zur Verbesserungen des Verfahrens definiert und implementiert. Adaptive Auswertungstechnik verspricht eine effiziente und skalierbare Integration elektronischer Kataloge.