Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Semantic Gossiping Christian Gebhardt Berlin, 13.07.07.

Ähnliche Präsentationen


Präsentation zum Thema: "Semantic Gossiping Christian Gebhardt Berlin, 13.07.07."—  Präsentation transkript:

1 Semantic Gossiping Christian Gebhardt Berlin,

2 Übersicht Einführung Qualitätsmaße Gossiping Algorithmus Beispiel Diskussion

3 Übersicht Einführung Qualitätsmaße Gossiping Algorithmus Beispiel Diskussion

4 Einführung4 Overlay Netzwerke

5 Einführung5 Peer Data Management System allgemein sind PDMS Netzwerk von Informationssystemen Bestandteile –Mappings –Peers P1P1 P2P2 P4P4 P3P3 Mappings

6 Einführung6 Peer Data Management System Peers P1P1 P3P3 P2P2 S2S2 S1S1 S3S3 Peer Schema Lokale Datenquelle Lokales Mapping Aufgaben der Peers Anfragen stellen Anfragen planen Anfragen weiterleiten Anfrageergebnisse empfangen, transformieren und zurückreichen Peer Mapping

7 Einführung7 Peer Data Management System Mappings VORGESETZTER persID anrede CHEF MITARBEITER telNr persFID name chefID anrede raumNr mitarbeiter SELECT persID as chefID anrede as anrede null as raumNr null as mitarbeiter FROM VORGESETZTER UNIONSELECT null as chefID null as anrede null as raumNr name as mitarbeiter FROM MITARBEITER

8 Einführung8 Peer Data Management System Mappings VORGESETZTER persID anrede CHEF MITARBEITER telNr persFID name chefID anrede raumNr mitarbeiter SELECT persID as chefID anrede as anrede null as raumNr name as mitarbeiter FROM VORGESETZTER,MITARBEITER WHERE VORGESETZTER.persID = MITARBEITER.persFID

9 Einführung9 Peer Data Management System PDMSSensornetzwerke Peers beinhalten Daten- quellen oder integrieren diese Einzelne Knoten bekommen ihre Daten aus Sensoreinheit Stabile Netzwerk Struktur Einzelne Knoten können aus- fallen Peers/Knoten können Daten auf Anfrage bereitstellen Es ist kein globales Wissen vorhanden vs. Peers können genannte Aufgaben bearbeiten Knoten können nur teilweise dieser Aufgaben bearbeiten

10 Einführung10 Semantic Gossiping Allgemein: –Anfrage vom Benutzer an verteilte Daten –Peers propagieren Anfrage an die Peers zu denen es Schema-Mappings gibt –ist es auch möglich sie an Peers zu schicken zu denen es keine Schema-Mappings gibt (durch Tansitivität ) –diese berechnen Resultate und /oder schicken sie weiter –ergibt sich ein Zyklus zurück zum anfragenden Peer, kann dieser zur Beurteilung der Resultat benutzt werden

11 Einführung11 Zyklus P1P1 P2P2 P4P4 P3P3 P4P4 Q anrede->- titel->anrede - anrede->bezeichnung bezeichnung->titel titel->titel bezeichnung->titel

12 Einführung12 Einführung Entstehender Informationsverlust bei Anfrage –Fehlende Mappings zu relevanten Peers –Unvollständige Abbildung der Attribute –Herausfiltern von Tupeln Qualitätsmaße für die Güte der Resultate erforderlich

13 Qualitätsmaße13 Übersicht Einführung Qualitätsmaße Gossiping Algorithmus Beispiel Diskussion

14 Qualitätsmaße14 Qualitätsmaße Zyklen Mittel zur Bewertung –Messen der Qualität der Mappings –Messen des Grades semantischer Übereinstimmung

15 Qualitätsmaße15 Qualitätsmaße Folgende Anforderungen an Peers zur Unterstützung der Messungen –nach Eingang einer Query entscheiden wohin die Query weitergeleitet wird –nach Eingang von Resultaten analysieren der Resultate und anpassen der eigenen Kriterien –und Erneuern der Sicht auf Semantisch Übereinstimmung

16 Qualitätsmaße16 Qualitätsmaße Kriterien zur Bewertung der Übersetzungsqualität – wesentlich beziehen sich nur auf bearbeitete Anfrage und benötigte Übersetzung – äußerlich beziehen sich auf den Grad der Übereinstimmung über einer Menge Peers und nach einer bestimmten Anzahl von Übersetzungen

17 Qualitätsmaße17 Qualitätsmaße Peer erhält zurückgegebene Anfragen und Daten –bei Nicht-Übereinstimmung einige der Mappings aus Zyklus sind falsch auch eigenes Mapping –bei Übereinstimmung es ist nicht klar ob diese aus der Verbesserung von Mapping Fehlern, die auf dem Weg passiert sind, resultiert

18 Qualitätsmaße18 Qualitätsmaße Man benötigt also: –Analyse welche Quelle die höchste Fehler- Wahrscheinlichkeit besitzt –Analyse bis zu welchem Umfang man eigenen Mappings trauen kann –Entscheidung wie man diese bei späterem Routing benutzt

19 Qualitätsmaße19 Qualitätsmaße Bei Anwendung diese Kriterien auf die Attribute einer transformierten Query entsteht ein Feature Vector der die Ergebnisse der einzelnen Kriterien für jedes Attribut beinhaltet

20 Qualitätsmaße20 Qualitätsmaße Peer p hält seine Datenbank DB p mit Schema S p in der relationalen Tabelle R Peer kann sein Datenbank befragen –Query q –Ergebnisse q(DB p )

21 Qualitätsmaße seien p und p` benachbarte Peers Operator: –T pp` transformiert für Query q T die Daten geordnet nach Schema S p` in Daten, die nach Schema S p geordnet sind T pp` (q p )(DB p` ) = q p (q T (DB p` ))

22 Qualitätsmaße Query q T hat die Eigenschaft: q T (DB p `) = π a (μ f (DB p `)) mehrere Transformationen werden schritt- weise auf einzelne Query angewendet T n-1n (…T 1 2 (q)…) = T 12,…,n-1n (q)

23 Qualitätsmaße Query Message query(id,q,p,TT) mit id – Query identifier q – Query selbst p – Query Ursprung TT – Mapping Route

24 Qualitätsmaße24 Qualitätsmaße Annahme: q = π ap (σ p(as) (μ fa (DB))) mit ap benutze Attribute der Projektion as benutze Attribute der Selektion fa Liste angewandter Mapping-Funktion Form der transformierte Anfrage T(q)(DB`) = π ap (σ p(as) (μ fa (π a (μ f (DB`)))))

25 Qualitätsmaße25 Syntaktische Gleichheit nicht alle Attribute in as erhalten bestimmte Eigenschaften, die durch diese Attribute ausgedrückt wurden, können nicht mehr bewertet werden Feature Vector FV σ (T 1,…,n (q)) = (fv σ A1,…, fv σ Ak )

26 Qualitätsmaße26 Syntaktische Gleichheit sei W Vektor von Gewichten der Attribute Syntaktische Gleichheit (σ) S σ (q,(T 1,…,n (q)) = WFV σ

27 Qualitätsmaße27 Syntaktische Gleichheit nicht alle Attribute in ap erhalten dadurch sind manche Ergebnisse fehlerhaft oder unvollständig Feature Vector (π) FV π (T 1,…,n (q)) = (fv π A1,…, fv π Ak )

28 Qualitätsmaße28 Syntaktische Gleichheit Syntaktische Gleichheit (π) S π (q,(T 1,…,n (q)) = WFV π

29 Qualitätsmaße29 Semantische Übereinstimmung Für eine gegebene Transformation T ist der source T (A) definiert als source T (A) = {A 1,…,A k }, falls ein F fa existiert mit A:=F(A 1,…,A k ), sonst

30 Qulitätsmaße30 Semantische Übereinstimmung Unterscheidung zwischen –semantischer Übereinstimmung entlang eines Kreises und –semantischer Übereinstimmung beim Betreten fremder Domäns

31 Qualitätsmaße31 Semantische Übereinstimmung entlang eines Zyklus Ausgangs Peer ist wieder erreicht dieses analysiert nun und stellt fest –Fall 1 source T (A i ) = {A i } –Fall 2 source T (A i ) = { } –Fall 3 source T (A i ) = {A j } wo ij 1…n

32 Qualitätsmaße32 Semantische Übereinstimmung FV C (T kj (q)) = (fv C A1,…, fv C Ak )

33 Gossiping Algorithmus33 Übersicht Einführung Qualitätsmaße Gossiping Algorithmus Beispiel Diskussion

34 Gossiping Algorithmus34 Gossiping Algorithmus für die Definition des Algorithmus haben wir 4 Maße für die Berechnung der Verluste zusätzlich: –Vektor W von Gewichten der Attribute –sel entsprechende Selektivitäten –S min Wert der minimalen Gleichheit

35 Gossiping Algorithmus35 Gossiping Algorithmus Neue Query Message: query(id,q,p,TT,W,sel,S min,FV σ,FV π,FV C,FV H )

36 Gossiping Algorithmus36 Gossiping Algorithmus 1.auf Zyklus überprüfen 2.Test ob Query schon empfangen wurde 3.Anfrage-Ergebnisse berechnen

37 Gossiping Algorithmus37 Gossiping Algorithmus 5.Mapping auf Anfrage anwenden 6.Maße für Transformation anpassen 7.Feature Vektoren für Gleichheit testen 8.Weiterleiten der Query, falls alle Feature Vektoren 1

38 Übersicht Einführung Qualitätsmaße Gossiping Algorithmus Beispiel Diskussion

39 Beispiel

40 Beispiel40 Beispiel A E D F G B C titelname titeldescription/name nametitel titeldescription/name namedescription/name Q titel - namename titelacronym titel titel - titel titel -

41 Beispiel41 Beispiel CycleT pA-pC fehlerbehaftetT pB-pD fehlerbehaftet A,B,D,E,A+- A,B,D,E,F,A+- A,B,E,A++ A,B,E,F,A++ A,B,F,A++ A,D,E,A-+ A,D,E,B,F,A-+ A,D,E,F,A-+

42 Übersicht Einführung Qualitätsmaße Gossiping Algorithmus Beispiel Diskussion

43 Diskussion Kritik: –Beispiel umfasst nur ein Attribut was gemappt wird –semantische Gleichheit bei Zyklen hängt nur von den einzelnen Wahrscheinlichkeit für die Attribute ab und nicht von der Query


Herunterladen ppt "Semantic Gossiping Christian Gebhardt Berlin, 13.07.07."

Ähnliche Präsentationen


Google-Anzeigen