Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

RDF in P2P-Netzen Ting Li 09.02.2004. RDF in P2P-Netzen2 Gliederung 1. Einleitung 2. RDF/RDF Schema 3. Edutella/RDF-basierte P2P-Netze 4. Implementierung.

Ähnliche Präsentationen


Präsentation zum Thema: "RDF in P2P-Netzen Ting Li 09.02.2004. RDF in P2P-Netzen2 Gliederung 1. Einleitung 2. RDF/RDF Schema 3. Edutella/RDF-basierte P2P-Netze 4. Implementierung."—  Präsentation transkript:

1 RDF in P2P-Netzen Ting Li

2 RDF in P2P-Netzen2 Gliederung 1. Einleitung 2. RDF/RDF Schema 3. Edutella/RDF-basierte P2P-Netze 4. Implementierung 5. OAI-P2P 6. Zusammenfassung 7. Wichtige Ressourcen

3 RDF in P2P-Netzen3 Gliederung 1. Einleitung OAI OAI-PMH Cyclades Projekt Kepler Projekt 2. RDF/RDF Schema 3. Edutella/RDF-basierte P2P-Netze 4. Implementierung 5. OAI-P2P 6. Zusammenfassung 7. Wichtige Ressourcen

4 RDF in P2P-Netzen4 OAI: Open Archive Initiative Ziel: weltweiter Austausch von elektronischen E-Prints. Metadaten: Beschreibungen des elektronischen Dokuments durch entsprechende Schemata definiert. Mindestanforderung: Dublin Core enthält 15 Elemente Alle Elemente sind sowohl optional als auch wiederholbar. Andere Metadatenformate: OLAC (Open Language Archive Community) MARC21 RFC Merke: lediglich die Beschreibungen ausgetauscht.

5 RDF in P2P-Netzen5 OAI-PMH Austauschprotokoll für Metadaten. basiert auf HTTP (Anfrage) und XML (Antwort). Zwei Arten von Teilnehmern: Data-Provider: stelle eine Schnittstelle zu den lokalen digitalen Ressourcen her. Service-Provider: Harvesting von Metadaten und bietet Mehrwertdienst, z.B: Ranking... Nachteile: low-barrier: einfach wie möglich für Data-Provider aufgebaut. Aber: Für Erstellen und Behalten von Service-Provider werden mehrere Ressourcen gebraucht. Kein front-end Service

6 RDF in P2P-Netzen6 Cyclades Projekt Aufbauend auf dem OAI-Standard Entwicklung weiterer Dienste Insbesondere: Information Retrieval in verteilten OAi-kompatiblen Archiven Suchen und Browsen in Multilevel-Hypertext die Erfassung von Relevanz- Feedback Die Erfassung von Kommentaren zu einzelnen Dokumenten die Personalisierung von benutzerspezifischen Agenten Architektur

7 RDF in P2P-Netzen7 Kepler Projekt verbesserte Lösung Idee: Ein OAI Data/Service Provider für Einzelpersonen. Eigenschaften: ein JAVA-archivlet eine LDAP-basierte Netzwerkumgebung ein query/discovery Service Vorteil: technische Einfachheit und Verwendbarkeit Probleme: noch vom zentralen Service-Provider abhängig unterstützt community building nicht

8 RDF in P2P-Netzen8 Gliederung 1. Einleitung 2. RDF/RDF Schema RDF RDF Schema 3. Edutella/RDF-basierte P2P-Netze 4. Implementierung 5. OAI-P2P 6. Zusammenfassung 7. Wichtige Ressourcen

9 RDF in P2P-Netzen9 RDF (Resource Description Framework) vom W3C im Rahmen der Semantic Web-Initiative geförderte Beschreibungssprache Idee: aussagekräftige Beschreibungen von Ressourcen. Drei Typen von Objekt: Resources: alle Objekte bei WWW, die durch einen URI identifiziert werden. z.B: Webseite... spezieller Typ von Ressourcen (literal) möglich Properties: spezielle Aspekte / Charakteristik / Attribute / Beziehungen Statements: Ressourcen + definierte Eigenschaften + Werte der Eigenschaften Triple:

10 RDF in P2P-Netzen10 RDF (Resource Description Framework) Beispiel: RDF-Syntax: in XML-Format creator Ora Name

11 RDF in P2P-Netzen11 RDF Schema Vocabulary Description Language Beschreibungen der Beziehungen zw. verschiedenen Arten von Ressourcen und Eigenschaften. Kern Klassen: rdfs: Resource rdfs: Class rdf: Property Kern Eigenschaften: rdf: type rdfs: subClassOf rdfs: PropertyOf rdfs: subPropertyOf rdfs: seeAlso rdfs: isDefinedBy

12 RDF in P2P-Netzen12 RDF Schemas Beispiel: Resource Hierarchy rdfs: subClassOf rdf: type rdfs:Resource xyz:MotorVehicle rdfs:Class xyz:MiniVan xyz:Truck xyz:Van xyz:PassengerVehicle

13 RDF in P2P-Netzen13 Gliederung 1. Einleitung 2. RDF 3. Edutella/RDF-basierte P2P-Netze Architektur Dienstleistungen Super-Peer/HyperCup Topologie Zwei Arten von Routing Indizes Dynamische Routing Indizes Mediation zwischen verschiedenen Schemata 4. Implementierung 5. OAI-P2P 6. Zusammenfassung 7. Wichtige Ressourcen

14 RDF in P2P-Netzen14 Architektur Eine P2P Infrastruktur, um die Daten zu speichern, abzufragen und auszutauschen. Zwei Kern-Komponente: Sun JXTA; W3C RDF JXTA: Open Source Framework für die Entwicklung von P2P Services und Anwendungen Interoperable und plattformunabhängig 3-Schichtenmodell JXTA Applications JXTA Shell: Interaktiver Zugriff auf JXTA Plattform JXTA Services Discovery, Routing, Indexing,,Searching, File Sharing... JXTA Core Gruppierung, Pipes...

15 RDF in P2P-Netzen15 Architektur RDF/RDF Schema in Edutella: Beschreibungen der verteilten Ressourcen. Alle Ressourcen sind durch eindeutigen URI gekennzeichnet. Die Beschreibungen von Ressourcen mit verschiedenen Schemata sind möglich. Speicherung der Beschreibungen in RDF-Repositores. Jeder Peer stellt seine Metainformationen als Set der RDF- Aussagen zur Verfügung. Charakteristik von RDF-Schema: verteilte Darstellungen für eine oder selbe Ressource => einfach zur Konstruktion der verteilten Repositores flexibel und erweiterbar => Schema-basierter P2P-Netzwerk

16 RDF in P2P-Netzen16 Dienstleistungen Query Service (Basic Service): Fragen werden durch das Netz zur Teilmenge des Peers geschickt, die die Frage beantworten könnten. Zurücksenden der resultierenden RDF-Aussagen zu dem erbittenen Peer. Anfragesprache ist frei auswählbar. RDF-QEL (RDF based-Query Exchange Language): eine standardisierte Sprache basiert auf Datalog beginnend mit einfachen konjunktiven Anfragen Jede QEL-Anfrage basiert auf explizite bezogenen Metadaten- Schemata (z.B: DC, LOM), nicht von einem spezifischen Schema unabhängig. ein graphischer Query-Editor: Conzilla

17 RDF in P2P-Netzen17 Dienstleistungen RDF-QEL: Aufteilung in 5 Sprachlevel, die in der Ausdrucksfähigkeit aufeinander aufbauen: RDF-QEL-1: Konjunktive Queries RDF-QEL-2: RDF-QEL-1 + Disjunktion RDF-QEL-3: RDF-QEL-2 + Negation + nicht rekursive Regeln (SQL92-Umfang, Datalog-Ansatz) RDF-QEL-4: RDF-QEL-3 + lineare Rekursion (SQL3-Umfang) RDF-QEL-5: RDF-QEL-4 + allgemeine Rekursion

18 RDF in P2P-Netzen18 Dienstleistungen Conzilla as query editor

19 RDF in P2P-Netzen19 Dienstleistungen Replication Service (Basic Service): Ergänzung der lokalen Ablage Datenintegrität-und Konsistenz Zuverlässigkeit und ausgleichende Arbeitsbelastung Mapping Service: Übersetzung zwischen unterschiedlichen Schemata z.B: MARC DC

20 RDF in P2P-Netzen20 Super-Peer/HyperCup Topologie Super-Peer: prinzipieller Knoten mit einer sehr guten und stabilen Netzanbindung größerer Rechenleistung als normale Peers. Funktionalität der Super-Peers: Verwaltung von Routing-Indizes Bestimmung der weiteren Wegwahl der Anfragen d.h: Der Super-Peer entscheidet sich, welche Anfrage vorwärts zu welchem Peer oder Super-Peer gesendet werden sollte. … SP P P P P P P P P P

21 RDF in P2P-Netzen21 Super-Peer/HyperCup Topologie Super-Peers sind in HyperCup Topologie organisiert. HyperCuP Protokolls: Hinzufügen eines neuen Super-Peer: Peer-Integration-Protocol Aufwand: O(log(N)) Verlassen eines Super-Peers: Anderer Super-Peer nimmt zusätzlich seine Position ein. HyperCup Topologie + Routing Indizes: ermögliche effiziente und garantiere nicht-redundante Broadcasting. Beim Broadcasting: Jeder Peer wird als die Wurzel eines aufspannenden Baums betrachtet. Pfadlänge: log 2 N; Anzahl der Nachbarn: log 2 N. E G AB C H D F

22 RDF in P2P-Netzen22 zwei Arten von Routing Indizes Super-Peer/Peer Routing Indices(SP/P-RIs): Idee: Speicherung der Metainformation über die an ihm angeschlossenen Peers. z.B: Schema, Schemawert... Registrierung eines Peers: bietet seine Metainformationen zum Super-Peer durch eine veröffentliche Nachricht Matching Algorithmus: um festzustellen, welcher Peer die Anfrage verstehen und beantworten kann. garantiert nicht einem nicht leeren Antwortsatz. Indexeinträge mit verschiedenen Granularität

23 RDF in P2P-Netzen23 zwei Arten von Routing Indizes Super-Peer/Peer Routing Indices(SP/P-RIs): Schema Index: eindeutiger Identifier des Schema Der Peer oder Super-Peer, die dieses Schema benutzen. Schema Property: Schema Index + Eigenschaft Menge von Eigenschaften Property Value Range Index: Klassifiziere die Eigenschaft mit Hilfe von vordefinierten hierarchischen Vokabularen. Property Values Index: vorteilhaft für einige Eigenschaften, die häufig verwendet werden. Verringerung des Netzverkehrs

24 RDF in P2P-Netzen24 zwei Arten von Routing Indizes Super-Peer/Peer Routing Indices(SP/P-RIs): Bsp: Find any resource where the property dc:subject is equal to ccs:softwareengineering, dc:language is equal to de and lom:context is equal to undergrad. contents of the sample query at different granularities GranularityQuery Schemadc, lom Propertydc: subject, dc: language, lom: context Property Value Rangedc: subject css: swengineering Property Valuelom: context undergrad dc: language de

25 RDF in P2P-Netzen25 zwei Arten von Routing Indizes Super-Peer/Peer Routing Indices(SP/P-RIs): routing example network P0P0 P1P1 SP 1 P4P4 P3P3 P2P2 SP 2 SP 4 SP 3 (r, dc: language, de) (r, lom: context, undergrad) (r, dc: subject, ccs: software- engineering) Sample Query (p, dc: subject, ccs: ethernet) (q, dc: subject, ccs: clientserver) (s, dc: language,de) (s, lom: context,undergrad) (s,dc: subject, ccs: softwareengineering)

26 RDF in P2P-Netzen26 zwei Arten von Routing Indizes Super-Peer/Peer Routing Indices(SP/P-RIs): Update der SP/P Indizes: Garantiere des aktuellen Zustands der Indizes Hinzufügen eines Peers: Sendung seiner Metainformationen an den Super-Peer durch Broadcasting. Veränderung der Inhalte eines Peers: z.B: Veränderung des Schemas: DC LOM Verlassen eines Peers: Lösen der zugehörigen Referenz von den Indizes

27 RDF in P2P-Netzen27 zwei Arten von Routing Indizes Super-Peer/Super-Peer Routing Indices(SP/SP-RIs): Idee: Routing zwischen Super-Peers. SP/SP Indizes: Extrakte und Zusammenfassungen von allen lokalen SP/P Indizes. enthalten die selben Arten der Informationen wie SP/P Indizes. referenziert nur die benachbarten Super-Peers. Zwei Schritte bei der Bearbeitung einer Anfrage: Anfrage wird nur an entsprechende Peers weitergeleitet (mit Hilfe von SP/P Indizes). Weitersendung der Anfrage an referenzierte, benachbarte Super-Peers (mit Hilfe von SP/SP Indizes).

28 RDF in P2P-Netzen28 zwei Arten von Routing Indizes Super-Peer/Super-Peer Routing Indices(SP/SP-RIs): SP/SP index of SP 2 at different granularities GranularityIndex of SP 2 Schemadc SP 1, SP 3, SP 4 lom SP 1, SP 4 Propertydc: subject SP 1, SP 3, SP 4 dc: language SP 1, SP 4 lom: context SP 1, SP 4 Property Value Range dc: subject ccs: networks SP 3 dc: subject css: swengineering SP 1, SP 4 Property Value lom: context undergrad SP 1, SP 4 dc: language de SP 1, SP 4

29 RDF in P2P-Netzen29 zwei Arten von Routing Indizes Super-Peer/Super-Peer Routing Indices(SP/SP-RIs):

30 RDF in P2P-Netzen30 zwei Arten von Routing Indizes Super-Peer/Super-Peer Routing Indices(SP/SP-RIs): Update der SP/SP Indizes: Hinzufügen eines neuen Peers: Peer sendet seine Metainformationen zum Super-Peer. Super-Peer passt sich die SP/P indizes an. Super-Peer sendet die Nachricht zur allen Peers. Andere Super-Peers aktualisieren ihre SP/SP Indizes entsprechend. => aufwendig Verlassen eines Peers: ähnlich wie beim Hinzufügen eines neuen Peers. Hinzufügen neues Super-Peers: Ähnliche Konstruktion wie bei SP/P Indizes Ausfall eines Super-Peers: Die mit diesem Super-Peer verbundenen Peers können bei anderem Super-Peer beliebigen registrieren.

31 RDF in P2P-Netzen31 Dynamische Routing Indizes Problem: Broadcasting der Anfrage, weil die Peers beliebig verteilt sind. => Wie macht man die Routing Indizes effizient? Lösung: Hinzufügen der Frequenzinformationen über Anfragen Gedanken über Similarity-Based Clustering Of Peers Similarity-Based Clustering Of Peers: Idee: Das Clustering basiert auf der Integration der Peers nach der Ähnlichkeitsmaß. Vorteil: Reduzierung der Menge der Nachrichten. HyperCup Struktur macht die Partition (Subpartition) möglich. Verbindung eines Super-Peer mit anderen Nachbarn als Verbindung zur anderen Partitionen oder Subpartitionen betrachtet.

32 RDF in P2P-Netzen32 Dynamische Routing Indizes HyperCuP-Partitionen sind überflüssig angeschlossen. Broadcasting einer Nachricht ist nur nach der i>k Regel. Andere dynamische Weise: frequency counting algorithms on streams: Jede Peer, Super-Peer und Anfragen werden durch eine Menge von Items charakterisiert. Ähnlichkeitsberechnung => Hinzufügen der Frequenz in den SP/SP Indizes ist nötig.

33 RDF in P2P-Netzen33 Mediation zw. verschiedenen Schemata Basis Idee: Mediator-based Information Systems (MBIS) Korrespondenz: Transformationsregel zw.Schemata. MBIS-basierte Korrespondenz: Transformationsregel zw. den unterschiedlichen lokalen Schemata. Ein Super-Peer speichert die Relationen zwischen den Korrespondenz und Peers in seiner Indizes. Mechanismen: Query Correspondence Assertions (QCA) Model Correspondence Assertions (MOCA)

34 RDF in P2P-Netzen34 Mediation zw. verschiedenen Schemata Beispiel: Query Correspondence Assertions (QCA) Ein definierte Anfrage-Schema: lectures (lecture: identifier, lecture: language, lecture: subject, lecture: educationalcontext) Beispiele für Korrespondenzen zwischen RDF-Schemata: 1. lectures: identifier = dc: title lectures: language = dc: lang lectures: subject = dc: subject 2. lectures: identifier = lom: general.identifier lectures: language = lom: general.language lectures: context = lom: educational.context Beispiele für View zwischen RDF-Schemata: 1. lecturesViewDC (lectures: identifier, lecture: language, lecture: subject) DC (dc: title, dc: lang, dc: subject) 2. lecturesViewLOM (lecture: identifier, lecture: language, lecture: context) LOM (lom: general.identifier, lom: general.language, lom:educational.context)

35 RDF in P2P-Netzen35 Mediation zw. verschiedenen Schemata Beispiel: Query Correspondence Assertions (QCA) Abbildung der Attribute aus dem lecture-Schema auf die RDF-Schemata DC und LOM. 1. lectures (lectures: identifier, lectures: language, lectures: subject, -) lecturesViewDC (lectures: identifier, lectures: language, lectures: subject) 2. lectures (lectures: identifier, lectures: language, -, lectures: context) lecturesViewLOM (lectures: identifier, lectures: language, lectures: context) Resultierende Korrespondenzen für die Umsetzung auf RDF-Schemata in P 1 und P 2. Peer1: Correspondence1 lectures (lectures: identifier, lectures: language, lectures: subject, -,) lecturesViewDC (lectures: identifier, lectures: language, lecture: subject) DC (dc: title, dc: subject, dc: lang) Peer2: Correspondence2 lectures (lectures: identifier, lectures: language, -, lecture:educationalcontext) lecturesviewLOM (lectures: identifier, lectures: language, lecture: educationalcontext) LOM (lom: general.identifier, lom: general.language, lom:educational.context)

36 RDF in P2P-Netzen36 Gliederung 1. Kurze Einführung von OAI 2. Edutella 3. RDF-basiertes Peer To Peer-Netzwerk 4. Implementierung Edutella Framework Dienstleistungen 5. OAI-P2P 6. Zusammenfassung 7. Wichtige Ressourcen

37 RDF in P2P-Netzen37 Edutella Framework Erweiterung von JXTA. Edutella Framework wird in zwei Bereichen erweitert: Erster Teil: Unterstützung des Aufbau des Super-Peer-Netzwerks Der Super-Peer basiert auf solchen Topologien wie z.B: HyperCuP. Zweiter Teil: zusätzliche Komponenten für Konstruktion des Super-Peers. Peer Registrierung Verwalte Routing-Tabelle... Dienstleistungen: Standard-Modulen spezifische Service-Modulen

38 RDF in P2P-Netzen38 Dienstleistungen Der Super-Peer stellt vier Dienstleistungen zur Verfügung: Bind Service: Behandlung der Registrierung des Peers. kümmert sich um dem hand-shaking Prozeß. Aktualisierung der SP/P Indizes. Routing Service: Routing der Anfragen. Empfang der Resultate von passenden Peers und Super-Peers. Topology Service: Beibehalten der Netz-Topologie des Super-Peers Aktualisierung der SP/SP Indizes Query Service: stellt eine definierte Schnittstelle zu den neuen Anfragen zur Verfügung. Diese Anträge werden durch den Routing Service verteilt.

39 RDF in P2P-Netzen39 Gliederung 1. Einleitung 2. RDF 3. Edutella/RDF-basierte P2P-Netze 4. Implementation 5. OAI-P2P Motivation System Architektur 6. Zusammenfassung 7. Wichtige Ressourcen

40 RDF in P2P-Netzen40 Motivation Nachteile von OAI: Abfragen aller Data-Providers Hinzufügen neues Data-Providers Abbau und Reorganisation des Service-Providers Data Provider Service Provider Clients TIB TIBNCSTRL arXiv Arc My.OAI

41 RDF in P2P-Netzen41 Motivation OAI-P2P: Ein P2P Netzwerk für OAI Ziel: Erweiterung des Query-Services Vermeiden der Abhängigkeiten von zentralisiert, server-basierten Systeme. Eigenschaften: OAI Data-Provider werden Edutella-Provider front-end Service System-Architektur: OAI-P2P Data Wrapper OAI-P2P Query Wrapper

42 RDF in P2P-Netzen42 System Architektur OAI-P2P Data Wrapper Keine Veränderung des Data-Providers Kopiere die Daten zum RDF-Repository sofort implementierbar Update nötig OAI-P2P Query Wrapper Antworte die Anfrage direkt vom Datenspeicher Übersetzung der QEL- Anfrage ist nötig Kopiere die Daten nicht Kein Update

43 RDF in P2P-Netzen43 Gliederung 1. Einleitung 2. RDF 3. Edutella/RDF-basierte P2P-Netze 4. Implementation 5. OAI-P2P 6. Zusammenfassung 7. Wichtige Ressourcen

44 RDF in P2P-Netzen44 Zusammenfassung OAI: low barrier Edutella/Schema-basierte P2P-Netze: P2P Infrastruktur explizite Schemata zur Beschreibung ihrer Inhalte. ideal für heterogene Information-Providers Transformationsregel Super-Peer Topologie: effizientes Routing und Clustering Routing-Strategien: effektive Sendung der Anfragen Algorithmen: Konstruktion der Indizes dynamisch Implementierung OAI-P2P

45 RDF in P2P-Netzen45 Literatur: [1] Dublin Core Metadata Initiative(DCMI): [2] OAI web site und OAI-PMH specification: [3] Kepler Project: [3] RDF: [4] Edutella: [5] JXTA: [6] RDF-QEL: [6] Ahlborn, Benjamin; Nejdl, Wolfgang Nejdl; Siberski, Wolf (2002): OAI-P2P: A Peer-to-Peer Network for Open Archives [7] Nejdl, Wolfgang; Wolpers, Martin; Siberski, Wolf; Schmitz, Christoph; Schlosser, Mario; Brunkhorst, Ingo; Löser, Alexander (2003): Super-Peer-Based Routing and Clustering Strategies for RDF-Based Peer-to-Peer Networks


Herunterladen ppt "RDF in P2P-Netzen Ting Li 09.02.2004. RDF in P2P-Netzen2 Gliederung 1. Einleitung 2. RDF/RDF Schema 3. Edutella/RDF-basierte P2P-Netze 4. Implementierung."

Ähnliche Präsentationen


Google-Anzeigen