RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski
Inhalt Speicherung: RDF Source related Storage System (RDF-S3) Anfrage: easy RDF Query Language (eRQL) Darstellung und Ranking der Ergebnisse
Ausgangspunkt Zentrale Speicherung Datenbanken, ad-hoc Anfragen Dezentrale Speicherung Agenten, Peer-Peer, Alert-Systeme
Fehlende Quellinformationen Im RDF Modell ist die Speicherung der Herkunft der Daten nicht vorgesehen. Diese Quellinformationen sind jedoch nützlich zur: –Überprüfung der Daten (Aktualität) –Bezug weiterer Informationen (HTML) –Glaubwürdigkeit Jeder kann beliebige Aussagen ins Internet stellen.
vom Glaubwürdigkeit Stimmen die Angaben? vom ????
RDF-S3 Eigenschaften Speicherung der Quellinformation zu jedem RDF Tripel Möglichkeit zum Löschen und Aktualisieren einzelner Quellen Optimierung durch Kombination der Generischen- und Schemaspezifischen-Repräsentation der RDF- Daten innerhalb der Datenbank
RDF-S3 Aufbau hohe Datenqualität durch semantische Überprüfungsfunktionen, die der integrierte Validating RDF Parser (VRP) bietet
RDF-S3 Demo
Problem – Verständnis Real-World-Beispiel: –Zur Erzeugung dieser Präsentation wurde die Länge der Tower Bridge gesucht –Suche mit "Tower Bridge" length lieferte eine Menge Ergebnisseiten, aber: Einheiten verschieden (z. B. Fuß) oder fehlend Länge einer Brücke? –Spannweite? Gesamtlänge? Länge der beweglichen Teile? …? –Zwei Kontexte nötig: Einheit und Längendefinition
Problem – Verständnis RDF Aussagen können oft nur in ihrem Kontext verstanden werden –Beispiel: Width of Golden Gate Bridge? 90! 90? 90 Meter, 90 Inch, 90 Feet?
Ziele 1.So einfach wie möglich! 2.Nutzung der Möglichkeiten durch die Speicherung der Quellinformation! 3.Darstellung der Ergebnisse in ihrem Kontext (siehe Golden Gate Bridge Beispiel)! eRQL Ein-Wort-Abfragen Dokumenten-Modus PointOfInterest-Modus
Ein-Wort-Anfrage Sehr einfach und ohne Vorwissen einsetzbar! –Idee: nicht komplizierter als Google Beispiel: Tripel, die bridge enthalten –eRQL: bridge –RQL: select * from like "*[bB][rR][iI][dD][gG][eE]*" or X like "*[bB][rR][iI][dD][gG][eE]*" or Y like "*[bB][rR][iI][dD][gG][eE]*" –RDQL:ähnlich wie RQL Perl ähnliche Notation SELECT ?s, ?p, ?o WHERE ?s =~ bridge AND ?p =~ bridge AND ?o =~ bridge ??????
Dokumenten-Modus Ermöglicht die Einschränkung auf ausgewählte Quellen (oder das Weglassen nicht vertrauenswürdiger Quellen) Syntax: –Beispiel: In RQL nicht vorgesehen! In RDQL können in der from-Klausel Einschränkungen definiert werden –Aber kein gezieltes Weglassen 0: weglassen 1: einschränken
PointOfInterest-Modus Gibt den internen Kontext (umgebener RDF Graph) der einzelnen Treffer mit an –Ergebnisse können besser verstanden werden (siehe Golden Gate Bridge) Die Größe des zu zeigenden Kontextes wird in der Anfrage definiert Beispiel: [bridge] ohne Kontext bridge Kontextgröße 1 (default) ~ bridge Kontextgröße 2 ~~ bridge Kontextgröße 3...
eRQL PointOfInterest eRQL erweitert Fundstellen zu POIs –benachbarte Aussagen werden hinzugefügt z. B. comment zu Golden Gate Bridge s:width 90 Golden Gate Bridge s:name s:widthofsidewalk 10.5 All units of measurements are feet. rdf:comment
eRQL PointOfInterest POIs werden auch für Sub-Queries gebildet –"Golden Gate Bridge" OR "Tower Bridge" s:width 90 Golden Gate Bridge s:name s:length Tower Bridge s:name 268
eRQL PointOfInterest POIs werden auch für Sub-Queries gebildet –"Golden Gate Bridge" AND width POIs für Golden Gate Bridge und width werden gebildet Vereinigung der POIs, falls diese überlappen, sonst leer übereinstimmend mit Google-Query s:width 90 Golden Gate Bridge s:name
eRqlEngine eRQL-Prototyp –kein Datenbank-Backend arbeitet mit RDF-Dateien einfache Installation Details und Download: – frankfurt.de/~tolle/RDF/eRQL/ –
eRQL Demo
Zusammenfassung RDF-S3 und eRQL bieten: Überprüfbare Daten mehr Glaubwürdigkeit Antworten mit Kontext mehr Verständnis der Ergebnisse Anfragen können auf ausgewählte Quellen eingeschränkt werden bessere Ergebnisse sehr einfach kann ohne Vorwissen genutzt werden (wichtig für Portale)
Zukünftige Ziele Steigerung der Performance von RDF-S3 und eRQL Weitere nützliche Anfragemöglichkeiten untersuchen Verbesserung der Ergebnisdarstellung Versionsunterstützung für Quellen unter RDF-S3...
Danke für die Aufmerksamkeit Fragen? Weitere Infos und Downloads: Kontakt: Karsten Tolle: Fabian Wleklinski: