Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

WWW-Anfragesprachen Seminar Datenbanken Vortrag von Jörg Sorg.

Ähnliche Präsentationen


Präsentation zum Thema: "WWW-Anfragesprachen Seminar Datenbanken Vortrag von Jörg Sorg."—  Präsentation transkript:

1 WWW-Anfragesprachen Seminar Datenbanken Vortrag von Jörg Sorg

2 Einleitung - aktueller Stand zWeb-Dokumente liegen häufig als semistrukturierte Daten vor zSuchmaschinen, ermöglichen die inhalts- basierende Suche nach Informationen zNavigation basiert auf Verfolgung von Links eines Dokuments

3 Einleitung - Anforderungen zAufgaben: yModellierung des Web yInhalts- und Strukturanfragen an das Web zWWW-Anfragesprachen: y1. Generation (Anfragesprachen): W3QL, WebLog, WebSQL y2. Generation (Datenmanipulationssprachen): WebOQL, STRUQL, FLORID

4 WebSQL - Datenmodell zFehlendes Datenbankschema, deshalb virtuelle Relationen zWeb-Objekte: yDocument[url, title, text, type, length, modif] zVerbindungen: yAnchor[base, href, label] zAnfragen: abgeändertes SQL erweitert um reguläre Ausdrücke

5 WebSQL - Inhaltsanfragen zFinde alle HTML-Dokumente zum Thema Hypertext: SELECT d.url, d.title, d.length, d.modif FROM Document d SUCH THAT d MENTIONS Hypertext WHERE d.type = text/html; zFinde alle Links auf Applets, ausgehend von Dokumenten über Java: SELECT y.label, y.href FROM Document x SUCH THAT x MENTIONS Java, Anchor y SUCH THAT base = x WHERE y.label CONTAINS applet;

6 WebSQL - Pfadausdrücke zintern ( ) zlokal ( ) zglobal ( ) zleerer Pfad (=), Alternative (|), Wiederholung (*) und Verknüpfung (.) zZiel: Bildung regulärer Pfadausdrücke für die Nutzung der Hypertext-Struktur in Anfragen

7 WebSQL - Strukturanfrage SELECT d.url, d.title FROM Document d SUCH THAT http://www.uni-mannheim.de =. d WHERE d.title CONTAINS Praktische Informatik; z... und die Kombination von Inhalts- und Strukturanfrage: SELECT x.url, x.title, y.url, y.title FROMDocument x SUCH THAT x MENTIONS Computer Science, Document y SUCH THAT x =. y;

8 WebOQL - Datenmodell zHypertree ymit Records beschrifteter, geordneter Baum mit internen und externen Kanten zWeb (t, F) ymit Hypertree t als Schema yund Funktion F als Browsing-Funktion zString als einziger atomarer Datentyp

9 WebOQL - Beispiel [Group: Card Punching][Group: Databases] [Title: Recent Advances in Card Punching, Autors: Peter Smith, John Brown, Publication: Technical Report TR015] [Label: Full version, Url:http://.../paper1.ps.Z] [Label: Abstract, Url:http://.../abstr1.html] [Label: Full version, Url:http://.../paper2.ps.Z] [Title: Are Magnetic Media Better?, Authors:Peter Smith, John Brown, Tom Wood, Publication:AC TOCP Vol.3 No.(1942) pp 23-37] [Label: Full version, Url:http://.../paper13.ps. Z] [Label: Abstract, Url:http://.../abstr13.html] [Label: Abstract, Url:http://.../abstr17.htm l] [Label: Full version, Url:http.//.../paper17.ps.Z] [Title: Cobol in AI, Authors: Sam James, John Brown] [Title: Assembly for the Masses, Authors: John Brown, Tom Wood, Publication: ACM 2 POPL Proceedings (1943)]...

10 WebOQL - Anfragen [ Title: Recent Advances in Card Punching, Url:http://.../paper1.ps.Z] [ Title: Are Magnetic Media Better?, Url:http://.../paper2.ps.Z] [ Title: Recent Advances in Card Punching, Url:http://.../paper1.ps.Z] [ Title: Recent Advances in Card Punching, Url:http://.../paper1.ps.Z] [ Title: Are Magnetic Media Better?, Url:http://.../paper2.ps.Z] [ Title: Are Magnetic Media Better?, Url:http://.../paper2.ps.Z]

11 WebOQL - Restrukturierung zRestrukturierung von Dokumenten, Datenbanken und Webs yHTML strukturierte Dokumente yHTML HTML zRestrukturierung von Webs

12 FLORID - Datenmodell zAnsatz: Kombination aus Objektorientierung und deduktiven Regeln zF-logic erweitert um Pfadausdrücke

13 FLORID - Strukturanfragen zhrefs@(label) ymengenwertige Methode für die Navigation durch die Hyperlink-Struktur zWeb-Skelett yTrennung des strukturellen Aspekts vom inhaltlichen

14 FLORID - Strukturanfragen zPfadausdrücke für Informationsgewinnung ?- meteo..L..Ozonschicht..M. zAggregationen, um die wichtigsten Einträge zu finden yBsp. count

15 FLORID - Inhaltsanfragen zIntegrierte Prädikate für die Datenextraktion und -analyse zBeispiel: pmatch(Str, RegEx, Fmt, Res) Ermittlung von Schemainformationen ?- _:country[M _].

16 Zusammenfassung zDatenmodelle basieren auf Graphen zNavigation mittels regulärer Pfadausdrücke zDatenmanipulation bei WWW- Anfragesprachen der 2. Generation

17 Ausblick zAnfrageoptimierung zIntegration von Metadaten über Datenquellen yXML des W3C


Herunterladen ppt "WWW-Anfragesprachen Seminar Datenbanken Vortrag von Jörg Sorg."

Ähnliche Präsentationen


Google-Anzeigen