Semantic Web Grundlagen und RDF Marko Harasic Freie Universität Berlin Institut für Informatik Netzbasierte Informationssysteme

Slides:



Advertisements
Ähnliche Präsentationen
RDF-Anwendungen: CC/PP
Advertisements

Einführung in RDF.
Pop Jazz C B A Jazz C A Lehrstuhl für Künstliche Intelligenz
Idee und Realisierung des Internet der Zukunft
Institut für Informatik Betriebliche Informationssysteme Alex Bartrolí1 OWL-Sprachelemente.
Kapitel 4 Datenstrukturen
Resource Description Framework (RDF)
Universität zu Köln IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009 MA: Patrick Sahle RDF in 5 Minuten* RDF in 5 Minuten* Resource.
RDF R ESOURCE D ESCRIPTION F RAMEWORK Referentin: Claudia Langer.
OWL Web Ontology Language. Begriff Ontologie Όν + λόγος sein Grund Lehre Wort.
Ressource Description Language
Die Bestandteile des Semantic Web. Sematic Web soll das WWW erweitern und nicht neuerfinden Informationen sollen Maschinenlesbar sein Schemata beschreiben.
Zentrale Elemente des Resource Description Framework (RDF) Die Modell- und Syntax-Spezifikation des World Wide Web Consortium für das Semantic Web Seminar.
Wissensbasierte Daten- interpretation für einen automatisierten und adaptiven Inhaltsintegrationsprozeß Lyndon J B Nixon
Modularization of XHTML™
SQL/XML. © Prof. T. Kudraß, HTWK Leipzig 2 2 Motivation Speicherung von XML in allen großen kommerziellen DBMS vorhanden proprietäre Lösungen für die.
Jan Fienhold1 Institut für Informatik Betriebliche Informationssysteme OWL Web Ontology Language.
Hauptseminar XML-Technologie: Resource Description Framework (RDF) Michael Kranz Betreuer: Roland Haratsch.
Ontologie(n) Ein Vortrag von Sven Liekenbrock
OWL-Web Ontology Language Eine Einführung
XML / RDF / OWL in Protégé Aufbau · OWL · Code · Demo · Ausblick
OWL-Web Ontology Language Eine Einführung
RDF-Schema Seminar: „Semantic Web“ André Rosin,
Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03.
1 XML und Datenbanken Kapitel 7: Modellierung, Teil 1 Meike Klettke Universität Rostock Fakultät für Informatik und Elektrotechnik
1 Grundlagen und Anwendung der Extensible Markup Language (XML ) Peter Buxmann Institut für Wirtschaftsinformatik Johann Wolfgang Goethe-Universität Frankfurt.
RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.
CIDOC CRM aus der Sicht von Ontologienutzern. CIDOC CRM - (Formale) Ontologie für die Dokumentation in den Kulturwissenschaften – ISO 21127: A Reference.
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
1 Dienstbeschreibung mit DAML Ein graphischer Editor für DAML - Ting Zheng Betreuer: Michael Klein, Philipp Obreiter.
RDF Resource Description Framework
SEP Halgurt Mustafa Ali Can Önder Marius Morawski Matthias Seidl Themen: Integration von RDQL und OWQL innerhalb des Apache Cocoon Frameworks Semantische.
Metadaten als Bausteine des Semantic Web META-LIB Workshop 22
RDF MT Resource Description Framework Model Theory © 2002 by Emir Blažević
XML - Konzepte XHTML XML Base XPath XInclude XLink XForms XPointer
Semantic Web Services - An Introduction
Proseminar: „Webtechnologien für Ecommerce“
Wird ganz am Anfang der HTML-Datei geschrieben Doctype html public bedeutet, dass man sich auf die Öffentlichkeit der html-dtd bezieht Html ist die meist.
Windows Presentation Foundation, Vorlesung Wintersemester 2013/14 Prof. Dr. Herrad Schmidt WS 13/14 Kapitel 2 Folie 2 XAML (1) s.a.
Sesame Florian Mayrhuber
Hauptseminar Web Engineering – Semantic Web Dominik Pretzsch.
Wohlgeformtheit und Gültigkeit Grundlagen der Datenmodellierung Anke Jackschina.
Struktur von RDF Fabian Scheller.
Trust and context using the RDF- Source related Storage System (RDF‑S3) and easy RQL (eRQL) Karsten Tolle und Fabian Wleklinski.
Knowledge Management - Übung -
Dublin Core IT-Zertifikat Daten- und Metadatenstandards.
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
Seminar: Neue Ansätze der Künstlichen Intelligenz Seite 1Ulf Schneider02. Juli 2002 Ulf Schneider Neue Ansätze der Künstlichen Intelligenz: OIL Ontology.
„Wenn du den Fluss Halys überschreitest, wirst du
Institut für Softwarewissenschaft - Universität WienP.Brezany 1 Semantisches Web Peter Brezany Institut für Softwarewissenschaft Universität Wien Tel.
Semantic Web.
Hauptseminar Web-Services und verteilte Datenbanken Thema XML, DTDs und XML-Schema XML, DTDs und XML-Schema - Stefan Kurz, 25. April 2003.
IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle Semantic WebWS 08/09.
XML Die “E-Lance Economy” oder die “Digital Economy” stellt neue Anforderungen an Funktionalität im Netz. XML wurde vom World Wide Web Consortium (W3C)
1 6.4 Resource Description Framework (RDF) 6 Interoperabilität im WWW mit XML 6.1 XML – Definition und Nutzung 6.2 XML – Datenverwaltung und Indexierung.
Geoinformation3 Geoinformation III XML Grundlagen, Namensräume und Hyperlinks Vorlesung 12b.
Lexikalische Semantik
1 6.3 Resource Description Framework (RDF) 6 Interoperabilität im WWW mit XML 6.1 XML – Definition und Nutzung 6.2 Anfragen auf XML-Datenbeständen.
RDF (Resource Descripton Network)
HYPERLINK WAS IST DAS WEB 2.0? SEMANTIC WEB.
SMART Systems (Vorlesung: KI & XPS) zBeim vorigen Mal: yALCQHI R+, Syntax, Semantik, Anwendung (Pragmatik) zInhalt heute: yRDFS, Vertiefung der Anwendung.
Institut für Informatik Betriebliche Informationssysteme Fußzeile...1 Semantic Web Services and Interfaces Semantic Web, Resource Description Framework,
Document Type Definitions (DTDs) Marko Harasic Freie Universität Berlin Institut für Informatik Netzbasierte Informationssysteme
17.Januar 2007 ― 1Elektronisches Publizieren: Resource Description Framework (RDF) Grundlagen des Semantic Web — Resource Description Framework (RDF) —
13.Dezember 2006–1Elektronisches Publizieren: Schemasprachen — Relax NG Schemasprachen für XML — Relax NG — Anne Brüggemann-Klein TU München.
Vorlesung XML-Technologien – SoSe 2016
Hauptseminar WebServices
Wir haben doch XML, wozu RDF?
Seminarphase PG 402 Thema: Semantic Web Autor: Phillip Look
 Präsentation transkript:

Semantic Web Grundlagen und RDF Marko Harasic Freie Universität Berlin Institut für Informatik Netzbasierte Informationssysteme

2 Warum reicht XML generell nicht aus? Dieses Buch hat den Titel Semantic Web Grundlagen natürliche Sprache Mehrdeutigkeit AG Netzbasierte Informationssysteme

3 Apple

4 Syntax/Semantik/Pragmatik Syntax – die Art und Weise, wie Worte in einem Satz zusammengesetzt wurden. Semantik – Informationen, die in diesem Sinne kodiert wurden. Pragmatik – Implikationen aus den Informationen in einem Kontext. AG Netzbasierte Informationssysteme  Quelle:

5 Daten im heutigen Web unstrukturierter Text keine Unterstützung für Maschinenverarbeitung Data mining benötigt NLP keine/kaum Metadatenstandards

6 Information Retrival im heutigen Web Keyword-basiert hoher recall, geringe precision

7 Bildersuche: „Apache“ Maschinen fehlt dieser Kontext aus Begriffen und Zusammenhängen Kontext muss Maschinen zusätzlich bereitgestellt werden AG Netzbasierte Informationssysteme

8 Semantic Web “The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation.“ Foto: W3C Berners-Lee, Hendler, and Lassila, Foto: Homepage

9 Vision von Berners-Lee Webinhalte und ihre Vernetzung werden für Maschinen verständlich. Auch komplexe Anfragen können ans Web gestellt werden. Beispiel: Finde alle Fußballspieler, die bei einem Verein spielen, der ein Stadion mit mehr als Plätzen hat und die in einem Land mit mehr als 10 Millionen Einwohnern geboren wurden. AG Netzbasierte Informationssysteme

10 Das Semantic Web eine Erweiterung des existierenden Web +Metadaten +Ontologien +Reasoning +intelligente Agenten ____________________ = Semantic Web

11 Metadaten Daten über Daten beschreiben Inhalt im besten Fall maschinenverarbeitbar AG Netzbasierte Informationssysteme Data about Data  Autor  Titel  Datum  …  Spezies: Android  Größe:… Inhalt Metadaten

12 Nutzbarkeit von Metadaten durch Ontologien Damit Metadaten nutzbar sind Informationsanbieter muss sich so ausdrücken, dass Informationsnutzer ihn verstehen Informationsnachfrager muss so fragen, dass er etwas finden kann Gemeinsame Benutzung von Konzepten Gemeinsame Sprache Ontologie zur Definition einer gemeinsamen Sprache Es gibt Konzepte, die wir mit „Bank“ und „Sparkasse“ benennen Es gibt ein Konzept, das wir „Geldinstitut“ nennen und das die Konzepte „Bank“ und „Sparkasse“ umfasst AG Netzbasierte Informationssysteme

13 AG Netzbasierte Informationssysteme Semantic Web Stack (W3C, 2000)  Quelle:

14 BasisUnicode jedes Zeichen eigene Nummer (system-, programm- und sprachunabhängig) Unicode-Codierung – Zeichensätze für fast jede natürliche Sprache URI – Uniform Resource Identifier eindeutige Identifikation einer Quelle/Ressource  jedes beliebiege Objekt verfügt über einen URI Mechnismus um Daten verteilt zu repräsentieren Untergruppe von URIs Syntax vom W3C standardisiert AG Netzbasierte Informationssysteme

15 Erster Schritt zum Semantic Web XML + Namensräume + XML-Schema Daten hierarchisch strukturierte, medienneutrale Daten XML-Schema Vokabular kann mit XML-Schema definiert werden Namensräumen Bedeutung des Vokabulars mit Namensräumen festgelegt XLink XML-Daten können mit XLink verlinkt werden: Links können Namen, aber keinen Namensraum haben  maschinenverarbeitbare verlinkte Daten, Links jedoch nicht maschinenverarbeitbar AG Netzbasierte Informationssysteme

16 Zweiter Schritt zum Semantic Web RDF + Namensräume + RDF-Schema Web als Menge vernetzter Ressourcen RDF-Schema Vokabular für Beziehungen kann mit RDF-Schema definiert werden Namensräumen Bedeutung des Vokabulars wird mit Namensräumen festgelegt RDF Modell RDF Modell bietet eine syntaxunabhängige Darstellung  maschinenverarbeitbares Netzwerk von Beziehungen AG Netzbasierte Informationssysteme

17 Resource Description Framework RDF – W3C Recommendation seit 1999 verschiedene Versionen: -kompakt und lesbar -für maschinelle Verarbeitung Tripel setzen bel. Web-Ressourcen URI-s und URI-o miteinander in Beziehung: URI-s steht zu URI-o in der Beziehung URI-p AG Netzbasierte Informationssysteme

18 AG Netzbasierte Informationssysteme RDF Sätze Informationen und Metainformationen: In RDF als Satz ausgedrückt: Metainfo hat als Autor Info " Subjekt hat als Autor Prädikat Robert Tolksdorf" Objekt

19 AG Netzbasierte Informationssysteme In RDF definiert Robert Tolksdorf Aus so explizit gemachten und maschinenverständlich repräsentierten Aussagen können Tools und Dienste inhaltliche Schlüsse ziehen Prädikat Subjekt Objekt

20 AG Netzbasierte Informationssysteme Abkürzung In Autor können keine weiteren Elemente stehen, also auch als XML-Attribut repräsentierbar:

21 AG Netzbasierte Informationssysteme Verweise auf Ressourcen als Objekte Objekte können selber auch Subjekte sein: Autor "RT" Name

22 AG Netzbasierte Informationssysteme Aussagen über Aussagen „Marko Harasic sagt `Robert Tolksdorf ist der Autor seiner Homepage´“ Robert Tolksdorf Marko Harasic Autor MH Gesagt von

23 AG Netzbasierte Informationssysteme Semantic Web Semantic Web: Verteiltes Geflecht aus getypten Beziehungen zwischen Konzepten hat den Autor  "RT" Name Semantic Web Geeignet für eLearning Gesagt von

24 AG Netzbasierte Informationssysteme Datenmodell „RDF-Welt“: Gerichteter Graph Knoten (Ressourcen) Kanten (Properties) Ressourcen (RDF Resource) Alles worüber man Aussagen machen kann Identifiziert durch URIs (qualified URIs = URI + fragment identifier) Aussagen sind auch Ressourcen Eigenschaften/Beziehungen (RDF Property) Verbinden Ressourcen miteinander oder Ressourcen zu Werten (RDF Literal) Aussagen (RDF Statement) (Subjekt, Prädikat, Objekt) “Resource has Property with Value”

25 AG Netzbasierte Informationssysteme RDF ID Fragment identifier (eindeutig im Dokument) Abkürzung der vollständigen URI einer Ressource Vollständiger Name zusammengesetzt aus: Base URI (xml:base = …) # Wert von rdf:ID Beispiel

26 AG Netzbasierte Informationssysteme RDF Container Mengenobjekte (geordnet, ungeordnet, mit Duplikaten, ohne Duplikaten, offen) Ermöglichen Aussagen über mehrere Ressourcen Platzhalter für komplexe Mengenobjekte (vs. Blank Node)

27 AG Netzbasierte Informationssysteme Container-Typen 3 Typen von Containern Bagungeordnete Listerdf:Bag Sequencegeordnete Listerdf:Seq Alternativeeindeutiger Wertrdf:Alt Containers sind auch RDF Ressourcen Semantik: offene Mengen unbekannt ob weitere Elemente zu der Menge gehören

28 AG Netzbasierte Informationssysteme Beispiel Aussage: die Webseite „ wurde erstellt von Robert Tolksdorf und MH und … Autor-Container-URI Autor rdf:Bag MH URI … rdf:type rdf:_1 rdf:_2 rdf:_3

29 AG Netzbasierte Informationssysteme Alternative Modellierung MH URI … Autor

30 AG Netzbasierte Informationssysteme Multimengen (Bags) Ungeordnete Liste von Werten, Duplikate möglich Eigenschaft hat mehrere Werte, die Elemente der Menge z.B. Mitglieder einer Gruppe, Dateien in einem Verzeichnis

31 AG Netzbasierte Informationssysteme Liste (Sequence) Geordnete Liste von Werten, Duplikate möglich Eigenschaft hat mehrere Werte, die Elemente der Menge, deren Reihenfolge wichtig ist z.B. Buch/Artikelautoren, Punkte in einer Tagesordnung …

32 AG Netzbasierte Informationssysteme Auswahl (Alternative) Liste von Werten Eigenschaft hat einen Wert, der aus der Auswahl stammt z.B. document home and mirrors, mailing-list moderators

33 AG Netzbasierte Informationssysteme RDF about about direkte Angabe des URI <rdf:Description rdf:about=" August 16, 1999 aboutEach URI eines Containers Property auf alle Elemente angewendet aboutEachPrefix URI Präfix Eigenschaft auf alle Ressourcen mit dem Präfix angewendet

34 AG Netzbasierte Informationssysteme RDF Collections Ähnlich zu Containern, aber geschlossen: Alle Elemente einer Menge sind spezifiziert Zugriff auf einzelne Mengenelemente rekursiv first (erstes Element) rest (restliche Elemente) nil (leere Menge)

35 AG Netzbasierte Informationssysteme RDF Blank Nodes Anonyme Ressourcen (haben keine URI) Platzhalter für komplexe Objekte Ressourcen von unbekannten Typ Aussage: die Webseite „ wurde erstellt von jemanden/etwas mit dem Namen „RT“ und der -Adresse "RT" Name Autor Blank Node

36 AG Netzbasierte Informationssysteme Beispiel Aussage: Die Vorlesung „XML-Technologien“ wird veranstaltet von Robert Tolksdorf und Marko Harasic V XML-URI _x:1 Veranstalter MH URI_x:2 rdf:nil rdf:first rdf:rest Blank Node rdf:first rdf:rest

37 AG Netzbasierte Informationssysteme RDF Syntax Datenmodell Graphenstruktur: Knoten (Ressourcen, Werte) Kanten (Properties) Verschiedene syntaktische Formate RDF/XML Syntax N3 …

38 AG Netzbasierte Informationssysteme Warum ist RDF nicht ausreichend? RDF Sprache für die Darstellung von Aussagen im Web definiert ein Datenmodel: Ressourcen minimal typisiert Semantik der Ressourcen minimal spezifiziert Notwendig Erweiterung von RDF für die Beschreibung von semantisch komplexere Vokabularien

39 AG Netzbasierte Informationssysteme RDF Schema Grundlegende RDF Mechanismen: einfache Aussagen auf vielfältige Weise treffen RDF Schema: einige Typen von Aussagen für nützliche Modellierungsaussagen in Schemas: „Jede Webseite hat einen Autor“ „Webseiten sind elektronische Dokumente“

40 AG Netzbasierte Informationssysteme RDF Schema Elektronischen Dokumente bilden eine Klasse: <rdf:type rdf:resource= " Web-Seiten sind elektronische Dokumente <rdf:type rdf:resource= " Web-Seiten haben eine URL <rdfs:range rdf:resource= "

41 AG Netzbasierte Informationssysteme Schema für RDF Dinge Ressourcen rdfs:Resource Alles, was durch RDF Sätze beschrieben werden kann rdf:type Eigenschaft aller Dinge, die Klasse oder Typ angibt Nutzerdefiniert: Vorgegeben:

42 AG Netzbasierte Informationssysteme Schema für RDF Dinge Klassen rdfs:Class Dinge, die Typen oder Klassen repräsentieren, also von anderen Dingen abstrahieren rdfs:subClassOf Eigenschaft einer Klasse, die Generalisierung angibt

43 AG Netzbasierte Informationssysteme Beispiel [Bild:

44 AG Netzbasierte Informationssysteme Schema für RDF Dinge Werte rdfs:Literal Die Klasse aller Werte Plain literals: UNICODE-Zeichenketten PowerSystemResource Typed literals: spezifiziert den Datentyp eines Literals RT

45 AG Netzbasierte Informationssysteme Schema für RDF Dinge Eigenschaften rdf:Property Alle Ressourcen, die Eigenschaften sind rdfs:range Einschränkende Eigenschaft Wertebereich rdfs:domain Einschränkende Eigenschaft Herkunftsbereich <rdf:type resource= "

46 AG Netzbasierte Informationssysteme Schema für RDF Dinge Eigenschaften rdfs:subPropertyOf Eigenschaft ist Spezialisierung einer (oder mehrerer) anderer Eigenschaften

47 AG Netzbasierte Informationssysteme Schema für RDF Dinge Eigenschaften rdfs:label Menschenlesbarer Name der Ressource rdfs:comment Menschenlesbare Beschreibung der Ressource PowerSystemResource "A power system component that can be either an individual element such as a switch or a set of elements such as a substation. PowerSystemResources that are sets could be members of other sets. […]“

48 AG Netzbasierte Informationssysteme Beziehungen zwischen Ressourcen rdfs:seeAlso Verweist auf Ressource, die weitere Informationen über das Subjekt liefern kann <rdf:RDF xmlns:rdf=" " xmlns:rdfs=" xmlns=" Dan Brickley  [

49 AG Netzbasierte Informationssysteme Beziehungen zwischen Ressourcen rdfs:isDefinedBy Ressource, die das Subjekt definiert, z.B. ein Schema  [

50 AG Netzbasierte Informationssysteme Überblick: RDFS Ressourcen, Klassen, Eigenschaften Z.B.: rdf:Statement ist vom Typ rdfs:Class Die Property rdf:type ist eine Subklasse der Klasse rdfs:Property  Abb.: © 2001 W3C [Bild:

51 AG Netzbasierte Informationssysteme Technologien des Semantic WebOntologien  Vokabulare  Begriffsbeziehungen (Unterklasse, Untereigenschaft, Wertebereiche,..., selbstdefinierte)  Sprache für Web-Ontologien:  OWL – Web Ontology Language  Erweiterte Beschreibungsmöglichkeiten  In unterschiedlichen Komplexitäten (OWL-Lite, OWL-DL, OWL-Full)  mittlerweile OWL 2 mit feinerer Unterscheidung der Komplexität

52 Technologien des Semantic WebRegelsprachen bilden die Grundlage für das logische schließen auf Basis semantischer Daten früher SWRL (echte Regelsprache für OWL) als Teil des Layer Cakes heute RIF als ein Austauschformat zwischen unterschiedlichen Regelsystemen AG Netzbasierte Informationssysteme

53 Inferenz Alle Menschen sind sterblich Sokrates ist ein Mensch  Sokrates ist sterblich AG Netzbasierte Informationssysteme foaf:Agent foaf:Person Ex:Marko rdfs:subClassOf rdf:type Einfache RDF(S)-Inferenz ex:Marko rdf:type ex:Nichtraucher ex:Marko rdf:type ex:Raucher mit RDF(S) nicht möglich festzustellen

54 Inferenz (cont.) Klassenäquivalenz Unterklassenbeziehung Klassendisjunktheit Globale Konsistenz Klassenkonsistenz Instanzüberprüfung Klasseninstanzen AG Netzbasierte Informationssysteme

55 Technologien des Semantic Web Anfragesprache SPARQL Dient zur Abfrage von Instanzdaten in einer RDF-Datenbank „Gib mir alle Menschen, die vor 1900 in Berlin geboren wurden“ SELECT ?name ?birth ?death ?person WHERE { ?person dbpedia2:birthPlace. ?person dbo:birthDate ?birth. ?person foaf:name ?name. ?person dbo:deathDate ?death FILTER (?birth < " "^^xsd:date). } ORDER BY ?name AG Netzbasierte Informationssysteme

56 SPARQL Graph Pattern als Anfragemuster SELECT DISTINCT ?player { ?s foaf:page ?player. ?s rdf:type. ?s dbpedia2:position ?position. ?s ?club. ?club ?cap. ?s ?place. ?place ?population ?pop. OPTIONAL {?s ?tricot.} Filter (?population in (,, )) Filter (xsd:int(?pop) > ). Filter (xsd:int(?cap) >40000 ). Filter (?position = || ?position = || ?position = ) } Limit 1000 AG Netzbasierte Informationssysteme Beispiel: Finde alle Fußballspieler, die bei einem Verein spielen, der ein Stadion mit mehr als Plätzen hat und die in einem Land mit mehr als 10 Millionen Einwohnern geboren wurden.

57 SPARQL Ergebnis (nicht RDF) … AG Netzbasierte Informationssysteme

58 AG Netzbasierte Informationssysteme Weitere Technologien des Semantic WebLogik  Semantik auf logischer Basis  AbleitungsregelnProof  Konsistenz  Ableitung (Inferenz)Trust  Immer noch in der Forschung