Metadaten als Bausteine des Semantic Web META-LIB Workshop 22 Metadaten als Bausteine des Semantic Web META-LIB Workshop 22. Oktober 2002 Claudia Niederée Fraunhofer Institut Integrierte Publikations- und Informationssysteme Darmstadt niederee@ipsi.fhg.de ipsi.fhg.de
Inhalt Semantic Web: Ziele und Vision Semantic Web: Ansätze zur Realisierung Herausforderungen und Erfolgsfaktoren Referenzen
Die nächste Generation des Web Trends für die nächste Generation des World Wide Web Das Web als Programmierschnittstelle: Web Service Paradigma Semantische Anreicherung für eine verbesserte Informations- und Dienstvermittlung und Kommunikation: Semantic Web "The Semantic Web is an extension of the current Web in which information is given well-defined meaning, better enabling computers and people to work in cooperation." Tim Berners-Lee, James Hendler, Ora Lassila, The Semantic Web, Scientific American, May 2001 [Das Semantic Web ist eine Erweiterung des aktuellen Web, welche die Kooperation zwischen Menschen und Computern erleichtern soll, indem Information eine wohldefinierte Bedeutung zugeordnet wird.]
Suchmaschinen (z.B. Google), Informationsportale World Wide Web - heute Benutzer/Informationskonsument Präferenzen Präferenzen Anfragen Suchmaschinen (z.B. Google), Informationsportale Indexierung, Referenzierung, Sammlung Informations- und Dienstanbieter
Semantic Web - Vision Semantisch angereicherte Information Interpretation S+ Benutzer Präferenzen Termin- kalender … … Termin- kalender Agenten Anfrage/Auftrag Kommunikation, Verhandlung, Planung, Entscheidung, Nachweise Präferenzen Bewertungen, Signaturen, Zertifikate „Trust“-Dienste S+ Informations- und Dienstanbieter
Semantic Web - Realisierung Anreicherung mit semantischen Metadaten Formate und Modelle (Standardisierung) Werkzeuge und Methoden zur Anreicherung Ontologien zur Definition der Semantik Ontologie-Sprachen Software zur Interpretation der Metadaten Ansätze zur Interpretation der Semantik (Intelligente) Agenten + Dienste Sprachen zur Kommunikation zwischen Agenten
Information – Kontext – Interpretation - Semantik Problem: Interpretation von Information, die von einer anderen Partei erstellt worden sind; Zuordnung von Semantik bei der Interpretation von (unstrukturierter) Information hängt auch von deren Kontext ab; z.B „Jaguar“ Menschliche Informationsnutzer können durch ihre kognitiven Fähigkeiten und Erfahrungen diesen Kontext auf vielfältige Weise herleiten, auch wenn er nicht explizit gemacht wird. Problem bei Interpretation von Information durch Software: Kontext muss explizit und formal beschrieben werden, damit ihn die Software zur Interpretation heranziehen kann.
Interpretation von Metadaten „Was meint der Kooperationspartner, wenn er „Jaguar“ sagt?“ Entwicklung und Standardisierung eines gemeinsamen Vokabulars (z.B. Dublin Core) in einer Nutzergemeinde informale Semantik (textuelle Definition) Referenz eines gemeinsamen Kontexts (explizit) Technologie: XML + XML Namespace Anwendungsbeispiel: Suche in den Metadaten verschiedener Informationsanbieter Innerhalb einer Nutzergemeinde Gemeinsames Vokabular Kontext Kontext Kooperation Informationsaustausch Interpretation
Dublin Core Definition Namensräume in XML Verwendete Bezeichner (z.B. Metadaten-Tags) werden zu einem Kontext in Bezug gesetzt Verwendung von URIs (Uniform Resource Identifier) zur Identifikation des Kontexts (allgemein: global gültiger Bezeichner für eine Ressource) Verwendung von benutzerdefinierten Präfixen Dublin Core Definition dc - Dublin Core URI dubcore - Dublin Core URI dc:title dubcor:title
Interpretation von Metadaten Zwischen Nutzergemeinden Realität im Web: Unterschiedliche Vokabulare als Kontext Problem: Konsistente Interpretation Beispiel: Übersetzungsschema zwischen zwei Metadatenformaten im Bibliotheksbereich Vokabular A Vordefiniertes Übersetzungs- schema Vokabular B Kontext Kontext Nutzergemeinde B Nutzergemeinde A Kooperation Informationsaustausch Interpretation
Interpretation von Metadaten Zwischen Nutzergemeinden Übersetzung erleichtert durch gemeinsames Datenmodell Technologie: RDF and RDF Schema Vokabular A Vokabular B Gemeinsames Datenmodell Kontext Kontext Nutzergemeinde A Nutzergemeinde B Kooperation Informationsaustausch Interpretation
Resource Description Framework (RDF) Datenmodell für die Erstellung von Metadaten Zentrales Konzept: Ressource identifiziert über eine URI (Uniform Resource Identifier) Aussagen über Ressourcen beschreiben Eigenschaften von Ressourcen und Beziehungen zwischen Ressourcen Bild A - ist gemalt von - Rembrandt Auch Aussagen über Aussagen möglich Experte B - bezweifelt- Zuordnung R Syntax: XML, Graph, … Zuordnung R URI
RDF Schema Beschreibung bestimmter Klassen von Ressourcen Aufbau von Konzepthierarchien (Zeigen für das Beispiel Jaguar) Definition eigener Vokabulare + Metadatenformate Definition von Beziehungen zwischen Klassen, zwischen Eigenschaften (Properties) sowie zwischen Klassen und Eigenschaften. Definition von Beziehungen zwischen Vokabularen Säugetier rdfs:subClassOf Jaguar rdf:type myJaguar
Interpretation von Metadaten Zwischen Nutzergemeinden Top Level Ontologie Ontologie A Ontologie B Verwendung von Ontologien als Kontext Konzepte und ihre Beziehungen (Hierarchien) Erweiterte explizite Semantik Gemeinsames Datenmodell Kontext Kontext Nutzergemeinde A Nutzergemeinde B Kooperation Informationsaustausch Interpretation
Noch mehr Semantik: Ontologien Erweiterung der Möglichkeiten zur Semantikbeschreibung gegenüber RDF Definition von Eigenschaften von Beziehungen zwischen Klassen Definition von Einschränkungen Definition von Äquivalenzen zwischen Klassen (unterschiedlicher Ontologien) Geeignete Sprachen für Web Kontext noch in der Entwicklung OWL + OWL Lite (Vorgänger: DAML + OIL) Status W3C Working Draft
Ding Top Level Ontologie Lebewesen Gegenstand disjunkt Fahrzeug Tier Jaguar Jaguar
Zusammenfassung Technologien Semantic Web Architektur („Language Tower“)
Herausforderungen und Erfogsfaktoren Entwicklung geeigneter Ontologien Hinreichende Menge an semantisch angereicherten Ressourcen im Web Entwicklung effizienter und effektiver Software zur Interpretation der semantischen Information Entwicklung und Akzeptanz der Anwendungen, die auf diesem Ansatz beruhen („Vertrauen des Benutzers“)
Weiterführende Information Zum Einlesen ins Thema Tim Berners-Lee, James Hendler, Ora Lassila, The Semantic Web, Scientific American, May 2001 (im Web verfügbar) Renato Iannella, An Idiot's Guide to the Resource Description Framework, The New Review of Information Networking, Vol 4, 1998 http://www.dstc.edu.au/Research/Projects/rdf/RDF-Idiot.html Einführungen und Spezifikationen zu RDF, RDF Schema, XML, XML Namespace, OWL, etc. sind beim W3C auf den Web-Seiten zu finden
Vielen Dank für Ihre Aufmerksamkeit! Ende Vielen Dank für Ihre Aufmerksamkeit!