Semantic Web EINFÜHRUNG WAS IST SEMANTIC WEB? CHRISTIAN FUCHS KOMPOSITIONALITÄTSPRINZIP LINGUISTISCHE SEMANTIK GABRIEL REITZ XML & RDF ANDREAS KRÄMER RDFS & OWL LEONARD KRAMER
Gliederung ENTWICKLUNG DES WORLD WIDE WEB PROBLEME DES WORLD WIDE WEB SEMANTIC WEB ALS LÖSUNG ANWENDUNGSMÖGLICHKEITEN METADATEN TAXONOMIE UND ONTOLOGIE
Entwicklung des World Wide Web 1989: Entstehung des World Wide Web (WWW) 1993: Veröffentlichung des ersten Browsers „Mosaik“ ermöglichte die private Nutzung des WWW Erschließung des Web durch die Wirtschaft z.B. Online-Handel, Werbung Web 2.0 verstärkte soziale Interaktion im WWW
Probleme des World Wide Web Große Informationsvielfalt unüberschaubar vorhandene Informationen werden nicht gefunden Suchmaschinen helfen nur bedingt suchen Strings suchen keine Inhalte/Informationen Informationen müssen z.T. impliziert werden
Probleme des World Wide Web Welche Gründe liegen diesem Problem zu Grunde? klassisches Web richtet sich an den Menschen der Mensch kann: die Bedeutung von Informationen verstehen Beziehungen zwischen Informationen herstellen auf neue Informationen schließen
Semantic Web als Lösung 6
Semantic Web als Lösung Teilaufgaben: Suchmaschine: „Augenarzt“, „München“ Augenärzte herausfiltern Adressen im Stadtplan auf Erreichbarkeit prüfen Sprechstunden mit eigenem Kalender vergleichen Termin vereinbaren Termin in eigenen Kalender eintragen Chef informieren optimale Verkehrsverbindung herausfinden Fahrkarte kaufen
Semantic Web als Lösung klassisches Web: Online-Suche Kommunikation über E-Mail Semantic Web: Informationen über Informationen (Metadaten) Beziehungen zwischen Informationen kann hergestellt werden neue Informationen können impliziert werden => ermöglicht maschinelle Erfassung von komplexen Systemen
Navigieren und Suchen Kreuzkatalog Eingrenzen der Suche durch vorgegebene Optionen
Navigieren und Suchen Semantische Suchmaschine lässt Eingaben in natürlicher Sprache zu große Bedeutung von Fragewörtern sucht nach der Information, nicht nach dem String kann aus vorhandenen Informationen auf nicht vorhandene schließen
Personalisierte Informationssysteme Unterstützt die individuelle Informationsverwaltung Übernehmen von operativen und administrativen Aufgaben Beispiel: Arztbesuch Kalender mit Terminplanung automatischer E-Mail-Versand Reiseplanung und -buchung
Metadaten Daten, die Informationen über andere Daten zur Verfügung stellen z.B. Buch -> Autor, ISBN keine eindeutige Unterscheidung (Frage des Standpunkts) Speicherung von Metadaten im Dokument selbst zugeordnetes Nachschlagewerk (z.B. Bücherkatalog, Bibliotheksverzeichnis)
Metadaten Interoperable Metadaten Standards inter: zwischen operabel: es kann damit gearbeitet werden Standards machen Metadaten aus unterschiedlichen Quellen nutzbar
Taxonomie Baumstruktur wird schon häufig verwendet monohierarchisch jede Klasse hat nur eine Oberklasse wird schon häufig verwendet z.B. Bibliothek -> Stockwerke -> Regale -> Bücher Problem: Keine Darstellung von Vernetzungen Lösung: Ontologie!
Ontologie Netzwerk von Informationen mit logischen Relationen formale Beschreibung der Daten Regeln zu deren Zusammenhang kann nicht eingegebene Informationen ergänzen kann Widersprüche erkennen
Ontologie Bestandteile: Begriffe: Stadt, Land Instanzen: München, Deutschland Relationen: München liegt in Deutschland Vererbung: München erbt Eigenschaft „liegt in Europa“ von Deutschland Axiome: „zwischen Deutschland und Amerika gibt es keine Zugverbindung“
Gliederung Linguistische Semantik Intensional Klassematisch Distinktiv Extensional Denotation Konnotation Kompositionalitätsprinzip, Formale Semantik Metasprache Objektsprache
Linguistische Semantik Inhaltliche Bedeutung von sprachlichen Zeichen Zeichen (Morpheme), Wörter (Lexeme), Satzglieder, Teilsätze, Sätze Zeichen Hier: Buchstabe „G“ Gabriel hält einen Vortrag über die Semantik, der unglaublich interessant ist. Wort / Ausdruck Teilsatz Hier: Satzglied Subjekt Hier: Relativsatz Satz
Unterscheidung: Intensional / Extensional Intensionale Semantik Beziehung zwischen verschiedenen Wörtern Gemeinsamkeiten Unterschiede Extensionale Semantik Denotation Konnotation
Intensionale Semantik Merkmale: Unterschiede und Gemeinsamkeiten Gleiche Generation männlich / weiblich Unterschied: männlich / weiblich distinktives Merkmal Gemeinsamkeit: gleiche Generation klassematisches Merkmal Oma Opa Mutter Vater Sohn Tochter
Intensionale Semantik Klassematische Merkmale: grün Distinktive Merkmale: rot Regen nass trocken Licht Sonne Sterne hell Tag Mond dunkel Nacht
Extensionale Semantik Denotation Sachliche, wörtliche Bedeutung Bezug auf Gegenstände aus der Wirklichkeit Konnotation Nebenbedeutungen, Emotionen, Bewertungen Bezug auf Sprecher Zuhörer / Leser
Denotation
Denotation
Konnotation Tatsächliche Bedeutung oft nicht erkennbar: Gabriel hält einen Vortrag über die Semantik, …der unglaublich interessant ist. …der uuunglaublich interessant ist… ;-) …der UNGLAUBlich interessant ist!!!
Fazit: Kompositionalität Anwendung mehrerer Prinzipien notwendig Gottlob Frege: Kompositionalitätsprinzip „Die Bedeutung eines komplexen, d.h. aus Teilausdrücken zusammengesetzten Ausdrucks ist durch die Bedeutungen seiner Teile sowie die Art ihrer Zusammenfügung bestimmt.“ Anwendung auf 3 Ebenen: Wortsemantisch z.B. Determativkomposition: rabenschwarz Satzsemantisch Wörter und deren Verknüpfung Satzbedeutung Formal Metasprachen, Objektsprachen
Formale Semantik Metasprache „Regeln“ zur Analyse der Bedeutung von Komplexen aus der Objektsprache Metasprache Subjekt: Gabriel Prädikat: hält Objekt: Vortrag Gabriel hält einen Vortrag. Zähler: 3 Nenner: 5 Ergebnis: 0,6 3/5 = 0,6 Kopfgesteuerte Schleife zum Errechnen der Fakultät. while(i<zahl){ fakultaet = fakultaet*i; i++;} Objektsprache
XML – eXtensible Markup Language XML steht für “erweiterbare Auszeichnungssprache” XML ist eine Meta-Sprache (“Sprache über Sprache”) DTD (Document Type Definition) grenzen Namensraum für Tags ein Unicode Zeichenkodierung
XML – eXtensible Markup Language XML Dokumente können “wohlgeformt” sein Das Dokument besitzt genau ein Wurzelelement Alle Elemente besitzen eine Start- und eine Endkennung Ein Element darf nicht mehrere Attribute mit dem gleichen Namen besitzen ... Volle Spezifikation unter: http://www.edition-w3c.de/TR/2000/REC-xml-20001006/#sec-well-formed
XML – eXtensible Markup Language Ein Beispieldokument: Deklaration <?xml version="1.0" encoding="utf-8"?> <person> <name>Andreas Krämer</name> <geschlecht>männlich</geschlecht> </person> Start-Tag Wurzelelement Ende-Tag Attribut Selbstschließendes Tag <person name="Andreas Krämer" geschlecht="männlich" />
RDF – Resource Description Framework 1999 von W3C veröffentlicht Formale Sprache zur Beschreibung von Informationen Kombination und Weiterverarbeitung von Informationen Besteht aus Subjekt, Prädikat und Objekt Grundlegendes Darstellungsformat für die Entwicklung des Semantic Web RSS (RDF Site Summary) 1.0 baut auf RDF auf
RDF – Resource Description Framework Darstellung Gerichteter Graph Knoten mit gerichteten Kanten Knoten und Kanten haben eindeutige Bezeichner Keine Baumstruktur http://stammbaum.org/ StammtAbVon http://stammbaum.org/ Säugetier http://stammbaum.org/ Tier
RDF – Resource Description Framework Problem: Unterschiedliche Resourcen können gleiche Bezeichnungen in unterschiedlichen Dokumenten besitzen Lösung: Eindeutige Bezeichner, sogenannte URIs (=Uniform Resource Identifier) URIs beginnen in RDF immer mit http:// Beispiel: http://stammbaum.org/Tier
RDF – Resource Description Framework Beispiel eines RDF Dokuments Deklaration <?xml version="1.0" encoding="utf-8"?> <rdf:RDF xmlns:rdf=http://www.w3.org/1999/02/22-rdf-syntax-ns# xmlns:ex ="http://stammbaum.org/"> <rdf:Description rdf:about="http://stammbaum.org/Säugetier"> <ex:StammtAbVon> <rdf:Description rdf:about="http://stammbaum.org/Tier"> </rdf:Description> </ex:StammtAbVon> </rdf:RDF> Namensraum
RDFS - Einordnung RDFS: Ressource Description Framework Schema Für leichtgewichtige (eng: lightweight) Ontologien XML RDFS Legt Vokabular für RDF fest Besteht aus Klassen und deren Beziehungen RDF Besteht aus Instanzen Nutzt die in RDFS festgelegten Klassen
Zusammenhang RDF und RDFS RDFS: <rdf:RDF xmlns:ex=“http://www.ba-mannheim.de/Semantic/“> <rdfs:Class rdf:about=“&ex;BAStudent“> <rdfs:label>Student an der BA Mannheim</rdfs:label> </rdfs:Class> RDF: <ex:BAStudent rdf:about=“Leonard Kramer“ />
Typische RDFS-Elemente Klassen: Class subClass of (vgl. Java: extends) Label (Erklärung / Bezeichnung für die Klasse) Beziehungen Propertys subPropertyOf domain (schränkt den Wertebereich des Subjekts ein) range (schränkt den Wertebereich des Objekts ein) Piepmatz wirdGefressenVon Raubvogel
Beispiel: Biologischer Stammbaum <rdf:RDF xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#“ xmlns:rdfs=“http://www.w3.org/2000/01/rdf-schema#“ xmlns:ex=“http://www.stammbaum.org#“> <rdfs:Class rdf:about=“&ex;Tiere“> <rdfs:label xml:lang=“de“>Gesamte Tierwelt</rdfs:label> </rdfs:Class> <rdfs:Class rdf:about=“&ex;Säugetiere“> <rdfs:label xml:lang=“de“>Alle Säugetiere</rdfs:label> <rdfs:subClassOf rdfs:resource=“&ex;Tiere“ /> Tiere Säugetiere Unpaarhufer Pferde
Beispiel: Biologischer Stammbaum Tiere Säugetiere Unpaarhufer Pferde Hausesel Hauspferd Stammbaum mit Hierarchie abgebildet Säugetiere gehören zur Gruppe der Tiere
Beispiel: Propertys <rdf:Property rdf:about=“&ex;hatFohlenMit“> <rdf:RDF xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#“ xmlns:rdfs=“http://www.w3.org/2000/01/rdf-schema#“ xmlns:ex=“http://www.stammbaum.org#“> <rdf:Property rdf:about=“&ex;hatFohlenMit“> <rdfs:Range rdf:resource=“#Pferd“ /> <rdfs:Range rdf:resource=“#weiblich“ /> <rdfs:Domain rdf:resource=“#Pferd“ /> <rdfs:Domain rdf:resource=“#männlich“ /> </rdf:Property> Pferd weiblich Pferd männlich hatFohlenMit
Probleme von RDFS Weitere differenzierte Beschreibung von Beziehungen nicht möglich Keine Mengenaussagen Kaum Logikaussagen ableitbar
OWL OWL: Web Ontology Language Im Februar 2004 vom W3C als Ontologiesprache standardisiert Sprich \ˈau̇(-ə)l\ (Englisch: Eule) Hintergrund: Eulen werden mit Weisheit assoziiert
OWL-Versionen OWL Full OWL DL (Description Logics) OWL Lite Sehr ausdrucksstark Wird von aktueller Software nur bedingt unterstützt OWL DL (Description Logics) Teilsprache von OWL Full Wird von aktueller Software fast vollständig unterstützt Quasi-Standard OWL Lite Teilsprache von OWL Full und OWL DL Weniger ausdrucksstark
OWL - Einordnung Für schwergewichtige (eng: heavyweight) Ontologien XML RDFS OWL Nutzt Sprachteile von RDFS Kann Klassen und Beziehungen differenzierter anlegen
Beispiel-OWL-Implementierungen FOAF (Friend of a Friend) Modellierung sozialer Netzwerke Angaben über eine Person, wie Hobbys, Name, Fotos etc… Beer Ontologie zur Beschreibung und Kategorisierung von Biersorten Angaben über Auszeichnungen, Bierart, Brauerei, Zutaten…
OWL in der Praxis Vodafone Live! Mobile Portal Vodafone-Portal für Handy-Downloads (Spiele, Filme, etc…) interne Datenverwaltung mit RDF Verbesserung in der Suche: 50% weniger Seitenaufrufe pro Download Semantic-Web-Suchmaschinen Aggregation von semantischen Daten (s. vorherige Folie) Beispiele: Swoogle, Sindice Ergebnisse können noch nicht überzeugen
Zukunftsperspektive Implementierungen werden ausgereifter Anwendungsspektrum wird wachsen Ontologien stellen die nächste Stufe des Web dar (Web 3.0) Täglich mehr Ontologien verfügbar Neue Geschäftsfelder entstehen Suchmaschinen Spezifische Portale, die in der Lage sind Wissen zu verknüpfen …