Eigene Erweiterungen für SKOS Klaas Dellschaft klaasd@uni-koblenz.de
Wissensbasen im Semantic Web Überblick Wissensbasen im Semantic Web RDF/OWL-Ontologien T-Box A-Box Modellierung von Thesauri mit SKOS Thesaurus-Schema Thesaurus-Daten Erweiterungen für SKOS SKOS-XL Koordinierte Konzepte Ableitung von Entwurfsmustern
Wissensbasen im Semantic Web
Wissensbasen – RDF/OWL-Ontologien (I) RDF: Resource Description Framework Repräsentiert Aussagen in der Form <Subjekt> <Prädikat> <Objekt> id-4037945-0 rdf:type ThesaurusKonzept id-4037945-0 hatLabel „Mathematiker“ id-4037945-0 ThesaurusKonzept rdf:type hatLabel „Mathematiker“
Wissensbasen – RDF/OWL-Ontologien (II) RDFS: RDF Schema Modellierung des Schemas einer Anwendungsdomäne rdfs:class, rdfs:subClassOf rdfs:property, rdfs:subPropertyOf, rdfs:domain, rdfs:range OWL: Web Ontology Language Erweiterte Modellierungsmöglichkeiten owl:class, owl:unionOf, owl:intersectionOf, owl:sameAs owl:ObjectProperty, owl:DatatypeProperty
Wissensbasen – T-Box vs A-Box T-Box (Terminological Box) Enthält z.B. die Klassen- und Beziehungshierarchie Stellt das Vokabular bzw. Schema einer Ontologie dar A-Box (Assertional Box) Enthält die Aussagen über Individuen bzw. Instanzen Aussagen entsprechen dem durch die T-Box vorgegebenen Schema Inferenz Klassifizierung von Instanzen Ableitung von Beziehungen zwischen Instanzen basierend auf Informationen in der T-Box (z.B. Transitivität) Überprüfung auf Inkonsistenzen und Widersprüche (z.B. disjunkte Klassen)
Modellierung von Thesauri mit SKOS
Modellierungsebenen eines Thesaurus Thesaurus-Schema Label, Konzepte, Relationstypen zwischen Konzepten, … Beispiele: SKOS oder RDA Element Sets T-Box Thesaurus-Daten Konkrete Konzepte/Terme und deren Beziehungen Beispiele: SWD, DDC, LCSH, … A-Box Welche Art von Wissen kann durch einen Reasoner inferiert werden?
SKOS – Modellierung eines Thesaurus-Schemas SKOS wird benutzt um Mengen von Konzepten und deren semantische Beziehungen zu modellieren Konzepte werden in Konzeptschemata gruppiert skos:concept, skos:prefLabel, skos:altLabel, … skos:broader/narrower, skos:related, … Beziehungen zwischen zwei Konzeptschemata skos:exactMatch: Äquivalenz von zwei Konzepten skos:closeMatch: Ausreichend ähnliche Konzepte, um sie in einigen Retrievalanwendungen austauschbar nutzen zu können skos:broadMatch: Hierarchische Beziehung skos:relatedMatch: Assoziative Beziehung
SKOS – Modellierung des Thesaurus-Schemas owl:ObjectProperty rdf:type rdfs:domain skos:Concept skos:semanticRelation skos:Concept rdfs:range rdfs:subPropertyOf skos:broaderTransitive rdf:type owl:TransitiveProperty rdfs:subPropertyOf skos:broader owl:inverseOf skos:narrower
SKOS – Modellierung der Thesaurus-Daten id-4058020-9 skos:prefLabel „Streichinstrument“ skos:broader skos:prefLabel „Violine“ id-4019791-8 skos:altLabel „Geige <Violine>“ skos:broader skos:prefLabel „Elektronische Geige“ id-7694541-8 skos:altLabel „Elektrische Violine“ skos:altLabel „E-Violine“
SKOS – Inferenz von Wissen (I) skos:Concept rdf:type id-4058020-9 skos:prefLabel „Streichinstrument“ skos:broader skos:prefLabel „Violine“ skos:Concept rdf:type id-4019791-8 skos:altLabel „Geige <Violine>“ skos:broader skos:prefLabel „Elektronische Geige“ skos:Concept rdf:type id-7694541-8 skos:altLabel „Elektrische Violine“ skos:altLabel „E-Violine“
SKOS – Inferenz von Wissen (II) id-4058020-9 skos:prefLabel „Streichinstrument“ + skos:broader Transitive skos:broader skos:prefLabel „Violine“ id-4019791-8 skos:broaderTransitive skos:altLabel „Geige <Violine>“ + skos:broader Transitive skos:broader skos:prefLabel „Elektronische Geige“ id-7694541-8 skos:altLabel „Elektrische Violine“ skos:altLabel „E-Violine“
SKOS – Zusammenfassung SKOS = Simple Knowledge Organization System Ziel: Gemeinsames Schema zur Darstellung von Thesauri, Klassifikationssystemen und Taxonomien Konzepte werden in Schemata organisiert Konzepte können annotiert werden mit … … beliebig vielen Labeln (Strings) in beliebigen Sprachen … Notationen (z.B. „368.01023“) … Benutzungshinweisen, Definitionen, Beispielen, … Konzepte können … … in Relation zueinander gesetzt werden … gruppiert werden … aufeinander gemappt werden
Erweiterungen für SKOS: SKOS-XL
SKOS eXtension for Labels (SKOS-XL) Problem: Label sind einfache String-Literale Ein Label kann nicht als Subjekt in RDF verwendet werden Beispiel: Wie können z.B. Akronyme von Synonymen unterschieden werden? skos:prefLabel „Frankfurt <Main> / Deutsche Bibliothek“ id-4071342-8 skos:altLabel „Deutsche Nationalbibliothek“ skos:altLabel „DNB“
SKOS-XL: Modellierung des Schemas skosxl:prefLabel rdfs:range skosxl:Label rdfs:domain skosxl:Label skosxl:literalForm rdfs:range RDF Plain Literal rdfs:domain skosxl:Label skosxl:labelRelation rdfs:range skosxl:Label
SKOS-XL: Modellierung der Daten skosxl:prefLabel _id1 skosxl:literalForm „Frankfurt <Main> / Deutsche Bibliothek“ id-4071342-8 skosxl:altLabel _id2 skosxl:literalForm „Deutsche Nationalbibliothek“ skosxl:labelRelation skosxl:altLabel _id3 skosxl:literalForm „DNB“
SKOS-XL: Kompatibilität zu SKOS Problem: Woher weiß eine SKOS-Anwendung, dass z.B. skosxl:altLabel das gleiche ist wie skos:altLabel? Lösung: Property Chaining in OWL 1.1 (skosxl:altLabel, skosxl:literalForm) ist ein Unterproperty von skos:altLabel Beispiel: Ableitung von skos:altLabel durch Reasoner skos:altLabel id-4071342-8 skosxl:altLabel _id2 skosxl:literalForm „Deutsche Nationalbibliothek“
Erweiterungen für SKOS: Koordinierte Konzepte
Anwendungsfall Darstellung der CrissCross-Relationen zwischen SWD und DDC im Linked Data-Service der DNB Relationen in vier Determiniertheitsgraden: DET 4: vollständige Übereinstimmung zwischen Schlagwort und DDC-Klasse skos:exactMatch? DET 3: wesentliche Übereinstimmung des Begriffsinhalts von Schlagwort und DDC-Klasse skos:closeMatch? DET 2: teilweise Übereinstimmung zwischen Schlagwort und einer umfangreicheren DDC-Klasse skos:broadMatch? DET 1: geringe Übereinstimmung zwischen Schlagwort und DDC-Klasse skos:relatedMatch?
Anwendungsfall – Problematisches Beispiel 5* Naturwissenschaften 6* Technik 59* Tiere (Zoologie) 63* Landwirtschaft DDC 598.5-598.9 Landvögel 636 Viehwirtschaft 598.71 Psittaciformes (Papageienvögel) 636. 68656 Nymphensittiche DET 2 bzw. DET 3 bzw. skos:broadMatch skos:closeMatch SWD Nymphensittich
Anwendungsfall – Lösungsvorschlag Schlagwort im Kontext einer bestimmten Sachgruppe auf die entsprechende DDC-Klasse mappen CrissCross Nymphensittich 598.71 Psittaciformes (Papageienvögel) 636.68656 Nymphensittiche DET 2 DET 3 Linked Data Nymphensittich 590 Tiere (Zoologie) 630 Landwirtschaft 598.71 Psittaciformes (Papageienvögel) 636.68656 Nymphensittiche broadMatch closeMatch Wie repräsentieren wir Kontext in einer SKOS-Erweiterung? Vorschlag?
Koordinierte Konzepte – Modellierung des Schemas dnb:CoordinatedConcept skos:Concept rdfs:subClassOf dnb:coordination-of skos:broader rdfs:subPropertyOf Koordinierte Konzepte dnb:DET4Match skos:exactMatch rdfs:subPropertyOf … dnb:DET3Match skos:closeMatch CrissCross-Relationen
Koordinierte Konzepte – Modellierung der Daten id-4042855-2 „Nymphensittich“ skos:prefLabel sg-630 „Landwirtschaft“ ddc-636.68656 „Nymphensittiche“ _id1 dnb:CoordinatedConcept rdf:type id-4042855-2 sg-630 dnb:coordination-of ddc-636.68656 dnb:DET3Match
Koordinierte Konzepte – Kompatibilität zu SKOS (I) Problem: Werden koordinierte Konzepte durch SKOS-Anwendungen richtig interpretiert? Beispiel: Retrieval eines Buches mit SWD bzw. DDC Begriffsebene SWD DDC 778.932 Tiere – Photographie Tierphotographie 770 Fotografie closeMatch Guido Mocafico, Schlangen Sachgruppe: 770 SW-Kette: Mocafico, Guido/ Tierphotographie/ Schlangen Notation: 779. 32796092 Synthese: 77*.* Fotografie 779.* Fotografien 779.32* einzelner Tiere 779.32796* von Schlangen Titelbestand
Koordinierte Konzepte – Kompatibilität zu SKOS (II) SKOS-Anwendung muss skos:broader-Beziehungen zwischen koordinierten Konzepten ableiten können! Tierphotographie closeMatch 778.932 Tiere – Photographie 770 Fotografie skos:broader Muss automatisch abgeleitet werden! Voraussetzung: skos:broader wird interpretiert wie rdfs:subClassOf! Tierphotographie 770 Fotografie Mocafico, Guido Schlangen
Zusammenfassung SKOS: Gemeinsames Schema zur Darstellung von Thesauri, Klassifikationssystemen etc. im Semantic Web SKOS Erweiterungen: Erweiterungen für das Thesaurs-Schema von SKOS Wie werden Erweiterungen kompatibel gemacht zu bestehenden Anwendungen? Entwurfsmuster 1 Entwurfsmuster 2 Property-Chaining in OWL 1.1 Vererbung von bestehenden SKOS-Elementen