Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Michael Klein, Dieter Fensel, Frank van Harmelen and Ian Horrocks

Ähnliche Präsentationen


Präsentation zum Thema: "Michael Klein, Dieter Fensel, Frank van Harmelen and Ian Horrocks"—  Präsentation transkript:

1 Michael Klein, Dieter Fensel, Frank van Harmelen and Ian Horrocks
Seminar : Informationsextraktion Sascha Hennig The Relation between Ontologies and Schema-languages: Translating OIL-specifications in XML-Schema Michael Klein, Dieter Fensel, Frank van Harmelen and Ian Horrocks (2000) 17. September 2018

2 0.Vorschau Einleitung XML-Schema OIL Vergleich XML-Schema & OIL
Übersetzung : OIL in XML-Schema Fazit Vorschau

3 1. Einleitung Einleitung Semantic Web
„The Semantic Web is an extension of the current web in wich information is given well-defined meaning, better enabling computers and people to work in cooperation.“ (Tim Berners- Lee) Ontologie wohldefiniertem Vokabular einer Domäne hierarchische Beschreibung von Konzepten (z.B. Student) Definition von Beziehungen zwischen Konzepten (z.B. Professor prüft Student) Web um semantische Informationen ergänzen (Semantische Schicht), zur automatisierung von suche u.ä. Machinenlesbare Form Nicht kognitives Denken wie Menschen, sondern Möglichkeit zur selbständigen Schlußfolgerung (inference) Domäne der Uni (Veranstaltungen, Studenten, etc.) Konzepte = z.B. der Student Eigenschaften wie Beziehungen zwischen Konzepten (Professor prüft Student) Einleitung

4 1.Einleitung physikalische Ebene (HTTP, TCP, etc.)
Das World Wide Web: Große Menge an Daten, Organisationen, Communities, etc. Einfacher Zugriff (URLs, Links, Suchmaschinen) Standards : physikalische Ebene (HTTP, TCP, etc.) syntaktische Ebene (HTML) Erfolg, aber auch Probleme Einleitung

5 1.Einleitung Lösung : XML (eXtensible Markup Language) Einleitung
Problem : HTML (HyperText Markup Language) vermischt Layout- und Logische-Ebene geringe Anzahl logischer Tags (i.w. Titel, Paragraph, Aufzählungen)  eingeschränkte logische Strukturierung geringe Anzahl layout Tags einfache Handhabung von html & seine standardisierung führt zum schnellen Wachstum des Web Jedoch keine ausreichenden Strukturierungsmöglichkeiten Lösung : XML (eXtensible Markup Language) Einleitung

6 1.2 XML öffnendes Tag (Elementanfang) <Informatik >
<Veranstaltung Name="Informationsextraktion"> <Ort>GB V/R 318</Ort> <Zeit>10:00 Uhr</Zeit> </Veranstaltung> </Informatik> Attribut schließendes Tag (Elementende) DER akzeptierte Standard für Datenaustausch Menschen können „zwischen“ den Tags lesen – Maschinen nicht serielle Syntax für hierarchische Strukturen (Baumstruktur) beliebige Schachtelungstiefe Vergabe eigener Tag-Namen Einleitung

7 2. XML-Schema Möglichkeit zur Einschränkung der Syntax und Struktur eines XML Dokumentes (wie DTD) Definition einer Klasse von XML Dokumenten Vorteile zur DTD: XML-Schema ist selbst XML Dokument Verfügt über große Anzahl Datentypen verbesserte Möglichkeiten eingebettete Tags zu strukturieren Verfügt über Mechanismus für Namensräume Ein Schema definiert eine Klasse von XML-Dokumenten Tools für XML-Dokumente können auch für Schema-Dokumente verwendet werden XML-Schema

8 2. XML-Schema XML-Schema Beispiel: <xs:element name=„Vorlesung">
<xs:complexType> <xs:sequence> <xs:element name="Ort" type="xs:string"/> <xs:element name="Zeit" type="xs:string"/> </xs:sequence> <xs:attribute name="Name" use="required"/> </xs:complexType> </xs:element> einfache und komplexe Elementtypen Datentypen string, integer, etc. XML-Schema

9 2.2 Datentypen XML-Schema Wertebereich (value space):
axiomatisch, per Aufzählung oder durch bilden von Teilmengen bereits definierter Datentypen lexikalischer Bereich (lexical space): Wert eines Datentypen, kann durch ein oder mehrere Literale dargestellt werden (z.B. „100“ oder „1.0E2“) Facetten: fundametale: Ordnung, obere/untere Grenzen, endlich/unendlich, etc. einschränkende: optional; schränken den ursprünglichen Bereich ein (max. Länge/Grösse, reguläre Ausdrücke) value space entsteht axiomatisch (d.h. definition der natürlichen Zahlen intensional definition), Aufzählung (extensional definition) oder Kombination bereits definierter Teilmengen! Lexical space: verschiedene Repräsentationen XML-Schema

10 2.2 Datentypen Facettierung (1)
<xs:element name="Matrikelnummer"> <xs:simpleType> <xs:restriction base="xs:integer"> <xs:minInclusive value="10000"/> <xs:maxInclusive value=" "/> </xs:restriction> </xs:simpleType> </xs:element> <Matrikelnummer>89372</Matrikelnummer> XML-Schema

11 2.2 Datentypen Facettierung (2) <Zeit>10:00 Uhr</Zeit>
(eingebettete/lokale Definition) <xs:element name=„Zeit"> <xs:simpleType> <xs:restriction base="xs:string"> <xs:pattern value="[0-9]{2}:[0-9]{2} Uhr"/> </xs:restriction> </xs:simpleType> </xs:element> - nested Definition <Zeit>10:00 Uhr</Zeit> XML-Schema

12 2.2 Datentypen Facettierung (3) XML-Schema
(globale Definition) <xs:element name="Zeit" type="t_Uhrzeit"/> <xs:simpleType name="t_Uhrzeit"> <xs:restriction base="xs:string"> <xs:pattern value="[0-9]{2}:[0-9]{2} Uhr"/> </xs:restriction> </xs:simpleType> XML-Schema

13 2.3 Strukturen Einschränkung des Inhaltes von Elementen und Attributen (s.o.) Vergrössern der Information von Instanzen, mittels default Werten und Typinformationen Elemente: „einfache“ Elemente haben Datentypen als Inhalt komplexe Elemente haben weitere Elemente als Inhalt gemischte Elemente können beides beinhalten Zusätzlich können Elemente Attribute haben Elemente: (hauptsächlich genutzter primitiver Typ) Einschränkung auf simplen DT (dieser wiederum constraint oder nicht) Constraint auf empty oder keine Angabe von DT Komplexe Element-DT XML-Schema

14 2.3 Strukturen „Vererbung“ (derived type definition) XML-Schema
(Ableitung durch Erweiterung) <xs:complexType name="Person"> <xs:sequence> <xs:element name="Name"/> <xs:element name="Wohnort"/> </xs:sequence> </xs:complexType> <xs:complexType name="t_Student"> <xs:complexContent> <xs:extension base="Person"> <xs:sequence> <xs:element name="Matrikelnummer"> </xs:sequence> </xs:extension> </xs:complexContent> </xs:complexType> XML-Schema

15 2.3 Strukturen derived type definition
Ableitung eines Element-Typs mittels Erweiterung oder Einschränkung eines bestehenden Bildung von Klassenhierarchien nur explizit möglich! XML-Schema

16 3. OIL Ontology Inference Layer
abstrakte Sprache zur Beschreibung von Ontologien modellierende Primitive aus Frame-basierten Ontologien wohldefinierte Semantik, auf Beschreibungslogik beruhend unterstützt automatisierte Schlussfolgerungen (wie Konsistenzprüfungen oder Klassensubsumtion) allgemein bekannten modellierenden Primitiven aus frame-based O O. stellen gemeinsames und geteiltes Verstehen einer Domäne(Fachgebietes), das unetr Menschen und Computern ausgetauscht(vermittelt) werden kann Wohldefinierte, saubere Semantik auf Description Logic beruhend Klassenkonsistenzen und Instanz unter/zuordnung OIL

17 3. OIL Die drei „Wurzeln“ : OIL Bestanteile OILs
DL: Klassen(Konzepte, wie Student, Vorlesung) können anhand ihrer Eigenschaften Beschrieben werden, die eine Instanz erfüllen muß um zu diesem Konzept zu gehören. DL erlauben zusammengesetzte Beschreibungen, einschiessend einschränkungen auf binären Beziehungen(Rollen) zwischen Objekten. OIL enthält die formale Semantik und die Unterstützung von Schlussfolgerungen. Frame: objektorientierter Ansatz. Klassen mit lokalen Attributen. OIL hat die modellierenden Primitiven (wie Klassen) Web standards: stellen die Syntax bereit OIL

18 3.1 OIL Bestandteile Ontologie Behälter
Enthält Meta-Informationen zur Ontologie selbst Metadaten Elemente der Dublin Core Elementen Menge (title, creator, subject, etc.) Ontologie Definition Definition der Klassen (Konzepte) und ihren Beziehungen (Attribute bzw. Rollen) OIL

19 3.2 Ontologie Definition Klassen-Definitionen (class-def): OIL
name : Name der Klasse subclass-of? : muss Unterklasse aller class-expressions der Liste sein slot-constraint* : Klasse muss Unterklasse aller slot-constraints sein type? : primitive oder defined primitive = notwendige Bedingung defined = hinreichende Bedingung class-expression = class-name, slot-constraint oder boolesche Kombination mittels AND,OR oder NOT OIL

20 3.2 Ontologie Definition OIL class-def animal class-def plant
subclass-of NOT animal class-def tree subclass-of plant class-def branch slot-constraint is-part-of has-value tree class-def defined carnivore subclass-of animal slot-constraint eats value-type animal - has-value: Existenz Quantifikator ; value-type: All-Quantifikator OIL

21 3.2 Ontologie Definition Attribut-Definition (slot-def): OIL
name : Name des Slots subslot-of? : slot-def daughter-of subslot-of child-of inverse? : slot-def eats inverse eaten-by properties? : transitive, symmetric transitive : slot-def bigger-than properties transitive OIL

22 3.3 Ontologie Beispiel Bemerkungen :
Die Klassen plant und animal sind disjunkt Die Klasse lion ist Unterklasse von carnivor aufgrund ihrer Definition (da carnivor defined ist!) Die Klassen herbivore und carnivore sind disjunkt (OIL unterstützt mehrfaches Erben) Die Klasse tasty-plant ist inkonsistent OIL

23 4. XML & OIL Verschiedene Aufgaben :
XML-Schemata bieten Strukturen zur Beschreibung von Informationsquellen (Dokumente oder semi-strukturierte Texte) OIL spezifiziert eine Domänen-Theorie (Ontologie) Gemeinsames Ziel : Beide stellen ein Vokabular und Strukturen, die Informationsquellen beschreiben, bereit welche auf den Austausch ausgerichtet sind. XML & OIL

24 4.1 Vergleich Beide haben eine XML-Syntax
XML-Schema hat vielfältige Datentypen, Oil nicht XML-Schema bietet eine Grammatik zur Ableitung von Elementstrukturen (sequence, choice), Oil nicht Vererbung ist in beiden vorhanden, allerdings: XML-Schema wesentlich eingeschränkt DT: Schlußfolgerung wird unentscheidbar oder ineffizient, da es auch implizite Klassenbeziehungen gibt! Das Konzept Datum ist vielleicht relevant, aber nicht seine Repräsentation! Beim Schema wird Vererbung explizit gemacht. Vererbung: XML-Schema bietet nur explizite, einfache Vererbung! Zwei Richtungsvererbung schwer zu modellieren (entweder Restrition oder Erweiterung). XML & OIL

25 5. Oil in XML-Schema Typdefinition : Übersetzung

26 5. Oil in XML-Schema Elementdefinition : Instanz : Übersetzung

27 5. Schlussfolgerung XML-Schema und OIL dienen beide der Erweiterung von (online) Informationsquellen um eine semantische Schicht. Allerdings arbeiten beide auf unterschiedlichem Level der Abstraktion. Sie werden in unterschiedlichen Phasen der semantischen Beschreibung eingesetzt. OIL dient der Modellierung einer Ontologie und XML-Schema dient als Syntax und strukturellen Definition der Quellen. Übersetzung

28 6. Fazit Fazit : Zum automatisieren von Datenaustausch und zur Vereinfachung von Informationsextraktion sind XML-Schema und OIL (in Kombination) wesentliche Erleichterungen Problem : Um die Vision eines „semantic Web“ zu realisieren muss beides auch Standard werden! Fazit


Herunterladen ppt "Michael Klein, Dieter Fensel, Frank van Harmelen and Ian Horrocks"

Ähnliche Präsentationen


Google-Anzeigen