Ontologien - Eine Einführung Formale Ontologie & Semantic Web Vorlesung „Wissensrepräsentation“ Prof. G. Brewka Ontologien - Eine Einführung Formale Ontologie & Semantic Web Frank Loebe frank.loebe@informatik.uni-leipzig.de Abt. Intelligente Systeme Institut für Informatik Universität Leipzig
Übersicht Historische Motivation Begriffsbestimmung Anwendungen Einteilungen Top-level Ontologien Ontologie im / und Semantic Web Forschungsbereiche Box: neues Thema Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Ontologie: intuitiv ähnlich konzeptueller Modellierung bei Software-Entwicklung gegeben: eine Domäne oder Aufgabe Frage: Worüber (= über welche Entitäten / Dinge / ...) ist dabei zu sprechen? Bsp: Domäne Uni-Sommerkurs Personen, Studenten, Lesende, Professoren, Tafeln, ... Kurse, Vorlesungen, Übungen, Vorlesungsbesuche, ... Termine, Hörsäle, ... Themen, Probleme, Theoreme, ... Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Historische Motivation: Wiederverwendbarkeit von Wissensbasen 1980er: diverse WBS, Austausch nur durch Rekodierung Probleme: verschiedene Repräsentations-sprachen & Dialekte fehlende Kommunikations-standards (für Austausch zw. WBS) unterschiedliche Terminologie / Konzeptualisierung / Ontologie im Ergebnis: Interesse an Standardsprachen Ontologie Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme [Neches et al., 1991]
Semantic Web ca. 2000-2001: Vision des Semantic Web Hauptziel: Anreicherung der Informationen im Internet, um diese besser automatisiert verarbeiten zu können Bsp.: Einkauf im Web über Agenten Ontologie(n) als Schlüsseltechnologie derzeit: Web 2.0 Ergänzung oder Gegenspieler des Semantic Web ? [W3C, 2000] Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Begriffsbestimmung Drei Leseweisen für „Ontologie“ 1.) philosophisch: Fach Ontologie 2.) informatisch / in KI: Ontologie als Begriffssystem 3.) Spezialfall von 2.): Ontologie im Semantic Web: Ontologie als Technologie Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Begriffsbestimmung: Ontologie (I) Philosophie: Fach „Ontologie“ (Ontology) etymologisch: aus dem Griechischen „ontos“ – Sein „logos“ – Lehre, Wort Lehre vom Sein / Seienden Systeme grundlegender Kategorien oft reduktionistisch Definitionen: „As a first approximation, ontology is the study of what there is.“ [Hofweber, 2004, SEP] „Theorie kategorialer Folgerungen“ [Seibt, 2004] „... the systematic, formal, axiomatic development of the logic of all forms and modes of being.” [Cocchiarella, 1991] Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Beispiel: Kategorien- system Substance material immaterial Body Spirit animate inanimate Living Mineral sensitive insensitive Animal Plant rational irrational Human Beast [Sowa, 2000] Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Begriffsbestimmung: Ontologie (II) „eine Ontologie“ in der Informatik (ontology) Spezifikation / Theorie von Begriffen und deren Zusammenhängen Zweck: gemeinsames / geteiltes Verständnis Definitionen „... an explicit specification of a conceptualization.“ [Gruber, 1993] „... an ontology defines a set of representational primitives with which to model a domain of knowledge or discourse.“ [Gruber, 2008] „An ontology is a logical theory accounting for the intended meaning of a formal vocabulary, i.e., its ontological commitment to a particular conceptualization of the world.“ [Guarino, 1998] Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Tutorialbeispiel: Pizza-Ontologie (in Protege) [http://www.co-ode.org/resources/tutorials/protege-owl-tutorial.php] Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Abgrenzungen Ontologien vs. Wissensbasen ontologisch: Wenn X ein Objekt ist, kann X kein Prozess sein. dagegen nicht: John ist 80 kg schwer. Um das Essen auszuwählen, wird zuerst die Karte studiert. Ontologische/Terminologische Fakten [Brachman, Levesque, 2004] Unterkategorien / Spezialisierung Student is-a Person Disjunktheit Student und Vorlesung Überdeckung (Exhaustiveness) Mann, Frau für Person Typrestriktionen für Relationen nur Personen lehren inverse Relationen versch. Relationseigenschaften, z.B. Transitivität, Symmetrie Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Übersicht Historische Motivation Begriffsbestimmung Anwendungen Einteilungen Top-level Ontologien Ontologie im / und Semantic Web Forschungsbereiche Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Anwendungen (I) Medizin & Biologie: Terminologien & Ontologien ICD: K09.0 K00-K93 Krankheiten des Verdauungssytems K00-K14 Krankheiten der Mundhöhle, der Speicheldrüsen und der Kiefer K09.- Zysten der Mundregion, anderenorts nicht klassifiziert K09.0 Entwicklungsbedingte odontogene Zysten (u.a. Keratozyste) SNOMED, GALEN, FMA, UMLS ... OBO: Open Biomedical Ontologies Gene Ontology, Mouse Anatomy, Celltype Ontology, ... Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Bsp.: UMLS (Auszug) Entity Physical Object Organism Plant Alga Fungus Virus ... Substance Conceptual Entity Idea or Concept Finding Language Event Activity Behavior Social Behavior ... Machine Activity Phenomenon / Process Human caused P/P Natural P/P Biologic Funct. Pathologic F. Injury or Poisoning Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Anwendungen (II) Anwendungszwecke Anwendungsgebiete korrekte Wiederverwendung von Informationen & Softwarekompon. Fehlererkennung / -vermeidung Vereinfachung von Datenintegration und Interoperabilität „semantische“ Verarbeitung, z.B. semantische Suche Grundlage/Ergänzung für Methoden der Domänenmodellierung Anwendungsgebiete Knowledge Engineering & Representation *-Integration (Datenintegration, Unternehmensintegration, ...) Wissensmanagement Konzeptuelle Modellierung, Datenbankentwurf Sprachverarbeitung Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Einteilung von Ontologien Spezifikation / Theorie von Begriffen und deren Zusammenhängen historisch gewachsen im KI-Bereich Aufgaben-Ontologie + Domänenontologie = Anwendungsontologie „Spezifikation“ nach Formalisierungsgrad „Begriffe“ nach Allgemeinheitsgrad nach Domäne (Bio-, Medizin-, Business-, ... Ontologien) außerdem: linguistische Ontologien z.B. Wordnet Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Ontologie-Arten: nach Formalisierung informal informal Begriffsliste, (kontrolliertes) Vokabular, Katalog, Glossar ggf. auch: Text Begriffshierarchie Taxonomie, Nomenklaturen z.B. ICD, UNSPSC, ... semiformal Thesaurus, semantisches Netz, UML- oder ER-Diagramme z.B. FMA, MeSH, WordNet, ... formal formalisierte logische Theorie, z.B. in FOL, DL z.B. SNOMED, GALEN formal Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Ontologie-Arten: nach Allgemeinheit Top-level-Ontologie Kategorien für die meisten Anwendungsbereiche Bsp.: Objekt – Prozess – Qualität Kern-Ontologie (Top-Domänen-Ontologien) Kategorien für einen größeren Anwendungsbereich Bsp.: Mensch – Krankheit – Größe Domänen-Ontologie Kategorien für einen spezifischen Anwendungsbereich Bsp.: Leukozyt – chronisch lymphatische Leukämie Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Top-level Ontologie(n) Ziel: Charakterisierung von Begriffen, auf die die meisten Domänen zurückgreifen allgemeinste Begriffe Themen: Individuen und Kategorien – Raum, Zeit Objekte, Prozesse – Situationen, Fakten Eigenschaften, Relationen Mereologie (Teil-Ganzes Beziehung) Kausalität Rollen, Funktionen – Löcher – Granularität Repräsentation, Symbole, Information ... Systeme: BFO, (tlw. CYC), DOLCE, GFO, SUMO, ... Abgrenzung allgemeinste Begriffe, keine Commonsense-Wissensbasis (z.B. CYC) linguistische Ontologien: WordNet Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
General Formal Ontology (GFO) Darstellungen informal: Report “General Formal Ontology (GFO): A Foundational Ontology Integrating Objects and Processes“ (v 1.0.1: 2007) weitere Publikationen formal: tlw. Axiomatisierungen in FOL: ca. 300 Formeln (Axiome, Definitionen, Folgerungen) in OWL: 77 Klassen, 67 Relationen http://www.onto-med.de/ontologies/gfo.owl Status begonnen ca. 1999 ständige Erweiterung & Weiterentwicklung erste Anwendungen neue Anforderungen Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
General Formal Ontology (GFO) Grundeinteilungen Kategorien und Klassen Raum und Zeit Qualitäten und Relationen Objekte und Situationen Entitäten Prozesse Individuen* ... Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
GFO Kategorien-Hierarchie (2006) entity category concrete entity immanent universal conceptual structure symbolic structure individual quality relator (relational) role persistant property relation formal relator material relator space-time entity presential material structure spatial entity time entity material boundary occurrent configur- ation time region time boundary space region spatial boundary material object process change situation situoid topoid chronoid Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
GFO Grundrelationen (2006) formal relator boundary projection element-of instantiation at projection association location framing ontical connectedness occupation chron top participation boundary-of fills- role role-of relativized part-of abstract part-of right boundary left boundary status: 25.07.2007, FL version has-quality value-of constituent part-of inherence coincidence spatial part-of congruence temporal part-of extension space Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Übersicht Historische Motivation Begriffsbestimmung Anwendungen Einteilungen Top-level Ontologien Ontologie im / und Semantic Web Forschungsbereiche Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Ontologie im / und Semantic Web Prinzipien für das Semantic Web Identifizierbarkeit über URIs Semantische Typisierung von URIs Partielle Informationen Open World Assumption keine globale Konsistenz erwartet / angestrebt Ontologie: RDF: Ontologien als Graphen Web Ontology Language OWL: Ontologien als Beschreibungslogik- Theorien [W3C, 2000] Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
OWL Ontologien (technologisch) Standard seit 2004 (OWL 1.0) OWL 1.1 bereits definiert mittlerweile recht ausgereifte Systeme zur Unterstützung Ontologie-Editoren, z.B. Protege Beweiser für OWL Anwendung als Technologie Datenmodell wird als „Ontologie“ ausgedrückt Beweiser übernimmt bestimmte Aufgaben, z.B. Klassifikation: Inferenz der Taxonomie Konsistenzprüfung Kombination mit Abfrage-Sprachen (wie SPARQL) Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
OWL (formal): Beschreibungslogik Beschreibungslogiken (DLs): Repräsentationsformalismen für terminologisches Wissen gesucht: DLs mit „guten“ Berechenbarkeitseigenschaften, effizient implementierbar Modellierungsprimitive Konzepte (unäre Prädikate) Rollen (binäre Prädikate) Konstruktoren / Konstruktionen (ALCUE = S, HOINQRF) OWL 1.0 - SHOIN OWL 1.1 - SROIQ Bsp.: Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Ontologie-Forschung Problemfeld: Ontologie-Erstellung Ontological Engineering Methodologien zur Ontologie-Erstellung Ontologie-Editoren / Verwaltungstools Lernen / Verfeinerung von Ontologien Problemfeld: Ontologie-Integration Vergleiche, Abbildungen, kombinierte Verwendung Suche nach weitgehend automatischen Verfahren Problemfeld: Ontologie-Verwaltung Modularisierung Versionierung Evaluation Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Zusammenfassung Definitionen Hintergrund & Zielstellung Ontologie vs. Ontologien, Semantic Web Ontologien Hintergrund & Zielstellung semantische Interoperabilität Wiederverwendbarkeit unterstützen (z.B. von Software) Anwendungsbereiche vielfältig, viele Systeme derzeit in Biologie & Medizin Einteilungen nach Formalisierungsgrad (weniger relevant für SW) nach Allgemeinheit der Inhalte (Top-level ... Domänenontologien) Semantic Web Ontologien werden erfasst in OWL, basieren auf Beschreibungslogik Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Referenzen Cocchiarella, Nino 1991 „Formal Ontology“, In: Handbook of Metaphysics and Ontology, p.640-647, Philosophia. Guarino, Nicola 1998 „Formal Ontology and Information Systems“, In: FOIS Proceedings, p.3-15, IOS Press. Gruber, Tom 1993 „A Translation Approach to Portable Ontology Specifications”, Knowledge Acquisition 5(2):199-220. Gruber, Tom 2008 „Ontology“, to appear in: Encyclopedia of Database Systems, Springer. Herre et al., 2007 General Formal Ontology (GFO) – A Foundational Ontology Integrating Objects and Processes, Version 1.0.1 (draft). University of Leipzig. Neches et al., 1991 „Enabling Technology for Knowledge Sharing”, AI Magazine 12(3):36-56. Seibt, Johanna 2004 pers. Kommunikation. Sowa, John F. 2000 „Knowledge Representation“, Brooks/Cole. W3C 2000 (Berners-Lee, Tim) „Semantic Web – XML2000“, Slides. Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme