Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

© Fraunhofer FKIE Computerlinguistik apl. Professor Dr. Ulrich Schade Fraunhofer-Institut für Kommunikation, Informationstechnik und Ergonomie

Ähnliche Präsentationen


Präsentation zum Thema: "© Fraunhofer FKIE Computerlinguistik apl. Professor Dr. Ulrich Schade Fraunhofer-Institut für Kommunikation, Informationstechnik und Ergonomie"—  Präsentation transkript:

1 © Fraunhofer FKIE Computerlinguistik apl. Professor Dr. Ulrich Schade Fraunhofer-Institut für Kommunikation, Informationstechnik und Ergonomie 7. Vorlesung ( )

2 © Fraunhofer FKIE Computerlinguistik Einführung Methoden Tagging Formale Methoden Parsing Ontologien Anwendungen Informationsextraktion Maschinelle Übersetzung Textanalyse Inhalt der Vorlesung

3 © Fraunhofer FKIE Computerlinguistik Eigentlich ist die Ontologie eine Disziplin der Philosophie: die Lehre vom Sein bzw. vom Seienden. In der Informatik bezeichnet man damit die Repräsentation von Wissen über einen Gegenstandsbereich. Entsprechend ist es in der Informatik auch möglich über Ontologien (Plural) zu sprechen, wobei sich dann zwei Ontologien in der Art des repräsentierten Wissens bzw. im Gegenstandsbereich unterscheiden. In der Philosophie gibt es dagegen nur eine Ontologie. Ontologien – Definition

4 © Fraunhofer FKIE Computerlinguistik Gruber (1993): An ontology is an explicit specification of a shared conceptualization. explicit – Alles, was ein System wissen soll, muss explizit repräsentiert werden. shared conceptualization – Zu explizieren ist insbesondere auch das, was wir (als Menschen) in der Kommunikation nicht verbalisieren, weil es für uns (als Kommunikationspartner) selbstverständlich ist. Ontologien – Definition

5 © Fraunhofer FKIE Computerlinguistik Mit der Hilfe von Ontologien soll Wissen – auch implizites Wissen, über das Menschen verfügen – für Systeme nutzbar gemacht werden. Das geschieht dadurch, dass dieses Wissen in der Ontologie explizit ausgedrückt wird. Aus diesem Ansatz ergibt sich auch die Beschränkung auf einen Gegenstandsbereich: Um den Umfang des zu repräsentierenden Wissens überhaupt handhabbar zu halten, können sich Ontologien stets nur auf (eingeschränkte) Gegenstandsbereiche (domains) beziehen. Ontologien – Definition

6 © Fraunhofer FKIE Computerlinguistik Was gibt es überhaupt für Arten von Wissen? Was ist der Unterschied zwischen explizitem und implizitem Wissen? Ontologien Wissen

7 © Fraunhofer FKIE Computerlinguistik Deklaratives Wissen Faktenwissen (propositional) Faktenwissen (als Bild, als Film,...) Wissen über den situativen Kontext Wissen über Regeln Prozedurales Wissen Wissen über die Anwendung von Regelwissen Implizites Wissen über das Ausführen von Handlungen Wissen

8 © Fraunhofer FKIE Computerlinguistik Faktenwissen (propositional) Paris ist die Hauptstadt von Frankreich. Faktenwissen (als Bild, als Film,...) deklaratives Wissen

9 © Fraunhofer FKIE Computerlinguistik Wissen über den situativen Kontext Wer ist Sprecher, wer ist Hörer? Wo, wann, warum und wie findet das Gespräch statt? Wissen über Regeln Wenn man eine Telephonnummer nicht weiß, kann man die Auskunft anrufen. Im Deutschen steht bei einer NP der Artikel vor dem Nomen. deklaratives Wissen

10 © Fraunhofer FKIE Computerlinguistik Wissen über die Anwendung von Regelwissen Sprachverarbeitung (wenigstens zum Teil) Turn-Taking Beachten von Verkehrsregeln im Straßenverkehr Implizites Wissen über das Ausführen von Handlungen wie man mit dem Fahrrad fährt wie man geht prozedurales Wissen

11 © Fraunhofer FKIE Computerlinguistik explizit formuliert formal formuliert im Computer nutzbar implizit nicht formuliert, (evtl. sogar nicht formulierbar in der Ontologie nicht repräsentierbar und daher vom Computer nicht nutzbar) explizit versus implizit

12 © Fraunhofer FKIE Computerlinguistik Vorgehensweise Phase 1: Die Machbarkeitsstudie Phase 2: Start / Vorbereitung Phase 3: Aufbau / Verfeinerung Phase 4: Evaluation Phase 5: Applikationen und Evolution wie man eine Ontologie aufbaut

13 © Fraunhofer FKIE Computerlinguistik Vorgehensweise – Die Machbarkeitsstudie Welches Problem ist zu lösen? Gegenstandsbereich Welche Ressourcen stehen zur Verfügung ? Hardware... Software(Protégé ) Personal... Zeit... wie man eine Ontologie aufbaut

14 © Fraunhofer FKIE Computerlinguistik Vorgehensweise – Start und Vorbereitung Was gehört zu dem Problem? Welche problemrelevanten Konzepte umfasst der Gegenstandsbereich? Welche davon sind Klassen und welche sind Instanzen? Welche Attribute der Konzepte sind für die Problemlösung wichtig? Welche Relationen zwischen den Konzepten sind wichtig? Dieser Arbeitsschritt kann mit Papier und Bleistift geleistet werden: Ideen notieren / festhalten! wie man eine Ontologie aufbaut

15 © Fraunhofer FKIE Computerlinguistik Vorgehensweise – Ontologieaufbau Notierte Ideen in Software gießen. Top-Down: Aufbau der Klassen-Hierarchie (Taxonomie) Hierfür kann man evtl. eine Upper Ontology nutzen. Bottom-Up: Extrahiere (halb-automatisch?) Konzepte, Attribute etc. aus vorliegenden Dokumenten und konstruiere dazu eine Klassen-Hierarchie, die diese Konzepte umfasst. wie man eine Ontologie aufbaut

16 © Fraunhofer FKIE Computerlinguistik wie man eine Ontologie aufbaut Subclass Hierarchy Tree entity physical object self connected object region hole astronomical body geographic area geopolitical area water area land area continent island nation state or province address city collection agent process abstract Eine Upper Ontology enthält die Hierarchie allgemeiner Klassen. Das Beispiel stammt von SUMO (Suggested Upper Merged Ontology).

17 © Fraunhofer FKIE Computerlinguistik Die Hierarchie der Objektklassen ist eine Taxonomie, die auf der Relation ISA (water is a substance) aufgebaut ist. Den einzelnen Objektklassen kann man Attribute zuordnen, die sich entlang der Klassenhierarchie vererben. Ontologieaufbau

18 © Fraunhofer FKIE Computerlinguistik Man unterscheidet abstrakte von konkreten Klassen ( vs. ). Nur konkrete Klassen dürfen Instanzen haben. Es empfiehlt sich, dass nur die untersten Klassen der Hierarchie konkrete Klassen sind. Ontologieaufbau Klassen

19 © Fraunhofer FKIE Computerlinguistik Instanzen sind – ganz im Sinne der objekt- orientierten Programmierung – individuelle Exemplare ihrer Konzeptklasse. [Mengentheoretisch sind es Elemente.] Ontologie von Frau Granieczny Ontologieaufbau Instanzen

20 © Fraunhofer FKIE Computerlinguistik Ontologieaufbau – Instanzen Instanzen und spezifische Fakten wie Paris ist die Hauptstadt von Frankreich. stehen in größeren Anwendungen in der Datenbank. Allgemeine Fakten finden sich in der Datenbank (indirekt) und in der Ontologie. Beispiel: Jedes Land hat (genau) eine Hauptstadt. Die Beziehungen zwischen Fakten / Regeln stehen in der Ontologie. Beispiel: Stadt A liegt näher am Äquator als Stadt B, wenn die Zahl, mit der die Breite von A angegeben ist, kleiner ist als die entsprechende Zahl bei B. die Verteilung von Wissen zwischen Ontologie und Datenbank

21 © Fraunhofer FKIE Computerlinguistik Da die Attribute vererbt werden, weist man sie der höchstmöglichen Klasse zu, wobei die Wertebereiche eines Attributs mit zunehmender Hierarchietiefe zunehmend eingeschränkt werden. Ontologieaufbau Attribute

22 © Fraunhofer FKIE Computerlinguistik Attributwerte können vom Typ her sein: Strings, Symbols, Zahlen (Integer, Float), Instanzen, Klassen, spezifische Typen (Datum). Ontologieaufbau Attribute

23 © Fraunhofer FKIE Computerlinguistik Attribute haben manchmal genau einen Wert (Name). Manchmal können sie auch mehrere Werte haben (z.B. für die Relation besteht aus). Ontologieaufbau Attribute

24 © Fraunhofer FKIE Computerlinguistik Je nach Anwendung werden bestimmte Eigenschaften als Attribut oder als Unter-klasse realisiert. So könnte man etwa die Bilder aus der Romantik als Unterklasse der Bilder festlegen. Ontologieaufbau Unterklasse oder Attribute

25 © Fraunhofer FKIE Computerlinguistik Wenn der Wert eines Attributs auf eine andere Klasse bzw. eine andere Instanz der Ontologie verweist, besteht eine Beziehung zwischen den beiden Objekten und damit eine Relation. Im Beispiel haben wir die Relation, dass sich der Elbe Seiten Kanal (bzw. dessen Lokation) unter der Bahnbrücke bei Stortenbüttel befindet. Ontologieaufbau Relationen

26 © Fraunhofer FKIE Computerlinguistik Beispiel 2: Ausstellungsdatum (für Dokumente) Ontologieaufbau Relationen

27 © Fraunhofer FKIE Computerlinguistik Beispiel 3: hat als Ressource Ontologieaufbau Relationen

28 © Fraunhofer FKIE Computerlinguistik Beispiel 4: Metarelation Es gibt auch Metarelationen, etwa um auszudrücken, dass zwei Klassen keine gemeinsamen Instanzen haben. Ontologieaufbau Relationen

29 © Fraunhofer FKIE Computerlinguistik Evaluation Die Ontologie wird auf Mängel hin überprüft. Werden Mängel entdeckt, so führt dies (hoffentlich ) zu einer Überarbeitung der Ontologie; deshalb heißt die dritte Phase auch Aufbau und Verfeinerung. Dabei sind Schleifen normal. wie man eine Ontologie aufbaut Aufbau und Verfeinerung Evaluation

30 © Fraunhofer FKIE Ontologieevaluation Computerlinguistik Ontologien können unter unterschiedlichen Aspekten evaluiert werden: unter technologischen Aspekten unter nutzerbezogenen Aspekten unter formalen Aspekten

31 © Fraunhofer FKIE Ontologieevaluation Computerlinguistik Evaluation in Bezug auf die Technologie einheitliche Syntax Konsistenz; Widerspruchsfreiheit (Überprüfung der Semantik) Skalierbarkeit (Kann die Ontologie leicht erweitert werden? Ist die Nutzung der Ontologie dann noch schnell genug?) Interoperabilität (Kann die Ontologie technisch eingebunden werden; z.B. im Rahmen einer service-orientierten Architektur?)

32 © Fraunhofer FKIE Ontologieevaluation Computerlinguistik Evaluation in Bezug auf den Nutzer Erfüllt die Ontologie die gestellte Aufgabe? Ist die Semantik für den Nutzer verständlich? Bedeuten die Namen für die Konzepte (Klassen, Instanzen) und die Attribute das, was der Nutzer darunter versteht?

33 © Fraunhofer FKIE Ontologieevaluation Computerlinguistik Formale Evaluation Formale Überprüfungen können evtl. mit Tools (z.B. OntoClean) durchgeführt werden. Dazu sehen wir uns ein Beispiel an.

34 © Fraunhofer FKIE Computerlinguistik Definition Eine Eigenschaft ist genau dann für eine Instanz essentiell, wenn diese Instanz diese Eigenschaft immer und notwendigerweise besitzt. Beispiel:Instanz:Angela Merkel essentielle Eigenschaft: weiblich nicht essentielle Eigenschaft:Bundeskanzler sein Ontologieevaluation

35 © Fraunhofer FKIE Computerlinguistik Definition Eine Eigenschaft ist genau dann rigide, wenn diese Eigenschaft für alle Instanzen, die sie besitzen, essentiell ist. Eine Eigenschaft ist genau dann anti-rigide, wenn diese Eigenschaft für keine Instanz, die sie besitzt, essentiell ist. Ontologieevaluation

36 © Fraunhofer FKIE Computerlinguistik Ontologieevaluation Objekt physikalisches Objekt Apfel rotes Objekt

37 © Fraunhofer FKIE Computerlinguistik Applikationen und Evolution In welchen Anwendungen / Systemen kann die entwickelte Ontologie noch verwendet werden? Mit welchen Applikationen kann man das in der Ontologie repräsentierte Wissen abgreifen und nutzen? Unter welchen Umständen bzw. in welchen Zeitzyklen wird die Ontologie an die neusten Entwicklungen angepasst? wie man eine Ontologie aufbaut

38 © Fraunhofer FKIE Literatur Computerlinguistik Guarino, N. & Welty, C.A. (2004). An Overview of OntoClean. Kapitel 8 in Staab & Studer (Eds.), Handbook on Ontologies. Mitkov, R. (2003). The Oxford Handbook of Computational Linguistics. Oxford, UK: Oxford University Press. Sowa, J.F. (2000). Knowledge Representation. Pacific Grove, CA: Brooks/Cole. Staab, S. & Studer, R. (2004), Handbook on Ontologies. Berlin: Springer. Sure, Y., Staab, S. & Studer, R. (2004). On-To-Knowledge Methodology (OTKM). Kapitel 6 in: Staab & Studer (Eds.), Handbook on Ontologies.


Herunterladen ppt "© Fraunhofer FKIE Computerlinguistik apl. Professor Dr. Ulrich Schade Fraunhofer-Institut für Kommunikation, Informationstechnik und Ergonomie"

Ähnliche Präsentationen


Google-Anzeigen