Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

für Kommunikation, Informationstechnik und Ergonomie

Ähnliche Präsentationen


Präsentation zum Thema: "für Kommunikation, Informationstechnik und Ergonomie"—  Präsentation transkript:

1 für Kommunikation, Informationstechnik und Ergonomie
Computerlinguistik 8. Vorlesung ( ) apl. Professor Dr. Ulrich Schade Fraunhofer-Institut für Kommunikation, Informationstechnik und Ergonomie

2 Computerlinguistik Inhalt der Vorlesung Einführung Methoden Tagging
Formale Methoden Parsing Ontologien Anwendungen Informationsextraktion Maschinelle Übersetzung Textanalyse

3 Computerlinguistik Verb-Ontologien
Die Ontologieausschnitte, die wir in der letzten Vorlesung herangezogen hatten, um zu verdeutlichen, wie Ontologien erstellt werden, waren im Wesentlichen auf „Objekte“ bezogen, auf Gegenstände wie Kunstwerke oder Fahrzeuge, auf Personen wie Künstler usw. Natürlich ist für einige Problemstellungen auch Wissen über Handlungen oder Ereignisse notwendig. Um solches Wissen abzubilden, müssen wir Ontologien nutzen, deren Konzepte sprachlich als Verben und nicht als Nomen (wie bei einer reinen Objekt-Ontologie) formuliert werden.

4 Computerlinguistik Verb-Ontologie
Subclass Hierarchy Tree entity       physical            object                 self connected object                 region                      hole                      astronomical body                      geographic area                           geopolitical area                           water area                           land area                                continent                                island                                nation                                state or province                                address                                city                 collection                 agent            process       abstract Computerlinguistik Verb-Ontologie In der Upper Ontology SUMO ( ) wird eine „Verb-Ontologie“ unter „process“ integriert.

5 Computerlinguistik Verb-Ontologie
Subclass Hierarchy Tree    entity           physical                object                process                     dual object process                     intentional process                          intentional psychological process                          recreation or exercise                          organizational process                          guiding                          keeping                        maintaining                          repairing                          poking                          content development                          making                          searching                          social interaction                          maneuver                     motion                   internal change                    shape change           abstract Computerlinguistik Verb-Ontologie In SUMO sind auch die „Prozesse“ noch weiter kategorisiert. Als Klassen haben wir dabei dual object process intentional process motion internal change shape change

6 Computerlinguistik Verb-Ontologien Definitionen nach SUMO
„dual object process“ A „process“ that requires two, nonidentical patients. „patient“ (patient process entity) means that entity is a participant in process that may be moved, said, experienced, etc. For example, the direct objects in the sentences 'The cat swallowed the canary' and 'Billy likes the beer' would be examples of patients. Note that the patient of a process may or may not undergo structural change as a result of the process. [...] patient is used when one wants to specify as broadly as possible the object of a process.

7 Computerlinguistik Verb-Ontologien
Sowa (2000 – ) unterscheidet dagegen „patient“ und „theme“: „patient“ An essential participant that undergoes some structural change as a result of the event. Example: The cat swallowed the canary. „theme“ An essential participant that may be moved, said, or experienced, but is not structurally changed. Example: Billy likes the beer.

8 Computerlinguistik Verb-Ontologien
Wir werden auf das System semantischer bzw. thematischer Rollen nach Sowa (2000) weiter unten noch näher eingehen. Die von Sowa gewählte Unterscheidung zwischen „theme“ und „patient“ ist aber nicht unumstritten. So finden wir z.B. bei Nirenburg & Raskin (2004, S. 212f.) folgende Unterscheidung: Theme Definition: The entity manipulated by an action. Semantic constraints: Themes are seldom human. Examples: John kicked the ball. The price is high. The ball rolled down the hill.

9 Computerlinguistik Verb-Ontologien
Wir werden auf das System semantischer bzw. thematischer Rollen nach Sowa (2000) weiter unten noch näher eingehen. Die von Sowa gewählte Unterscheidung zwischen „theme“ und „patient“ ist aber nicht unumstritten. So finden wir z.B. bei Nirenburg & Raskin (2004, S. 212f.) folgende Unterscheidung: Patient Definition: The entity that is affected by an action. Semantic constraints: Typically, patients are human. Examples: Mary gave a book to John. Fred heard music. Bill found himself entranced.

10 Computerlinguistik Verb-Ontologien Unterklassen nach SUMO
zu „dual object process“ substituting, transaction, comparing, attaching, detaching, combining,  separating 

11 Computerlinguistik Verb-Ontologien Definitionen nach SUMO
„intentional process“ A „process“ that is deliberately (intentionally) set in motion by a cognitive agent (CognitiveAgent). „cognitive agent“ A sentient agent with responsibilities and the ability to reason, deliberate, make plans, etc. This is essentially the legal/ethical notion of a person. [...] there may be instances of CognitiveAgent which are not also instances of Human. For example, chimpanzees, gorillas, dolphins, whales, and some extraterrestrials (if they exist) may be CognitiveAgents.

12 Computerlinguistik Verb-Ontologien Unterklassen nach SUMO
zu „intentional process“ intentional psychological process,  recreation or exercise,  organizational process, guiding, keeping, maintaining, repairing, poking, content development, making, searching, social interaction, maneuver 

13 Computerlinguistik Verb-Ontologien Definitionen nach SUMO „motion“
Any „process“ of moving. Unterklassen nach SUMO zu „motion“ body motion, direction change, transfer, transportation, radiating Die klassischen „Motion“-Aktionen wie marschieren oder fahren besitzen bzw. erlauben spezifische Thematische Rollen wie destination, die für andere Klassen weniger typisch sind.

14 Computerlinguistik Verb-Ontologien Definitionen nach SUMO
„internal change“ Processes which involve altering an internal property of an object, e.g. the shape of the object, its coloring, its structure, etc. Processes that are not instances of this class include changes that only affect the relationship to other objects, e.g. changes in spatial or temporal location. Unterklassen nach SUMO zu „internal change“ biological process, quantity change, damaging, chemical process, surface change, creation, state change 

15 Computerlinguistik Verb-Ontologien Definitionen nach SUMO
„shape change“ The process of changing the shape of an object. Unterklassen nach SUMO zu „shape change“ keine Unterklassen Anmerkung: Die Abgrenzung zur Klasse „internal change“ ist unklar.

16 Computerlinguistik Verb-Ontologien
In SUMO sind nicht nur die Taxonomien und die möglichen Attribute (mitsamt Werteinschränkungen) hinterlegt, sondern auch Regeln (Axiome). Ein Axiom für die Klasse „shape change“ lautet z.B.: If alt is an instance of shape change and obj is a patient of alt, then there exists shape attribute property so that property is an attribute of obj immediately before "the time of existence of alt" and property is not an attribute of obj immediately after "the time of existence of alt" or property is not an attribute of obj immediately before "the time of existence of alt" and property is an attribute of obj immediately after "the time of existence of alt".

17 Computerlinguistik Verb-Ontologien Verben haben einen syntaktischen und einen semantischen Rahmen. Den syntaktischen Rahmen nennt man auch „Subkategorisierungsrahmen“ und den semantischen „Valenzrahmen“ (vgl. Helbig, 2006, S. 92). Beispiel: Maria wohnt in Bonn. SYN: wohnen – [SUBJ (NP) | adverbiale Bestimmung des Ortes (PP)] SEM: wohnen – [AGENT, LOCATION]

18 Computerlinguistik Verb-Ontologien
Subkategorisierungsrahmen sind sprachspezifisch, Valenzrahmen nicht. Agent Ziel Instrument Watashi wa Tōkyō e hikōki de ikimasu. Thema PP PP (was mich betrifft Tokio nach Flugzeug mit bewege selbst – höflich) Ich fliege nach Tokio mit dem Flugzeug. Ich fliege mit dem Flugzeug nach Tokio. Subjekt PP PP

19 Computerlinguistik Verb-Ontologien
Subkategorisierungsrahmen sind sprachspezifisch, Valenzrahmen nicht. The widow donates the old Mercedes to the church. Subjekt direktes Objekt Präpositional objekt Die Witwe stiftet den alten Mercedes der Kirche. Subjekt Akkusativ-Objekt Dativ-Objekt Agent Theme Receiver

20 Computerlinguistik Verb-Ontologien
Für uns ist es wichtig, die Taxonomie der Verb-Ontologie so aufzubauen, dass sich Anteile des Valenzrahmens vererben. Beispielsweise gilt für die Klasse „intentional process“ aus SUMO, dass diejenigen Verb, die letztlich unter dieser Klasse zusammengefasst werden, sämtlich in ihrem Valenzrahmen die thematische Rolle „agens“ (Agent) haben (in SUMO „cognitive agent“), wohingegen andere Verb etwa das Satzsubjekt (Aktivsatz) auf „effector“ abbilden.

21 Computerlinguistik Verb-Ontologien
Definitionen und Beispiele nach Sowa (2000): Agent An active animate entity that voluntarily initiates an action. Example: Eve bit an apple. Effector An active determinant source, either animate or inanimate, that initiates an action, but without voluntary intention. Example: The tree produced new leaves.

22 Computerlinguistik Verb-Ontologien
Weitere von Sowa (2000) diskutierten thematischen Rollen sind: Recipient An animate goal of an act. Example: Sue sent the gift to Bob. Beneficiary (Unterrolle zu „Recipient“) A recipient that derives a benefit from the successful completion of the event. Example: Diamonds were given to Ruby.

23 Computerlinguistik Verb-Ontologien
Weitere von Sowa (2000) diskutierten thematischen Rollen sind: Experiencer An active animate goal of an experience. Example: Yojo sees the fish. „Experiencer“ und „Beneficiary“ sind Verfeinerungen zu „Recipient“.

24 Computerlinguistik Verb-Ontologien
Weitere von Sowa (2000) diskutierten thematischen Rollen sind: Result An inanimate goal of an act. Example: Eric builts a house. „Result“ ist das unbelebte Gegenstück zu „Recipient“. Die Unterteilung zwischen „Agent“ und „Effector“ ist ähnlich, aber die Trennlinie verläuft nicht zwischen „belebt“ und „unbelebt“ bei „Initiator“, sondern zwischen „intentional“ und „nicht intentional“ bei der Aktion.

25 Computerlinguistik Verb-Ontologien
Weitere von Sowa (2000) diskutierten thematischen Rollen sind: Patient An essential participant that undergoes some structural change as a result of the event. Example: The cat swallowed the canary. Theme An essential participant that may be moved, said, or experienced, but is not structurally changed. Example: Billy likes the beer.

26 Computerlinguistik Verb-Ontologien
Es soll nochmals betont werden, dass Sowa zwischen der „Essenz“ einer Action und dem „Ziel“ einer Aktion unterscheidet. Zur Essenz gehören die Rollen Patient und Theme, zum Ziel die Rollen „Recipient“ bzw. „Beneficiary“ und „Experiencer“. Im Deutschen sind erstere syntaktisch eher durch einen Akkusativ und letztere eher durch einen Dativ markiert. Nirenburg und Raskin (2004, S. 213) plädieren dafür, nur „Patient“ zu nutzen: „Early implementations of ontological semanitcs, instead of a single patient role, used several: experiencer [Fred heard music] and beneficiary [Mary gave a book to John].

27 Computerlinguistik Verb-Ontologien
Sonstige von Sowa (2000) diskutierten thematischen Rollen sind: Instrument A resource that is not changed by an event. Example: The key opened the door. Matter A resource that is changed by the event. Example: The gun was carved out of soap. Medium A physical resource for transmitting information, such as the sound of speech or the electromagnetic signals that transmit data. Example: Bill told Boris by phone.

28 Computerlinguistik Verb-Ontologien
Sonstige von Sowa (2000) diskutierten thematischen Rollen sind: Location An essential participant of a spatial nexus. Example: [The taxi waits at the station]. Origin A passive determinant source of a spatial or ambient nexus. Example: [George leaves Washington].

29 Computerlinguistik Verb-Ontologien
Sonstige von Sowa (2000) diskutierten thematischen Rollen sind: Path A resource of a spatial nexus. Example: The pizza was shipped via Albany and Buffalo. Destination A goal of a spatial process. Example: Bob went to Danbury. Hier fehlt eigentlich noch Direction. Beispiel: Bob rannte nach Norden.

30 Computerlinguistik Verb-Ontologien
Sonstige von Sowa (2000) diskutierten thematischen Rollen sind: PointInTime An essential participant of a temporal nexus. Example: At 5:25 PM, Erin left. Start A determinant source of a temporal nexus. Example: Bill waited from noon to three.

31 Computerlinguistik Verb-Ontologien
Sonstige von Sowa (2000) diskutierten thematischen Rollen sind: Duration A resource of a temporal process. Example: The truck was serviced for 5 hours. Completion A goal of a temporal process. Example: Mary waited until noon.

32 Experiencer, Recipient
Computerlinguistik Initiator Resource Goal Essence Action Agent, Effector Instrument Result, Recipient Patient, Theme Process Agent, Origin Matter Transfer Instrument, Medium Experiencer, Recipient Theme Spatial Origin Path Destination Location Temporal Start Duration Completion PointInTime Ambient Instrument, Matter Result

33 Computerlinguistik Verb-Ontologien
Sowa hat die Spalten in der Matrix der thematischen Rollen (auch als semantische Rollen bezeichnet) nach Begriffen benannt, die bereits Aristoteles (in seiner Metaphysik) eingeführt hat. Initiator corresponds to Aristotle's efficient cause, "whereby a change or a state is initiated" (1013b23). Resource corresponds to the material cause, which is "the matter or the substrate (hypokeimenon)" (983a30).

34 Computerlinguistik Verb-Ontologien
Goal corresponds to the final cause, which is "the purpose or the benefit; for this is the goal (telos) of any generation or motion" (983a32). Essence corresponds to the formal cause, which is "the essence (ousia) or what it is (to ti ên einai)" (983a27).

35 Computerlinguistik Verb-Ontologien Noch einmal, wir bauen die Taxonomie der Verb-Ontologie nach Möglichkeit so auf, dass sich Anteile des Valenzrahmens vererben. Das heißt, alle Verben, die die Rolle „Agent“ tragen, werden von dem Knoten „Intentional Process“ („Action“) dominiert und erben von diesem Knoten die thematische Rolle „Agent“. Analoges gilt auch für die anderen Rollen.

36 Computerlinguistik Verb-Ontologien
Die Verben, die die Rolle „Agent“ tragen, werden von dem Knoten „Intentional Process“ („Action“) dominiert und erben von diesem Knoten die thematische Rolle „Agent“. Analoges gilt auch für die anderen Rollen.                     intentional process                          intentional psychological process                          recreation or exercise                          organizational process                          guiding                          keeping                        maintaining                          repairing                          poking                          content development                          making                          searching                          social interaction                          maneuver

37 für die Verben zu „Motion“
Computerlinguistik Verb-Ontologien die Vererbung der spatialen Rollen für die Verben zu „Motion“

38 Computerlinguistik Verb-Ontologien

39 Computerlinguistik Literatur
Helbig, H. (2006). Knowledge Representation and the Semantics of Natural Language. Berlin: Springer. Levin, B. (1993). English Verb Classes and Alternations: A Preliminary Investigation. Chicago, IL: University of Chicago Press. Mitkov, R. (2003). The Oxford Handbook of Computational Linguistics. Oxford, UK: Oxford University Press. Nirenburg, S. & Raskin, S. (2004). Ontological Semantics. Cambridge, MA: MIT-Press. Sowa, J.F. (2000). Knowledge Representation. Pacific Grove, CA: Brooks/Cole. Staab, S. & Studer, R. (2004), Handbook on Ontologies. Berlin: Springer.


Herunterladen ppt "für Kommunikation, Informationstechnik und Ergonomie"

Ähnliche Präsentationen


Google-Anzeigen