Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Linguistically Motivated Information Retrieval

Ähnliche Präsentationen


Präsentation zum Thema: "Linguistically Motivated Information Retrieval"—  Präsentation transkript:

1 Linguistically Motivated Information Retrieval
Phrasenerkennung Nach dem Artikel : Linguistically Motivated Information Retrieval Avi Arampatzis, Th.P. van der Weide, P. van Bommel, C.H.A. Koster To appear in: Encyclopedia of Library and Information Science, Volume 69, December 2000. Allen Kent, editor. Published by Marcel Dekker, Inc., New York, Basel

2

3 Definition 1 (naive keyword retrieval hypothesis) If a query and a document have a (key)word in common, then the document is to some extent about the query.

4 Probleme: Geht nicht auf die Morphologische Variation ein, die Schlüsselwörter mit unterschiedlichem Numerus und Genus hervorbringt. Geht nicht auf Fälle ein, in denen unterschiedliche Wörter verwendet werden, um die gleiche Bedeutung zu repräsentieren. Das wird hier als lexikalische Variation bezeichnet. Unterscheidet nicht Fälle, in denen einzelne Wörter mehrfache Bedeutung haben auf Grund von semantischer Variation (bzw. Ambiguität). Liefert unbefriedigende Ergebnisse bei syntaktischer Variation.

5 Definition 2 (naive Phrase Retrieval Hypothesis) If a query and a document have a phrase in common, then the document is to some extent about the query.

6 the hillary clinton health care bill proposal

7 Definition 3 (noun phrase for IR) A core noun phrase NP, from an IR point of view, has the general form: NP = det *pre* head post* Definition 4 (verb phrase for IR) A verb phrase VP, from an IR point of view, has the general form: VP = subj kernel comp*

8

9

10 Lemmatization: 1. Verb forms are reduced to the infinitive. 2. Inflected forms of nouns are reduced to the nominative singular. 3. Comparatives and superlatives of gradable adjectives are reduced to the absolute form phrase frame: PF = [h; m]

11 [ engineering 1026 , of software 7 ; reverse 102 ; software 842 ; ... ]

12 Definition 5 (noun phrase normalization) NP = det* pre* head post * [head; pre * post * ]

13 Definition 6 (verb phrase normalization I) VP = subj kernel comp* [subj; verb(kernel)]; [verb(kernel); comp ]


Herunterladen ppt "Linguistically Motivated Information Retrieval"

Ähnliche Präsentationen


Google-Anzeigen