Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
Veröffentlicht von:Liane Michel Geändert vor über 8 Jahren
1
Information Retrieval Methoden, die dazu dienen, unstrukturierte Daten zu beschreiben, zu speichern und später nach inhaltlichen Kriterien wieder aufzufinden.
2
I n f o r m a t i o n Definition von Shannon Die mittlere oder erwartete Information eines von n möglichen Ereignissen mit den Auftretenswahr- scheinlichkeiten p 1, p 2, … p n beträgt: n = p r. log (p r) r=1 n wo: p r = 1 r=1
3
Subjektive Information Information, die über die Sinnesorgane aufgenommen wird, hängt stark vom „Empfänger“ ab: n Von seinem Wissen um die sachlichen Zusammenhänge; n von seinem Wissen um die Situation, von der die Nachricht handelt; n von seinem Zustand (z.B. Assoziationsfähigkeit); n von seinem Grad der Beherrschung des verwendeten Zeichenrepertoires.
4
Superzeichenbildung
5
Superzeichenhierarchie
6
Retrieval - Funktion RSV
7
Vektorraum - Retrieval : Menge von Merkmalen (features) j D: Menge der Deskribierungen d D: d= (d 0, …d n-1 ) n-1 wo d i , d i 0 und d i > 0 i=0 Q: Menge der Queries q Q : q = (q 0, …q n-1 ) n-1 wo q i , q i 0 und q i > 0 i=0 V: V = {v | v 0}
8
Ähnlichkeitsmasse Inneres Produkt: n-1 RSV I (q,d) = q i. d i i=0 Cosinus - Mass: n-1 q i. d i i=0 RSV cos (q,d) = n-1 n-1 q i 2. d i 2 i=0 i=0
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.