IndexierungsqualitätEinstieg Einstieg und Wiederholung zum Nachlesen: Lerneinheit 1 http://www.bui.haw-hamburg.de/pers/ulrike.spree/astep/le1_step_1.html Spree WS 2007/2008
Indexierungsqualität Indexierungsqualität Indexierungsqualität Zwei Nachweise aus dem Katalog der „Deutschen Nationalbibliothek Frankfurt“: Welcher Nachweis hat die größere Indexierungstiefe? Begründen Sie Ihre Entscheidung Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004 Spree WS 2007/2008
Retrievalmaße: Recall & Precision Recall: Def.: Anteil der bei einer Recherche gefundenen relevanten Datensätze Beispiel: In der NDR-Fernsehdatenbank gibt es 50 Dokumente zum Thema „Elchtest“. Bei der Recherche wurden aber nur 20 Dokumente gefunden, da 30 Dokumente nicht mit Elchtest, sondern mit „Fahrdynamik-Test“ verschlagwortet wurden. Rechnung Recall: gefundene relevante Dokumente (20) / gefundene relevante Dokumente (20) + nicht gefundene relevante Dokumente (30) = 20/50. Recall liegt bei 0,4 oder 40% Precision: Def.: Anteil der bei der Recherche gefundenen relevanten Datensätze im Verhältnis zu den insgesamt gefundenen Datensätzen Beispiel: Herr Meyer sucht Dokumente zum Thema Elchtest. Er recherchiert mit den Schlagworten Test und Auto. Er erhält 100 Treffer, bei 50 Dokumenten handelt es sich tatsächlich um Dokumente, in denen es um das Thema Elchtest geht. Rechnung Precision: gefundene relevante Dokumente (50) / gefundene relevante Dokumente (50) + gefundene nicht relevante Dokumente (50) = 50/100. Precision liegt bei 0,5 oder 50% Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004 Spree WS 2007/2008
Quellen und weiterführende Ressourcen Quellen / Ressourcen DIN 31 623: Indexierung zur inhaltlichen Erschließung von Dokumenten; Teil 1: Begriffe, Grundlagen. Stand: September 1988 Gaus, Wilhelm: Dokumentations- und Ordnungslehre. Kapitel 1. Berlin: Springer, 2000. Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004 Spree WS 2007/2008