Spree SoSe 2011 Qualität einer Erschließung Relevanz- und Vollständigkeitsrate Zur Erinnerung: Zweck der Erschließung von Dokumenten/Texten ist nicht in.

Slides:



Advertisements
Ähnliche Präsentationen
Relative Clauses.
Advertisements

Die deutsche Satzstellung
Verbs Used Impersonally With Dative Deutsch I/II Fr. Spampinato.
Doris Kocher, PH Freiburg
Fallstudie. 2 Statistik April Dokumente Jan Mio. Dokumente Performance 3 Mio. Queries pro Tag 9. Juni 2000 Most popular search engines.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/7 Information Retrieval auf Texten An ihre Grenzen stoßen relationale Datenbanken bei der.
Automatisches Clustering und automatische Klassifikation
How to? Tipps und Tricks für die Thesauruserstellung
Qualitätskriterien zur Beurteilung von Dokumentationen
1 Indexierung - Begriffszerlegung Alphabete Seminar I-Prax: Inhaltserschließung visueller Medien, Spree WS 2005/2006 Begriffszerlegung – wo gibt.
Three minutes presentation I ArbeitsschritteW Seminar I-Prax: Inhaltserschließung visueller Medien, Spree WS 2010/2011 Giving directions.
IndexierungsqualitätEinstieg
Relevanz Ranking Bisher: Sind wir davon ausgegangen, dass das Ergebnis des Rankings des statistischen Verfahrens in den Index geschrieben wird und dem.
Relevanz Ranking Bisher:
Qualität einer Dokumentation Relevanz- und Vollständigkeitsrate
05 Stammdaten Arbeitsgang. © beas group 2011 / Page 2 This documentation and training is provided to you by beas group AG. The documents are neither approved.
Don`t make me think! A Common Sense Approach to Web Usability
AufwÄrmung A look at the future…..Match the German phrases on the left to the English ones on the right. Do your best; I am grading on participation! Wie.
Over the Rainbowbridge
| DC-IAP/SVC3 | © Bosch Rexroth Pneumatics GmbH This document, as well as the data, specifications and other information set forth in.
Plural Forms of Nouns & Wie viel? or Wie viele?
The word,,aber in German is most often used as a coordinating conjunction. Ich wollte nach Bremen fahren aber Mein Auto ist kaputt. Ich mag English aber.
Ich habe zwei Heimatländer
Meine Lernziele.
Niklas: Was möchte ___________ (your) Schwester denn zum Geburtstag?
Using latent semantic analysis to find different names for the same entity in free text Präsentation und Diskussion des Papers Im Rahmen des PS Web-Information.
Der formelle Imperativ – the Imperative
Using Relative Clauses
 Every part in a sentence has a grammatical function. Some common functions are: - Subject - Verb - Direct object / accusative object - Indirect object.
Sprachneuerungen des .NET Frameworks 3.5
Die Fragen Wörter Wer? Was? Wann?.
Stephanie Müller, Rechtswissenschaftliches Institut, Universität Zürich, Rämistrasse 74/17, 8001 Zürich, Criminal liability.
Literary Machines, zusammengestellt für ::COLLABOR:: von H. Mittendorfer Literary MACHINES 1980 bis 1987, by Theodor Holm NELSON ISBN
Spree SoSe 2006 Feedback Bilderschließung. Klassifikation  vollständig Seminar I-Prax: Inhaltserschließung visueller Medien, Spree SoSe 2006.
Die Übersetzung von “Diskursdialekten” für die Suche: Das Mapping zwischen Fachsprachen und Indexierungssprachen Vivien Petras Vortrag im Berliner Bibliothekswissenschaftlichen.
What is a “CASE”? in English: pronouns, certain interrogatives
Possessive Adjectives How to show belonging… The information contained in this document may not be duplicated or distributed without the permission of.
What is a “CASE”? in English: pronouns, certain interrogatives
type / function / form type of words:
COMMANDS imperative There are three command forms: formal familiar singular familiar plural.
COMMANDS imperative 1. you (formal): Sie 2. you (familiar plural): ihr
© Crown copyright 2011, Department for Education These materials have been designed to be reproduced for internal circulation, research and teaching or.
Kapitel 4 Grammar INDEX 1.Nouns & Their Plural Forms.
Kapitel 4: Mein Tag Sprache.
Imperfekt (Simple Past) Irregular or strong verbs
Kapitel 2 Grammar INDEX 1.Subjects & Verbs 2.Conjugation of Verbs 3.Subject Verb Agreement 4.Person and Number 5.Present Tense 6.Word Order: Position of.
Kapitel 7 Grammar INDEX 1.Comparison 2.Adjectives 3.Adjective Endings Following Ein-Words.
Kapitel 8 Grammar INDEX 1.Command Forms: The Du-Command Form & Ihr- Command 2.Sentences & Clauses.
WILLKOMMEN. By the end of today’s lesson You will know where to find some important information in the text book You will know what is expected of you.
Kapitel 9 Grammar INDEX 1.Formal Sie- Command 2.There Is/There Are 3.Negation: Nicht/Klein.
Das Wetter Lernziele: Heute: The „Wenn“ clause! - To describe and report the weather - To discuss activities done in different types of weather - To compare.
VERBEN KONJUGIEREN. What is a verb? An ________ _______, mental __________ or ________.  Examples of verbs:  __________________________ actionword state.
On the case of German has 4 cases NOMINATIVE ACCUSATIVE GENITIVE DATIVE.
German “ da - compounds ” Provided by deutschdrang. com for individual and classroom use only. May not be reproduced for any other purposes.
Technische Universität München Institute of Aeronautical Engineering Prof. Dr.-Ing. Horst Baier Presentation of the Institute (December 2009)
(Name of presenter) (Short title of presentation).
The Umlaut “Ü” in German: Exercises Based on chapter 5.8 of Rundblick 2 and online Speaking Practice Chapter 7.8 and 9.9.
DAS VIERTE DEUTSCHE KASUS Genitiv. Kasus ● What is a case? A case shows the grammatical function of a word. ● There are four cases in German. Up to now.
Dom zu Lübeck The Lübeck Cathedral (German: Dom zu Lübeck, or colloquially Lübecker Dom) is a large brick Lutheran cathedral in Lübeck, Germany and part.
Freizeit Thema 5 Kapitel 1 (1)
you: ihr ( familiar plural ) you: du ( familiar singular)
Deutsch I Telling time….
The Umlaut “Ö” in German: Exercises
Bell Work What countries border Germany?
Process and Impact of Re-Inspection in NRW
Thema Kraftfeld-Analyse
type / function / form type of words:
Integrating Knowledge Discovery into Knowledge Management
School supplies.
 Präsentation transkript:

Spree SoSe 2011 Qualität einer Erschließung Relevanz- und Vollständigkeitsrate Zur Erinnerung: Zweck der Erschließung von Dokumenten/Texten ist nicht in erster Linie das Speichern, sondern das Wiederauffinden von Dokumenten und Informationen Die Qualität der Erschließung ist also daran zu messen, inwiefern alle für den Benutzer relevanten Dokumente vom Informationsanbieter wiedergefunden werden.

Qualitätskriterien – qualitativ und quantitativ Precision & recall Seminar I-Prax: Inhaltserschließung visueller Medien, Spree SoSe 2011 Angemessenheit – Entspricht die Antwort dem Informationsbedarf? Neuigkeit – Anteil der Dokumente, die der Nutzer noch nich kennt Nützlichkeit – kann auch für Informationen zutreffen, nach denen der Nutzer gar nicht recherchiert hat Qualitative Kriterien Relevanz / Precision – Grad der Übereinstimmung der inhaltlichen Aussage eines Dokumentes mit der Suchanfrage Vollständigkeit / Recall – Anteil der wiedergefundenen vorhandenen Dokumente Raten Sie mal. Wie hoch ist die Vollständigkeit im Durchschnitt? Quantitative Kriterien

Qualitätskriterien der Experten – LexisNexis SmartIndexing Precision & recall Seminar I-Prax: Inhaltserschließung visueller Medien, Spree SoSe 2011 Quelle: 1. Accuracy: LexisNexis indexers and analysts run […] tests on new index terms and periodically re-test and update existing index terms to ensure the highest levels of recall and precision. 2. Consistency: The same taxonomies are used throughout news and business content in LexisNexis Academic 3. Currency: Index terms and hierarchies change over time, […] The automated processes of SmartIndexing are run against all documents in the database on a quarterly schedule so that all indexing is current. 4. Indexing to concepts, not words: […] SmartIndexing uses indexing codes, not words. This means that changes in terminology, such as when a company or a country changes its name, can be made instantly. 5. Language-neutral: The same SmartIndexing codes are used in English- (US and UK), German- and French-language documents, so you can search for foreign-language sources and documents using English index terms. 6. Narrower term roll up: Subordinate terms are included in searches for higher level terms unless explicitly excluded by the user. This approach matches the natural assumption of most users that, for example, a search on (the broad term) Insurance Products should return an article indexed to (narrower terms) Automobile Insurance or Health Insurance.

Bewertungskriterien für Indexierungsergebnisse Precision & recall Seminar I-Prax: Inhaltserschließung visueller Medien, Spree SoSe 2011 Indexierungsbreite Anzahl der vergebenen Deskriptoren oder Notationen Indexierungsspezifität Annäherung durch das hierarchische Niveau der Indexierungsbezeichnungen, spezielle Deskriptoren vergeben Indexierungstiefe Kombination aus Breite und Spezifität Indexierungskonsistenz Die Indexierungskonsistenz ist hoch, wenn ähnlich Dokumente einheitlich verschlagwortet werden. Quelle: Die DIN , Teil 1, Abschnitt 5

Recherche als Mengenlehre vollständig Seminar I-Prax: Inhaltserschließung visueller Medien, Spree SoSe 2011 Recherchefrage an eine Filmdatenbank: Gesucht werden alle Spielfilme, in denen Rock Hudson und Doris Day zusammen mitgespielt haben. C Lover.. Send … B Lionpower A Pillow.. C: Menge der relevanten Dokumente, die nicht gefunden wurden (2 Filme mit Rock Hudson und Doris Day: Lover come back; Send me no more flowers) Selektierte Dokumente im gelben Feld: Pillow Talk Lionpower Berechnung Relevanz: Anzahl der relevanten gefundenen Doks geteilt durch Anzahl der selektierten Dokumente A /(A + B) = 1/ (1 + 1) = ½ Berechnung Recall: Anzahl der relevanten gefundenen Doks geteilt durch Anzahl der relevanten Dokumente A /(A + C)= 1/ (1 + 2) = 1/3 A: Mengel der relevanten gefundenen Dokumente (1 Pillow Talk) B: Menge der nicht relevanten gefundenen Datensätze (1 Lionpower)

Verteilung von Recall und Precision eines Suchergebnisses Seminar I-Prax: Inhaltserschließung visueller Medien, Spree SoSe 2011 Recall Präzision 1 0 Nach Gaus: Dokumentations- und Ordnungslehre. Berlin u.a., S Präzision o o ooooooooo ooooo oooooo oooo oo o oo ooooooo ooooo o oo ooo ooo oooo ooooo oooooo ooooooo oooooooooooo ooooooooo oooooo ooooooo oooooo Welches Ergebnis ist besser?

Zusammenhang von Recall und Precision vollständig Seminar I-Prax: Inhaltserschließung visueller Medien, Spree SoSe 2011 Verteilung von Recall und Präzision bei Recherchen in einer Datenbank von relativ schlechter Indexierungsqualität. Beide Werte liegen dicht an 0. Nach Gaus: Dokumentations- und Ordnungslehre. Berlin u.a., S. 220 Die Qualität ist niedrig, wenn wenige allgemeine, also unpräzise Dokumente gefunden wurden. Verteilung von Recall und Präzision bei Recherchen in einer Datenbank von relativ guter Indexierungsqualität. Beide Werte liegen dicht an 1. Die Qualität ist hoch, wenn viele relevante Dokumente gefunden wurden.

Übung: genau Seminar I-Prax: Inhaltserschließung visueller Medien, Spree SoSe 2011 Eine Studentin sucht für das Fach Berufsfeldanalyse Dokumente zum Berufsbild Informationswirt". Mit einer Suche im Titelfeld einer Jobdatenbank findet sie 12 Dokumente, wovon 7 relevant sind. Weitere 10 relevante Dokumente hat sie nicht gefunden, da Informationswirt nicht im Titel des Dokumentes vorkommt. Berechnen Sie bitte Relevanz/Präzision (wie zutreffend sind die Dokumente)? Recall (wie viele der tatsächlich vorhandenen Dokumente wurde bei der Recherche gefunden?) FORMEL Berechnung Relevanz: Anzahl der relevanten gefundenen Doks/Anzahl der selektierten Dokumente Berechnung Recall: Anzahl der relevanten gefundenen Doks/Anzahl aller relevanten Dokumente

Übung: Lösung genau Seminar I-Prax: Inhaltserschließung visueller Medien, Spree SoSe 2011 Die Präzision liegt bei (7/12 ca. 0,58) Wie wird die Studentin das Ergebnis bewerten, wenn sie wenig Zeit hat und möglichst relevante Dokumente finden will? Der Recall liegt bei (7/17 ca. 0,41) Wie wird die Studentin die Informationssuche bewerten, wenn sie möglichst viele Dokumente finden will? Berechnung Präzision/Relevanz: Anzahl der relevanten gefundenen Doks/Anzahl der selektierten Dokumente Berechnung Recall: Anzahl der relevanten gefundenen Doks/Anzahl der relevanten Dokumente in der Datenbank

Literatur genau Seminar I-Prax: Inhaltserschließung visueller Medien, Spree SoSe 2011 DIN : Indexierung zur inhaltlichen Erschließung von Dokumenten; Teil 1: Begriffe, Grundlagen. Stand: September 1988 Gaus, Wilhelm: Dokumentations- und Ordnungslehre. Berlin: Springer, 2003 Stock, Wolfgang G.: Information Retrieval : Informationen suchen und finden. München, Wien : R. Oldenbourg Verlag, 2007