Qualität einer Dokumentation Relevanz- und Vollständigkeitsrate

Slides:



Advertisements
Ähnliche Präsentationen
Projekt: Planung und Erstellung einer Webseite
Advertisements

Julika Mimkes ISN Oldenburg LiLi Links zu Lerninhalten der Physik Eine Datenbank zu verteilten Quellen Julika Mimkes Institute.
Übung 6.6Schranken 1.Angenommen, Ihr Algorithmus habe einen Aufwand von g(n) = 5n 3 + n für alle n a)Geben sie eine obere Schranke O(g(n)) an. b)Beweisen.
Klicke Dich mit der linken Maustaste durch das Übungsprogramm!
Klicke Dich mit der linken Maustaste durch das Übungsprogramm! Der Umfang von Dreiecken Ein Übungsprogramm der IGS - Hamm/Sieg © IGS-Hamm/Sieg 2007 Dietmar.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/7 Information Retrieval auf Texten An ihre Grenzen stoßen relationale Datenbanken bei der.
Wahl des Themas Präzisieren der Formale Eingrenzung Fragestellung
Hypothesen testen: Grundidee
Support.ebsco.com Lernprogramm zur einfachen Suche in wissenschaftlichen Bibliotheken.
Nach Adam Ries macht das…
Spree WS 2008/2009 Verbale Dokumentbeschreibung - Abstracting Das Kurzreferat gibt kurz und klar den Inhalt eines Dokuments wieder. (DIN 1426) Abstract.
Wissensorganisation Einstieg
Studierende « Medien und Information » : Unbekannte Wesen WS 2007/2008
Automatisches Clustering und automatische Klassifikation
Spree SoSe 2007 Titel Lexikographie – Produktion lexikographischer Werke (am Beispiel lookedup4you) Abb.: Relaunch lookedup4you Betaversion.
Spree SoSe 2011 Qualität einer Erschließung Relevanz- und Vollständigkeitsrate Zur Erinnerung: Zweck der Erschließung von Dokumenten/Texten ist nicht in.
Spree SoSe 2009 Feedback Thesaurus Feedback Thesaurus Einstieg Frau Spree Schöne Ergebnisse – bei strengster Bewertung: 1,01,31,72,02,32,73,03,74,
Letzte Aktualisierung: Spree WS 2008/2009 Studierende « Medien und Information » : Unbekannte Wesen WS 2008/2009? Studierende « Medien und Information.
Spree SoSe 2007 Titel Herausforderungen bei der Erstellung von (allgemeinen) Nachschlagewerken Among these unhappy mortals is the writer of dictionaries;
Spree SoSe 2011 Feedback Thesaurus / Facettenklassifikation Feedback Thesaurus / Facettenklassifikation Einstieg Schöne Ergebnisse – bei strengster Bewertung:
Qualitätskriterien zur Beurteilung von Dokumentationen
1 Indexierung - Begriffszerlegung Alphabete Seminar I-Prax: Inhaltserschließung visueller Medien, Spree WS 2005/2006 Begriffszerlegung – wo gibt.
Indexierung - Verschlagwortung
Spree SoSe 2011 Clustering – Wie Maschinen die Ähnlichkeit von Dokumenten erkennen.
Protégé OWL – TBox und ABox Abox_tbox_protege Seminar I-Prax: Inhaltserschließung visueller Medien, Spree WS 2009/2010 Wissensbasis TBox Frau.
IndexierungsqualitätEinstieg
Externe Informationsbeschaffung
1 Letzte Aktualisierung: Spree WS 2005/2006 Feedback Arbeitsaufgabe - Regelwerk Viele interessante Einsendungen Ich glaube, Sie haben verstanden,
Diskussion Dezimalklassifikation - Expertendiskussion Seminar I-Prax: Inhaltserschließung visueller Medien, Spree WS 2006/76 Diskusion Woran.
Spree SoSe 2009 Kundeneigene Wissensorganisation Kundeneigene Wissensorganisation Einstieg Was leisten Folksonomies im Bereich der Inhaltserschließung?
Relevanz Ranking Bisher: Sind wir davon ausgegangen, dass das Ergebnis des Rankings des statistischen Verfahrens in den Index geschrieben wird und dem.
Letzte Aktualisierung: Spree WS 2005/2006 Studierende « Medien und Information » : Unbekannte Wesen WS 2005/2006? Studierende « Medien und Information.
SoSe 2005 Spree / Datenbankretrieval Internet – ist das alles?
Feedback Thesaurus-Projekt
Spree SoSe 2006 Titel Typen von Informationsressourcen Eine systematische Übersicht.
Feedback Hörfunkdokumentation
Relevanz Ranking Bisher:
Spree SoSe 2010 Feedback Thesaurus / Facettenklassifikation Feedback Thesaurus / Facettenklassifikation Einstieg Frau Spree Schöne Ergebnisse – bei strengster.
Spree WS 2008/2009 Facetmap debugged Debugging macht teilweise mehr als 50% der Arbeitszeit eines Programmierers aus Proof of concept: Ihre Facetmaps funktionieren.
Spree SoSe 2007 Titel Lexika und ihre Benutzer Benutzervoraussetzungen Dank an Franziskus Geeb, der mir seine Unterrichtsmaterialien zum Thema Lexikographie.
Diskussion Hjørland – Grundannahme Seminar I-Prax: Inhaltserschließung visueller Medien, Spree WS 2005/06 Diskusion Ausgangsthesen Erfolgskriterium.
Information Broking als Beruf? Spree SoSe 2010 Quelle: 0/ /
Recherche im Ein einführendes Tutorial Informationssystem Medienpädagogik
Recherche im Ein einführendes Tutorial Informationssystem Medienpädagogik
Gymnasium Horn – Bad Meinberg
Kurzformaufgaben Wie groß ist der Winkel, den der Minutenzeiger einer Uhr in der Zeit von 8:45 bis 9:05 Uhr überstreicht? 120°
Projekt: Planung und Erstellung einer Webseite Ziel ist die Erstellung einer Webseite, die den Anforderungen einer Organisation (z.B. Unternehmen) entspricht.
Seniorkom.at vernetzt Jung & Alt Das Internet ist reif
Qualität und Evaluation im Unterricht
DISPARITÄTEN Disparität = räumliche Ungleichheit innerhalb einer Volkswirtschaft, „unausgeglichene Raumstruktur“ Ebenen: ökonomisch, sozial, kulturell,
W w w. s a f e r i n t e r n e t. a t Die Welt zu Hause Informationen suchen und finden.
Willkommen bei Sycarus – dem Mathematikprogramm, das neue Wege geht.
EXCEL PROFESSIONAL KURS
Messwerte, Verteilung, Histogramm, Mittelwert und Standardabweichung
Einführung in das Kurzreferat
Auswertung der Umfrage
Lobbyarbeit Abgeordnetenbüro
Die Ganze Welt im Computer? Informationsbeschaffung im Internet
Erstellung einer Facettenklassifikation
und du hast wieder mal nichts anderes zu tun, als am PC zu sitzen
Format Zeilenabstand (doppelt) Fußnoten (oder Endnoten) mit Seitenzahl
Spree SoSe 2006 Feedback Bilderschließung. Klassifikation  vollständig Seminar I-Prax: Inhaltserschließung visueller Medien, Spree SoSe 2006.
Examen IB Geschichte.
Niko Zenker1 Besondere Aspekte in Multimedia-Datenbanken Methoden zur iterativen Anfrageverfeinerung (Relevanz Feedback)
Recherche-Workshop der Stadtbücherei Metzingen Schritte zur erfolgreichen Recherche.
Übung 2 Einführung in die Ökonomie 18. April 2016.
Jugend-in-dresden.de medienetage- dresden.de Alles Google oder was? Recherche im Internet… suchet, so werdet Ihr finden, googelt, so werdet Ihr irren oder.
8 Zäune und Pfosten Reihe oder geschlossen Pfosten und Zwischenräume Ich will ans Gymi S. 49.
Wie verwende ich Suchmaschinen richtig?
Suchen und Finden Wie verwende ich Suchmaschinen richtig?
 Präsentation transkript:

Qualität einer Dokumentation Relevanz- und Vollständigkeitsrate Zur Erinnerung: Zweck einer Dokumentation ist nicht in erster Linie das Speichern, sondern das Wiederauffinden von Dokumenten. Die Qualität einer Dokumentation ist also daran zu messen, inwiefern alle für den Benutzer relevanten Dokumente von der Dokumentationsstelle wiedergefunden werden. Spree SoSe 2008

 Qualität? qualitätskriterien Umfrage: Woran würden Sie messen, ob die Qualität eines Informationsdienstes – real: Dokumentationsstelle wie beim NDR – oder virtuell: Suchmaschine wie google – hoch ist? Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004 Spree SoSe 2008

Raten Sie mal. Wie hoch ist die Vollständigkeit im Durchschnitt?  Qualitätskriterien Precision & recall Angemessenheit – Entspricht die Antwort dem Informationsbedarf? Neuigkeit – Anteil der Dokumente, die der Nutzer noch nich kennt Nützlichkeit – kann auch für Informationen zutreffen, nach denen der Nutzer gar nicht recherchiert hat Qualitative Kriterien Relevanz / Precision – Grad der Übereinstimmung der inhaltlichen Aussage eines Dokumentes mit der Suchanfrage Vollständigkeit / Recall – Anteil der wiedergefundenen vorhandenen Dokumente Quantitative Kriterien Raten Sie mal. Wie hoch ist die Vollständigkeit im Durchschnitt? Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004 Spree SoSe 2008

 Bewertungskriterien für Indexierungsergebnisse Indexierungsbreite Precision & recall Indexierungsbreite Anzahl der vergebenen Deskriptoren oder Notationen Indexierungsspezifität Annäherung durch das hierarchische Niveau der Indexierungsbezeichnungen Indexierungstiefe Kombination aus Breite und Tiefe Indexierungskonsistenz Indexierungskonsistenz ist das Maß der Übereinstimmung verschiedener Indexierungsergebnisse des gleichen Dokuments in derselben Dokumentationssprache. Quelle: Die DIN 31 623, Teil 1, Abschnitt 5 Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004 Spree SoSe 2008

B C A  Recherche als Mengenlehre vollständig Recherchefrage an eine Filmdatenbank: Liste aller Spielfilme, in denen Rock Hudson und Doris Day zusammen mitgespielt haben. Richtige Antwort wäre 3. Ergebnis im gelben Feld: Pillow Talk Lionpower B Lionpower C Lover.. Send … A Pillow .. Berechnung Relevanz: Anzahl der relevanten gefundenen Doks/Anzahl der selektierten Dokumente A /(A + B) = 1/ (1 + 1) = ½ Berechnung Recall: Anzahl der relevanten gefundenen Doks/Anzahl der relevanten Dokumente A /(A + C)= 1/ (1 + 2) = 1/3 C: Menge der relevanten Dokumente, die nicht gefunden wurden (2 Filme mit Rock Hudson und Doris Day: Lover come back; Send me no more flowers) A: Anzahl der relevanten gefundenen Dokumente (1 Pillow Talk) B: Anzahl der nicht relevanten gefundenen Datensätze (1 Lionpower) Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004 Spree SoSe 2008

 Hohe Qualität Recall 1 Präzision 1 vollständig Recall o o ooooooooo ooooo oooooo oooo oo o oo ooooooo ooooo 1 Präzision 1 Verteilung von Recall und Präzision bei Recherchen in einer Datenbank von relativ guter Indexierungsqualität. Beide Werte liegen dicht an 1. Nach Gaus: Dokumentations- und Ordnungslehre. Berlin u.a., 2003. S. 220 Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004 Spree SoSe 2008

 Niedrige Qualität vollständig o oo ooo ooo oooo ooooo oooooo ooooooo oooooooooooo ooooooooo oooooo ooooooo oooooo Recall 1 1 Präzision Verteilung von Recall und Präzision bei Recherchen in einer Datenbank von relativ schlechter Indexierungsqualität. Beide Werte liegen dicht an 0. Nach Gaus: Dokumentations- und Ordnungslehre. Berlin u.a., 2003. S. 220 Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004 Spree SoSe 2008

 Übung 1: genau Mario Schreiber sucht Dokumente zum Thema "Elektrosmog". Er findet 120 Dokumente, wovon 70 relevant sind. Weitere 30 relevante Dokumente hat er nicht gefunden. Wie wird Mario Schreiber das Ergebnis bewerten, wenn er wenig Zeit hat und möglichst relevante Dokumente finden will? Die Präzisionsquote beträgt: Wie wird Mario Schreiber seine Informationssuche bewerten, wenn er möglichst viele Dokumente finden will? Die Recallquote beträgt: Berechnung Relevanz: Anzahl der relevanten gefundenen Doks/Anzahl der selektierten Dokumente Berechnung Recall: Anzahl der relevanten gefundenen Doks/Anzahl der relevanten Dokumente 70/120 70/100 Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004 Spree SoSe 2008

 Übung 2: Fachtermini für Laien verständlich erklären genau Zielgruppenorientierung ist ein Fachterminus in der Wissensnorganisation. Solche Fachtermini sind nicht immer leicht für einen Laien verständlich. Unten finden Sie eine Erklärung des Begriffs für einen Laien. "Zielgruppenorientierung bedeutet Indexieren aus der Perspektive und für die Bedürfnisse einer bestimmten Zielgruppe, z.B. für Sie als Journalisten. Eine Alternative wäre neutrales Indexieren für eine anonyme Nutzergruppe. Wenn meine Kollegin und ich indexieren, haben wir immer die Interessen und Aufgaben der Mitarbeiter im Hinterkopf. Wir wissen z.B., dass Sie, Herr Schreiber, sich für alles interessieren, was mit der PISA-Studie zu tun hat. Diese Dokumente erschließen wir zusätzlich mit den Suchtermini, die Sie für Ihre Recherchen nach Auswertung unserer Log Files bevorzugen, nämlich "Bildungskatastrophe" und "struktureller Analphabetismus". Außerdem schreiben wir für Dokumente über die PISA-Studie Abstracts, die auf Ihre Interessen besonders eingehen.„ Arbeiten Sie in Zweiergruppen: Schreiben Sie ähnliche Erläuterungen für die 4 weiteren Fachtermini: Indexierungsbreite Indexierungsspezifität Indexierungstiefe Indexierungskonsistenz 2 vorderen Reihen 2 hinteren Reihen Bitte formulieren Sie Ihre Erklärungen so, dass ein Laie sie versteht! Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004 Spree Sose 2008