13.03.2014 lbsffm/pop Suchportal Informationen zum Ranking.

Slides:



Advertisements
Ähnliche Präsentationen
Information Retrieval in XML-Dokumenten
Advertisements

G.Meininghaus, Konstanz1 Suchen im und mit dem PC.
Hinweise zur Lizenz Diese PowerPoint-Präsentation steht unter der Creative-Commons CC-BY-NC-SA-Lizenz Sie dürfen: das Werk vervielfältigen, verbreiten.
Der PC als Hilfsmittel für die Schule
Institutskatalog der RWTH-Aachen unter Allegro
Tipps und Tricks bei der Internetsuche
Herzlich willkommen zur Veranstaltung „Internet-Recherche“
Verarbeiten / Zitieren
Die Erstellung einer Lückentext-Übung mit
eine Datenbank im Web of Knowledge
Recherche in den Psychologie-Datenbanken PSYNDEX und PsycINFO
Webseitenranking für Suchanfragen anhand von Linkgraphen
Indizierung von Graphen durch häufige Subgraphen (2)
Titel | Title {How to give a Presentation} Autor, Arbeitgeber | Author, Affiliation {M. Schubert, FH Regensburg, Univ. of Applied Sciences, Regensburg,
Schutzvermerk nach DIN 34 beachten CANopen 5-Jan-14, Seite 1 EDS und DCF-Dateien.
Julika Mimkes ISN Oldenburg LiLi Links zu Lerninhalten der Physik Eine Datenbank zu verteilten Quellen Julika Mimkes Institute.
Google Larry Page Sergej Brin 7. Sept Google Inc. PageRank – Citation Index – Qualität der Suchergebnisse Wider die Lügen im Hyperraum – Ranking.
Musterlösung IT-Struktur an Schulen © M. Stütz, F. Wrede LEU - Zentrale Planungsgruppe Netze am Kultusministerium Baden-Württemberg zwei Pflege der Internetdienste.
Bibliothekskurs Sozialwissenschaften
HyREX: Eine Hypermedia- Retrievalengine für XML- Dokumente Norbert Fuhr Universität Dortmund
Juristische Online-Datenbanken: Juris und Beck-Online
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/5 Grundtechniken des Information Retrieval Deskribierung Hierunter versteht man eine manuelle.
Text-Retrieval mit Oracle Vortrag von Andreas Mück & David Diestel.
Support.ebsco.com Lernprogramm zur einfachen Suche in wissenschaftlichen Bibliotheken.
Externe Datenstruktur lineare Liste
ExKurs B_HEBISretro 1/7 Dr. Barbara Hoffmann LiteraturKompetenz HEBIS - Retro Wie der HEBIS Verbundkatalog die OPACs der angeschlossenen Bibliotheken.
Relevanz Ranking Bisher: Sind wir davon ausgegangen, dass das Ergebnis des Rankings des statistischen Verfahrens in den Index geschrieben wird und dem.
Relevanz Ranking Bisher:
Auswertung der Mitgliederumfrage 2011 der Bundesarbeitsgemeinschaft Schuldnerberatung e.V. 1.
Nützlichkeit statistischer Phrasen in der Textklassifikation
ProQuest Business Databases
Wie Google Webseiten bewertet
Die „Erweiterte Suche“
W w w. s a f e r i n t e r n e t. a t Die Welt zu Hause Informationen suchen und finden.
09-Dateien und Ordner suchen1 Den Such-Assistenten starten l - SUCHEN oder l Symbol im Ordnerfenster oder Windows-Explorer oder (F) Startfenster des Such-
Erfolgreiches Social Media
Theologische Hochschule Friedensau BS5P1-3: Literaturstudium und Recherche Baustein 7 Recherche im Internet 1 Dozent: Dietmar Päschel, Dipl.-Theol. Wintersemester.
13 Regeln im Internet (Netiquette)
Wie erstelle ich einen Podcast Martin Kunzelnick
Kapitel - Thema letzte Aktualisierung © Accor Hospitaliy Germany Notizen BLANKO 0 X – XXXXXXX XXXXXXXXXXXXXXXXXXX Anmerkung XXXXXXXX Headline.
Bestimmen von Prozentwert, Grundwert und Prozentsatz
Eine kurze Einführung Andreas Venakis.
Suchen & Finden 26. April 2014 Von der Themenstellung zur Literatur.
AUTSCH!!!(01) Bilder aus dem Internet Datum und Uhrzeit aktuell :30 F. S.
113 ArbeitsmappenInhalt 13Arbeitsmappen 13.1Mit Arbeitsmappen arbeiten 13.2Tabellenblätter verschieben und kopieren 13.3Tabellenblätter ein- und ausblenden.
Der SLUB Katalog und die Semantische Suche Ralf Talkenberger, SLUB / 21. März 2012.
Quali 2009 Allgemeine Hinweise für den Erwerb des qualifizierenden Hauptschulabschlusses für externe Bewerber. Falls das Erreichen des Realschulabschlusses.
Zeit- und Arbeitsplan für die zweite Hälfte der Ausbildungszeit
Dokumentenablage und -Flut im Griff - mit unternehmensweiten Suchmaschinen Fachvortrag auf der I+E Messe Freiburg ©Semantec 2007 Dokumentenablage.
20. Februar 2008 LFE Medieninformatik  Blockübung Informationsvisualisierung Gruppe 8 Abschlusspräsentation.
Information Retrieval, Vektorraummodell
Pfad Akt.Nr.: xxxx/xxxxx/xxxx Analyse Medizinischer Freitexte Lukas Faulstich, ID GmbH & Co. KGaA Projekttreffen ByMedConnect | München,
1. 2 Internetrecherche Technik und Ressourcen 3 1)Bibliotheken 2)Zeitungen (Online-Archive) 3)TV-Sender 4)Behörden 5)NGOs 6)Gute Links 7)Suchmaschinen.
Bonus-Zertifikate Michael Ripke 3. September 2008.
Suchmaschinen im Internet
Live Search Die Suchmaschine von Microsoft. Was ist Live Search? Live Search gehört zur Microsoft Windows Live Familie (Windows Live Messenger, Windows.
Virtual Dub Einleitung Capture-Modus Programm starten.
Internetrecherche Sebastian Wolf, Universitätsbibliothek Bielefeld Februar 2014.
Arten von Suchwerkzeugen
Tutorial Holdings Management Erstellen, Bearbeiten und Zuweisen von Links für Full Text Finder support.ebsco.com.
Product Finder Siemens.com
Mit Discovery mehr entdecken Der neue OPAC der Stadtbücherei Münster Tagung der Sektion 2 im DBV Potsdam, 23. –
Das Suchportal der Universität Bonn Dr. Annette Specht, Anke Reinhard Bonn,
Anwendung von Apps zur Integralrechnung Untersucht wurden die Programme: -Integral Calculator -Integral, Derivative Calculator.
Die Recherche in Datenbanken am Beispiel der Saarländischen Bibliographie.
Musterseite 1 Person – Titel
Suchen mit AltaVista im WebSpace
Historical Abstracts America: History & Life
Marketingcontrolling Kapitel 4: Suchmaschinenmarketing Teil 1
Suchmaschinen im Internet
 Präsentation transkript:

lbsffm/pop Suchportal Informationen zum Ranking

Level 0 person person_lc_word title title_lc_word title_lc_phrase topic … Level 1 / Level 2 kls_3 shelfmark_3 topic_3 topic_lc_word_3 … Fremddaten (z.B. Titelanreicherungen) HDS-Index CBS-Retro CBS Tlw. Einsatz von „Filtern“ (Stemming, Phonetische Unschärfe, etc.)

Indexierung - Beispiel IndexfeldIndexierungsverfahrenAutor: „Gerthsen, Christian“ Titel: „Gerthsen Physik“ wird im Index gespeichert als … personWortweise mit Modifikation (Phonetische Unschärfe) gerdzen | gertsen | dZertsen | tSristjan| xriStjan| xristjan person_lc_wordWortweise „exakte Schreibweise“ (auf Kleinschreibung normiert) gerthsen | christian titleWortweise mit Modifikation (Phonetische Unschärfe + „starkes“ Stemming) gerts | fisik | fizik | phisik | phizik title_lc_wordWortweise „exakte Schreibweise“ (auf Kleinschreibung normiert) gerthsen | physik title_lc_phrasePhrasegerthsen physik miscWortweise mit Modifikation („schwaches“ Stemming) gerths | physik …

Suchanfrage IndexfeldAutor: „Gerthsen, Christian“ Titel: „Gerthsen Physik“ wird im Index gespeichert als … Suchanfrage: „Gerdsen Physik“ wird im Index gesucht als … persongerdzen | gertsen | dZertsen | tSristjan| xriStjan| xristjan gerdzen | gertsen | dZertsen | fisik | fizik | phisik | phizik title_lc_wordgerthsen | physikgerdsen | physik title_lc_phrasegerthsen physikgerdsen physik

DismaxFields: - person - person_lc_word ^5^2 - title_lc_word ^4 - id - isxn - topic ^0.6 - topic_lc_word ^0.6 - topic_3 ^0.5 - topic_lc_word_3 ^0.5 - kls_3 ^0.5 - kls_lc_word_3^0.5 - misc ^ shelfmark_3 - series_statement ^ retroocr - retroocr_lc_word - part_of Ranking-Einstellungen der Einfachen Suche I  Kein eigener ALL-Index, wie im OPAC  Stattdessen ein Suchfeld „allfields“, in dem festgelegt wird, welche Indexfelder bei der Suche berücksichtigt werden  Relevanz-Grundwert multipliziert mit ^Wert  Stärkere Gewichtung / Boosting (>1) bzw.  Schwächere Gewichtung (<1) eines Indexfelds

Ranking-Einstellungen der Einfachen Suche II DismaxParams:  Parameter zum Einstellen, wie viele Suchbegriffe gefunden werden müssen - [mm, 4<-1 7<80%]  Erscheinungsjahr-Boosting - [boost, sum(product(max(0,sum(product(abs(ms(NOW/YEAR,pub_date_max)), e-13),1)),6.5),1)]  Dämpfung der Relevanzwerte von Titelaufnahmen aus dem Retrokatalog - [boost, if(exists(query({!v='id:HEBr*'})),0.4,1)]  Automatische Phrasenbildung - [ps, 3] - [pf, title_lc_word^3 kls_3] Mehr Infos unter:

publisher: DismaxFields: - publisher - publisher_lc_word^5 DismaxParams: - [mm, 4<-1 7<80%] - [bf, product(max(0,sum(product(abs (ms(NOW/YEAR,pub_date_max)), e-13),1)),250)] QueryFields: - publisher: - [and, 100] - [or, ~] - publisher_lc_word: - [and, 100] - [or, ~] Ranking-Einstellungen der Erweiterten Suche I Für die Erweiterte Suche werden die Suchfelder einzeln definiert allfields title fulltitle author topic publisher misc shelfmark isn

Ranking-Einstellungen der Erweiterten Suche II title: DismaxFields: - title_lc_word^2 DismaxParams: - [mm, 4<-1 7<80%] - [bf, product(max(0,sum(product (abs(ms(NOW/YEAR,pub_date_max)), e-13),1)),250)] - [ps, 1] - [pf, title_lc_word] fulltitle: QueryFields: - title_lc_phrase: - [onephrase, 10] Suchbegriffe, die nur sinnvoll als Phrase gesucht werden können, z.B. „Vollständiger Titel“, „Klassifikationen“ und „Signaturen“ müssen über den Standard-Query-Parser gesucht werden. Tlw. andere Parameter als in der Einfachen Suche, da in der Erweiterten Suche nicht alle DisMax-Parameter funktionieren.

Auswertung I

Auswertung II Seitenquelltext anzeigen lassen … … und diesen komplett kopieren.

Auswertung III „ aufrufen und dort den Seitenquelltext einfügen.

Auswertung IV

Berechnung des Relevanz-Wertes I  Pro Suchbegriff wird für jedes Indexfeld ein Relevanz-Grundwert ermittelt, der sich an Hand der folgenden Kriterien berechnet:  Je seltener ein Suchwort im Index vorhanden ist, desto höher ist sein Beitrag zum Ranking.  Je länger der Feldinhalt ist, in dem ein Suchwort gefunden wurde, desto geringer ist sein Beitrag zum Ranking.  Dokumente, in denen die Suchworte häufiger vorkommen, werden höher bewertet.  Dokumente, in denen mehr Suchworte vorkommen, werden höher bewertet.  Den Relevanz-Grundwert kann man nur bedingt mit den Ranking-Einstellungen in der searchspecs.yaml beeinflussen, z.B. stärker oder schwächer gewichten mit '^'.  Die Berücksichtigung der Feldlänge ist bei bibliographischen Daten allerdings nicht sinnvoll und sollte daher nur bei Indexfeldern mit Volltexten berücksichtigt werden.

Berechnung des Relevanz-Wertes II Pro Suchbegriff wird für jedes Indexfeld ein Relevanz-Grundwert ermittelt.

Berechnung des Relevanz-Wertes III Pro Suchbegriff wird der größte Relevanz- Grundwert eines Indexfeldes mit der Summe der übrigen Relevanz-Grundwerte x 0,1 * addiert. 1, ((0, , , , ) x 0,1) = 1, * Der Faktor kann über den "tie-Parameter" geändert werden.

Berechnung des Relevanz-Wertes IV Die so ermittelten Werte werden addiert und mit dem Wert des Erscheinungsjahr-Boostings multipliziert. (0, , ) x 7, =