Qualität von Web-Suchmaschinen Search Engine Stragies Munich 2005 Dirk Lewandowski Heinrich-Heine-Universität Düsseldorf, Abt. Informationswissenschaft.

Slides:



Advertisements
Ähnliche Präsentationen
Seite 1 Find Economic Literature Stand
Advertisements

Hinweise zur Lizenz Diese PowerPoint-Präsentation steht unter der Creative-Commons CC-BY-NC-SA-Lizenz Sie dürfen: das Werk vervielfältigen, verbreiten.
Prüfungspläne Bachelor-Thesis
„Suchmaschinen – Prinzipien und Allgorithmen“ Fallstudie
Implizite Digitale Soziale Netze als Basis für Expertenempfehlungssysteme Tamara Heck, Isabella Peters Abteilung für Informationswissenschaft Heinrich-Heine-Universität.
Webseitenranking für Suchanfragen anhand von Linkgraphen
Fachbibliographische Datenbanken der Anglistik –
Informationskompetenz für Naturwissenschaftler an der ULB Düsseldorf
Datendiagnose Thüringen
DEPARTMENT FÜR INFORMATIK
Vorstellung von PaderWAVE Generierung von Web-Anwendungen aus visuellen Spezifikationen Projektgruppe aus der Arbeitsgruppe Programmiersprachen & Übersetzer.
Suchmaschinen Seminar Prinzipien und Algorithmen Peter K. Ibach Suchmaschinen.
„Wissenschaftliches Arbeiten“ Was soll denn das sein?
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/7 Information Retrieval auf Texten An ihre Grenzen stoßen relationale Datenbanken bei der.
Heuristiken Automatic Problem Solving Institut für Informatik
Genetische Algorithmen
DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR neofonie neofonie Forschung und Entwicklung: Innovative Suchmethoden Präsentiert von Ronald.
Berufsperspektiven für Studierende der Sozialwissenschaften Dipl.-Sozw. Christian Salwiczek 2010 Berufsperspektiven für Studierende der Sozialwissenschaften.
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil 5.
Suchen im Internet Universitätsbibliothek Bielefeld Suchen im Internet
Ankündigung Würzburg, 17. Juni 2008 – 18:00 bis 21:00 Uhr,
Was ist Framing? Darstellung von Informationen in einer Weise, die bestimmte Aspekte der Information salienter macht (de Vreese, 2005) z.B. BILDzeitungsstil.
SoSe 2005 Spree / Datenbankretrieval Internet – ist das alles?
Feedback Hörfunkdokumentation
Zukunft des Webs? Dennis Beer Christian Blinde
Angewandte Systemwissenschaft
Untersuchungen zum Informationsverhalten Jugendlicher
1 Friedrich-Alexander-Universität Erlangen-Nürnberg Prof. Dr.-Ing. J. Teich SPP1148 Rekonfigurierbare Rechensysteme Zwischenkolloquium München
Ich studiere gern in Nürnberg
Fakultät für Betriebswirtschaft Munich School of Management Das Institut für Wirtschaftsinformatik und Neue Medien im Hauptstudium Diplom BWL Überblick.
Gründungs- und Wachstumsmanagement -Mannschaftsprojekt- Friedrich-Schiller-Universität JenaJena, den
Tipps zu einer erfolgreichen Jobsuche
Informationswissenschaft und Sprachtechnologie
Ergänzungsfach Informationswissenschaft
W w w. s a f e r i n t e r n e t. a t Die Welt zu Hause Informationen suchen und finden.
Stammzell-Transplantationen in Düsseldorf
Relevante Faktoren für eine Top-Platzierung am Beispiel von Google
PLAYER & HUB Die neue Technik-Generation für Veranstalter und Vertrieb
Clever Search: A WordNet Based Wrapper for Internet Search Engines Peter M. Kruse, André Naujoks, Manuela Kunze, Dietmar Rösner Otto-von-Guericke-Universität.
Ein Vortrag von Maj-Britt, Bernadette, Moritz, Margarita und Michelle
Den h-Faktor in Web of Science ermitteln 1 Heike Seidel, Zweigbibliothek Chemie der ULB Münster, Mai 2013 Der Hirsch-Faktor (h-Faktor,
Carl von Linde-Akademie der TU München Studium Generale: Die Carl von Linde-Akademie der TU München Dr. Fred Slanitz Lehrstuhl für Philosophie und Wissenschaftstheorie.
1 // Offener Katalog - Nachnutzung von Metadaten über eine serviceorientierte Systemarchitektur Trad. & offener Katalog Metadatenexporte & Neuigkeiten.
learn:line NRW 2 April 2011 Die Medienberatung NRW ist ein Angebot des LVR-Zentrums für Medien und Bildung und des LWL-Medienzentrums für Westfalen im.
Zauberwort Metadaten Elementares Handwerkszeug des Content- und Wissensmanagement.
Semantische Suchmaschinen
Information Retrieval, Vektorraummodell
Anmeldung Veranstaltungsort Hiermit melde ich mich verbindlich zur Veranstaltung an Name, Vorname: _____________________________ Institution: __________________________________.
Prof. Dr. phil. Ralph Dreher Prof. Dr. phil. Ralph Dreher Department ETI – Elektrotechnik und Informatik Lehrstuhl Technikdidaktik.
Sehr geehrte Kommission! Hier ist unsere Presentation über unsere Universität uns begründung für die Reise nach Deutschland.
Das präsentiert: Projekt „Mensch und Tier“ Fotoalbum zum Vortrag von Richard David Precht „Ist der Mensch ein egoistisches Tier?“ Audimax.
1 GeCKo – Gender & Co. Koordinierungsstelle an der Universität Duisburg-Essen 24. April 2008 Evaluationsergebnisse Schülerinnen & Dozenten.
„Wenn du den Fluss Halys überschreitest, wirst du
26. Oktober 2005Autor: Walter Leuenberger Computeria Urdorf Treff vom 26. Oktober 2005 Suchmaschinen im Internet Google & Co.
Prof. Dr. phil. Ralph Dreher Prof. Dr. phil. Ralph Dreher Department ETI – Elektrotechnik und Informatik Lehrstuhl Technikdidaktik.
Live Search Die Suchmaschine von Microsoft. Was ist Live Search? Live Search gehört zur Microsoft Windows Live Familie (Windows Live Messenger, Windows.
Methoden der Sozialwissenschaften
Integration Aktuelle Forschungsergebnisse
Jede Suchmaschine verfügt über einen Datenbestand, auf den zur Beantwortung von Suchanfragen zugegriffen wird. Das System zur Erfassung von.
Allgemeine BWL vs. Spezielle Betriebswirtschaftslehre(n)
Ressourcen Für die Zukunft Studium und Forschung an der Bergakademie
Das Suchportal der Universität Bonn Dr. Annette Specht, Anke Reinhard Bonn,
O N L I N E – M A R K E T I N G ncm.at – Net Communication Management Gmbh Aigner Straße 55a I 5026 Salzburg I Österreich I I T:
Das Land Bremen ist führender MINT-Standort in Deutschland.
Das Land Bremen ist ein attraktiver Studienstandort mit steigenden Studierendenzahlen. Anzahl der Studierenden an den öffentlichen und privaten Hochschulen.
Frühprognose nach Reanimation und therapeutischer Hypothermie
INHALTE DES VORTRAGS ALS VORSTELLUNG DES THEMAS (10MIN)
INHALTE DES VORTRAGS ALS VORSTELLUNG DES THEMAS (10MIN)
Search Engine Advertising/ Suchmaschinenwerbung (SEA)
 Präsentation transkript:

Qualität von Web-Suchmaschinen Search Engine Stragies Munich 2005 Dirk Lewandowski Heinrich-Heine-Universität Düsseldorf, Abt. Informationswissenschaft

Informationswissenschaft Uni Düsseldorf Eine der führenden Ausbildungsstätten im Bereich Informationswissenschaft. Einzigartiger Studiengang Informationswissenschaft und Sprachtechnologie (B.A./M.A.) –Elemente aus Informationswissenschaft, Sprachwissenschaft, Informatik –Praktika im Verlauf des Studiums Forschung der Abteilung Informationswissenschaft u.a.: –Web Information Retrieval –Suchmaschinen-Marketing

Ziel des Vortrags Darstellung der Qualität von Suchmaschinen aus neutraler Sicht. Kurzer Überblick über aktuelle Forschungsergebnisse.

Inhalt 1.Qualität der Treffer 2.Qualität der Datenbestände 3.Qualität der Suchfunktionen 4.Fazit

1 Qualität der Treffer

Retrievaltests Qualität von Suchmaschinen wird anhand von Testanfragen gemessen. Errechnet wird die erreichte Präzision = Anteil der relevanten Treffer bis zu einem bestimmten Cut-Off-Wert. Beispiel: –50 zufällig ausgewählte Suchanfragen –berücksichtigt werden die ersten 20 Treffer –Jeder Treffer wird bewertet: für die Suchanfrage passend oder nicht?

Quelle: Griesbaum 2004

Retrievaltests: Ergebnisse Alle Suchmaschinen schneiden schlecht ab: Präzision <0,6. D.h. nur max. 6 von 10 Treffern sind relevant. Andersherum: Mindestens 4 von 10 Treffern sind irrelevant. Die Suchmaschinen liegen nahe beieinander; Bestätigung durch Kurztests und eigene Erfahrungen. Testberichte in Publikumszeitschriften genügen i.d.R. nicht den Ansprüchen an Retrievaltests.

2 Qualität der Datenbestände

Abdeckung des deutschen Web Größe des deutschen Web ca. 4 Mio. Domains mit ca. 320 Mio. Seiten. Abdeckung durch Suchmaschinen zwischen <50 Prozent und etwa 60 Prozent. Bessere Abdeckung als in vergleichbaren älteren Studien; Tendenz aber ähnlich. Quelle: Pothe 2004

Country Bias Seiten aus unterschiedlichen Ländern werden unterschiedlich häufig und unterschiedlich tief indexiert. US-Sites werden zu >80 Prozent indexiert; andere teils nur zwischen Prozent. Tiefe der Indexierung: US-Sites ca. 90 Prozent; andere teils <50 Prozent. Vergleichende Untersuchungen für deutschsprachige Sites liegt noch nicht vor. Quelle: Vaughan u. Thelwall 2004

Index-Aktualität Aktualität schwankt erheblich. Keine Komplettaktualisierung alle 30 Tage! Aktuellster Index: Google, MSN, Yahoo. Oft keine klaren Intervalle erkennbar. Quelle: Informationswissenschaft Uni Düsseldorf, laufende Untersuchung

3 Qualität der Suchfunktionen

Suchfunktionen Umfang der Suchmöglichkeiten variiert erheblich. Alle großen Suchmaschinen bieten gewisse Kernfunktionen, z.B.: –Beschränkung auf Titel –Sprachauswahl –Datumsbeschränkung –Dateiformate Es hat sich bisher keine einheitliche Abfragesprache herausgebildet. Quelle: Lewandowski 2004a

Recherchefunktion: Datumsbeschränkung Suchmaschinen können nur schwer erkennen, wie aktuell eine Seite ist. Die Funktion Datumsbeschränkung ordnet nur 4-6 von zehn Dokumente richtig zu. Am besten schneidet hier Google ab, danach Yahoo. Datumsbeschränkung bei Teoma / Ask Jeeves lohnt sich nicht. Quelle: Lewandowski 2004b

Quelle: Lewandowski 2004

Fazit

Suchmaschinen sind (noch) nicht perfekt. Suchmaschinen erfassen oft nur einen Teil von Websites. Textanzeigen haben weiterhin Bedeutung, auch wenn die Homepage gut gerankt ist. Für kurzfristige Kampagnen sollte man sich nicht auf die Indexierung durch Suchmaschinen verlassen.

Vielen Dank.

Quellen Griesbaum, J. (2004): Evaluation of three German search engines: Altavista.de, Google.de and Lycos.de. Information Research 9(4) paper Lewandowski, D. (2004a): Abfragesprachen und erweiterte Funktionen von WWW-Suchmaschinen. IWP - Information: Wissenschaft und Praxis 55(2), (2004). funktionen.phphttp:// funktionen.php Lewandowski, D. (2004b): Date-restricted queries in web search engines. Online Information Review 28(2004)6, Vaughan, L.; Thelwall, M. (2004): Search Engine Coverage Bias: Evidence and Possible Causes. In: Information Processing & Management, 40(4), Pothe, A. (2004): Nachgezählt: Wie groß ist das WWW? ct 26/2004,