Fallstudie. 2 Statistik April 1996 500 000 Dokumente Jan. 1997 2 Mio. Dokumente Performance 3 Mio. Queries pro Tag 9. Juni 2000 Most popular search engines.

Slides:



Advertisements
Ähnliche Präsentationen
Zusammenfassungen der EU-Gesetzgebung: eine Einführung 2008
Advertisements

Kohonennetze für Information Retrieval mit User Feedback
Tipps und Tricks bei der Internetsuche
„Suchmaschinen – Prinzipien und Allgorithmen“ Fallstudie
Herzlich willkommen zur Veranstaltung „Internet-Recherche“
Jugend-in-dresden.de medienetage- dresden.de Alles Google oder was? Recherche im Internet… suchet, so werdet Ihr finden, googelt, so werdet Ihr irren oder.
Recherchieren im Internet:. Überblick über den Suchraum Kataloge Suchmaschinen Datenbanken Metasucher.
Julika Mimkes ISN Oldenburg LiLi Links zu Lerninhalten der Physik Eine Datenbank zu verteilten Quellen Julika Mimkes Institute.
Google Larry Page Sergej Brin 7. Sept Google Inc. PageRank – Citation Index – Qualität der Suchergebnisse Wider die Lügen im Hyperraum – Ranking.
1 Das Presseportal als Werkzeug für die Pressearbeit und Presserecherche Der Einsatz von Datenbank-Hyperlinks zur Vernetzung von Presseartikeln.
Webseiten, die gefunden werden Dr. Eduard Heindl, Heindl Internet AG Tübingen.
Einsatz neuer Technologien bei der Virtuellen Fachbibliothek Slavistik Ivo Ulrich, Staatsbibliothek zu Berlin 98. Bibliothekartag, Erfurt, 3. Juni 2009.
Klaus Kopperschmidt 22. Januar 2001
Archivierung und Erschließung von Audio/Video-Material mit miless und MyCoRe F. Lützenkirchen Universitätsbibliothek.
Juristische Online-Datenbanken: Juris und Beck-Online
„Philosopher‘s Index“ by OvidSP
Suchen und Finden von WWW-Dokumenten Internet-Tutorium WS 99/00 Plenum am :
FH-Hof Eine räumlich-zeitliche Suchmaschine für Sicherheitsanwendungen Richard Göbel.
Informationsgewinnung mit Agenten
Suchmaschinenlabor an der Uni Hannover Derek Daniel.
Anwendungen. © Prof. T. Kudraß, HTWK Leipzig Historie des WWW Grundlage Internet – Entwickelt Ende der 60er Jahre vom US-Militär (ARPA-Net) – Technische.
Anwendungen. © Prof. T. Kudraß, HTWK Leipzig Historie des WWW Grundlage Internet – Entwickelt Ende der 60er Jahre vom US-Militär (ARPA-Net) – Technische.
Support.ebsco.com Lernprogramm zur einfachen Suche in wissenschaftlichen Bibliotheken.
Technik Gestaltung Navigation Daten. Übersicht Client Webbrowser InternetServer.
Semantisch gestützte Suche im Internet
Erstellen einer Webseite Fortbildung am FPGZ Stephan Best.
Wie funktionieren Suchmaschinen?
SoSe 2005/Spree Datenbankretrieval AOS-Survival-Kit.
Relevanz Ranking Bisher: Sind wir davon ausgegangen, dass das Ergebnis des Rankings des statistischen Verfahrens in den Index geschrieben wird und dem.
Informationsmanagement in Fachbereichen Findet man (administrative) Informationen schnell? Kann man nach Stichworten suchen? Kann man in Publikationen.
Intelligentes Crawling im WWW mit Hilfe intuitiver Suchbedingungen
RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.
Manfred Thaller, Universität zu Köln Köln 26. November 2007
Informationen finden und beurteilen
Entitäten Extraktion Einführung
- XML-Path Language (xPath) ist eine Empfehlung des W3C - es wurde entwickelt, um durch ein XML- Dokument zu navigieren - und ist ein großer Teil von.
Wie Google Webseiten bewertet
Suchmaschinen Das "Surfen" im Internet ist eine gewisse Zeit lang interes-sant, aber auf Dauer ist dies ineffektiv und teuer, wenn man bestimmte Informationen.
W w w. s a f e r i n t e r n e t. a t Die Welt zu Hause Informationen suchen und finden.
Fressen Tiger Menschenkinder? Eine Einführung ins Internet als Quelle MATA -Workshop 2010.
AGENDA Abgrenzung SEO zu SEA Suchmaschinenwerbung (SEA)
Im Internet geht alles schneller, aber es dauert länger
1 Internet, Internet, Internet 1.2 – Online in Kontakt bleiben.
Theologische Hochschule Friedensau BS5P1-3: Literaturstudium und Recherche Baustein 7 Recherche im Internet 1 Dozent: Dietmar Päschel, Dipl.-Theol. Wintersemester.
RVK-Portal und BibScout
… und was man damit machen kann.
ESRI EUROPEAN USER CONFERENCE
Suchen und Finden. Vielfältig vorgehen Kompetenzen aufbauen Recherche als Prozess Ziel: Ergebnismengen minimieren, Qualität maximieren.
Datenbank des Deutschen Patent- und Markenamtes
Von Isabelle Spörl und Simon Schausberger
Trust and context using the RDF- Source related Storage System (RDF‑S3) and easy RQL (eRQL) Karsten Tolle und Fabian Wleklinski.
1 Kommunikation im Netz Beratungsrektor Johannes M. L. Pasquay Die modernen Informations- und Kommunikationsmedien, allen voran das Internet mit dem World.
Suchmaschinen.
Information Retrieval, Vektorraummodell
Die Ganze Welt im Computer? Informationsbeschaffung im Internet
Google (Web-Suchmaschine) Google Books Google Scholar
Das Interenet als Recherchemedium nutzen!
26. Oktober 2005Autor: Walter Leuenberger Computeria Urdorf Treff vom 26. Oktober 2005 Suchmaschinen im Internet Google & Co.
Live Search Die Suchmaschine von Microsoft. Was ist Live Search? Live Search gehört zur Microsoft Windows Live Familie (Windows Live Messenger, Windows.
Datenbanken im Web 1.
Fallstudie „intelligentes“ semantisches Netz
1 6.4 Verwaltung semistrukturierter Daten - was ist das? Datenverwaltung für XML-Dokumente - Daten in XML-Gewand - eigentlich XML-Dokumente - Abbildung.
92. Deutscher Bibliothekartag
The PicSOM Retrieval System 1 Christian Steinberg.
Greenstone. Theoretischer Teil Entstehung: Entwickelt vom New Zealand Digital Library Project an der Universität von Waikato Kooperation mit der UNESCO.
OAISter wichtigste Verbundkatalog für digitale Ressourcen Open Access wissenschaftliche Literatur und Materialien im Internet frei zugänglich zu machen.
Aufbau Integrierter Informationssysteme Suchmaschinen Michael Schmidt, Marco Schopp Martin-Luther-Universität Halle-Wittenberg Hauptseminar - Halle
Suchen mit AltaVista im WebSpace
Alles wird gut! Suche im MyCoRe Jens Kupferschmidt
Lucene - die Volltext Suchmaschine
 Präsentation transkript:

Fallstudie

2 Statistik April Dokumente Jan Mio. Dokumente Performance 3 Mio. Queries pro Tag 9. Juni 2000 Most popular search engines used by web surfers.

3 Historie 1994 von Studenten an der University of Washington entwickelt Brian Pinkerton erste Volltext-Suchmaschine im Internet 1995 an America Online Inc. verkauft 1996 von Excite, Inc. aquiriert 1997 Channels, neue Features, Facelift

4 Design UI / Query-Server Datenbank Suchmaschine Agenten / Library

5 UserInterface

6 Query-Server verarbeitet Queries –Vektor Space Query Model Queries –Boolesche Operatoren: ANDOR- AND- und NOT-Verknüpfung –Näherungsoperatoren: Phrase-Suche mit relevanter oder mit beliebiger Reihenfolge der eingegebenen Begriffe Suche mit angegebener Anzahl Zwischenwörtern zwischen den Begriffen –Klammersetzung möglich

7 Suchmaschine Real-time search mode –Tiefensuche –Query über Index (Datenbank) initiale Liste relevanter Dokumente, gerankt –Folgen unbekannter Links dieser Dokumente neue Dokumente in Liste –Re-Run, bis Zeitlimit oder genug Ergebnisse Liefert Pointer-Liste auf Dokumente, die Wort enthalten

8 Suchmaschine Indexing Mode –Breitensuche –neu gefundenes Dokument Eintragen des Servers auf Liste –ein Dokument jedes neues Servers wird untersucht und indexiert –dann sequentielle Suche nach neuen Servern –Idee: Aufbau eines möglichst großen Indexes von möglichst vielen verschiedenen Server

9 Datenbank Voll-Text-Index –Vector-Space-Model –Unterteilt in Stream von Wörtern (Titel/Body) –Stoppwörter entfernt Repräsentation des Webs als Graph –Informationen über Dokumente, Server und Links –separat gespeichert in btrees –Link im Dok. ist Pointer auf anderes Dok.

10 Agent Suchmaschine: –Findet freien Agenten –"retrieve this URL." Agent benutzt CERN WWW library Antwort: –Objekt mit Dokument-Inhalt –Oder: Erkärung, warum nicht untersucht < 15 Agenten in unabhängigen Prozessen