Klaus Kopperschmidt 22. Januar 2001

Slides:



Advertisements
Ähnliche Präsentationen
Der PC als Hilfsmittel für die Schule
Advertisements

Intelligente Anwendungen im Internet
Tipps und Tricks bei der Internetsuche
„Suchmaschinen – Prinzipien und Allgorithmen“ Fallstudie
Dominic Ziegler 12c Webprogrammierung.
WML – Wireless Markup Language Vortrag von Eduard Jakel.
Internet Applikationen – Search Engines Copyright ©2003, 2004 Christian Donner. Alle Rechte vorbehalten. Architektur Moderner Internet Applikationen.
Inhalt – Technische Grundlagen
Google Larry Page Sergej Brin 7. Sept Google Inc. PageRank – Citation Index – Qualität der Suchergebnisse Wider die Lügen im Hyperraum – Ranking.
1 Materialrecherche im Internet PS: Wirtschafts- und Sozialgeschichte des Autos SoSe 2002 Uwe Fraunholz.
Pflege der Internetdienste
Datenbankzugriff im WWW (Kommerzielle Systeme)
NATURAL Web-Integration 1 / 27/28-Feb-98 TST NATURAL Web-Integration Arbeitskreis NATURAL Süd Theo Straeten SAG Systemhaus GmbH Technologieberater Stuttgart.
Quantitative Internet- Charakteristiken Wie viele Pages hat das Internet? Bei welchen Wachstums-/Änderungsraten? Wie viele Suchanfragen haben die Suchmaschinen?
Fallstudie. 2 Statistik April Dokumente Jan Mio. Dokumente Performance 3 Mio. Queries pro Tag 9. Juni 2000 Most popular search engines.
Suchen und Finden von WWW-Dokumenten Internet-Tutorium WS 99/00 Plenum am :
Math-Net ein Netzwerk für die Mathematik
Web-Programmierung und Web 2.0-Technologien
Rechneraufbau & Rechnerstrukturen, Folie 14.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 14.
Webserver, © Till Hänisch 2002 Apache The open way.
Content-Management-System
Suchmaschinenlabor an der Uni Hannover Derek Daniel.
S.I.N.N. Suchmaschinennetzwerk im Internationalen Naturwissenschaftlichen Netz Ein Vortrag von Fabian A. Stehn
Wie funktionieren Suchmaschinen?
Informationsarchitektur Beschreiben und Benennen
Datenmanagement in Sensornetzen PRESTO - Feedback gesteuertes Datenmanagement - SS 2007 Sören Wenzlaff.
Seite Common Gateway Interface. Konzepte. Übersicht 1Einleitung 2Was ist CGI? 3Wozu wird CGI verwendet? 4Geschichtlicher Überblick 5Grundvoraussetzungen.
Vortragender Messung des Erfolgs einer Website Subjektive Attraktivität Besuchsintensität Produktivität Finanzielle Maße
Suchmaschinen Das "Surfen" im Internet ist eine gewisse Zeit lang interes-sant, aber auf Dauer ist dies ineffektiv und teuer, wenn man bestimmte Informationen.
EDC Entwicklerforum Geoprocessing im Web 18. Juli 2013 Benjamin Proß Ein erweiterbarer WPS Client für ArcMap.
Zur Arbeit mit Suchmaschinen
Messtudie zu Peer2Peer- Dateiverteilungssystemen Unter Bertachtung von zwei bekannten Vertretern: Napster und Gnutella.
W w w. s a f e r i n t e r n e t. a t Die Welt zu Hause Informationen suchen und finden.
Was bedeutet "Internet"? Begriff: Inter net
Suchmaschinen am Theo Groß und Bernhard Meyer.
Gezieltes und erfolgreiches Suchen
Fressen Tiger Menschenkinder? Eine Einführung ins Internet als Quelle MATA -Workshop 2010.
SSD 1, WS05/06 Gruppe 1 Newsfeed-Standards Newsfeed-Standards (RSS & Atom) Site Syndication mit XML Gruppe 1.
WEBPROGRAMMIERUNG Informatik-Präsentation von Armin Nuart.
Internet: Funktionsweise und Dienste
„Einführung ins Internet für Unkundige“
Tutorium Informationsverarbeitung 1 – SS 02
Theologische Hochschule Friedensau BS5P1-3: Literaturstudium und Recherche Baustein 7 Recherche im Internet 1 Dozent: Dietmar Päschel, Dipl.-Theol. Wintersemester.
MDA – Framework AndroMDA
9-jun-1999reto ambühler1 web bezogene dienste des WebOffices 1. web hosting 2. suchmaschinen 3. weitere dienste.
...ich seh´es kommen !.
Mark Bendix | 02. Juli 2007 | Prüf.-Nr
1 Universitätsbibliothek Johann Christian Senckenberg Das Angebot E lektronischer M edien eLearning Netzwerktag am 30. Juni 2008 Subtitel Dr. Klaus Junkes-Kirchen.
Wegweiser im Datenjungel
Hauptseminar SS 2006 Hinweise für Autoren.
Jürgen Müller Internet Service Jürgen Müller (April 1997) pro.vider.de Internetagentur GmbH (April 2000) Dipl.-Ing (FH): Fachhochschule Lübeck Master of.
3. Juni 2003Moritz Petersen Minimales Markup und Templates zur Erstellung von strukturierten Texten Ein Zwischenbericht zur Diplomarbeit.
Andrea Karner Susi Luginger
Seite 1 Institut für Wirtschaftsinformatik Universität Bern Proseminar –Literaturrecherche.
Thomas Jampen Sebastian Forster
Suchmaschinen.
Masc CJD Jugenddorf Offenburg Die Installation ProfilAC … powered by Polikles ® 25. bis 27. Januar 2005 masc ag, rotkreuz
Evaluation des sprachgesteuerten Assistenten Jasper
Web-Suche.
Willkommen zum Brückensemester
prof. dr. dieter steinmannfachhochschule trier © prof. dr. dieter steinmann Folie 1 vom Montag, 30. März 2015.
Informationsrecherche & Analyse im Netz
26. Oktober 2005Autor: Walter Leuenberger Computeria Urdorf Treff vom 26. Oktober 2005 Suchmaschinen im Internet Google & Co.
Wissenschaftssuchmaschine definiert wissenschaftliche Daten mittels Crawler = Robot Indexierung Harvesting.
Webserver Apache & Xampp Referenten: Elena, Luziano und Sükran
Suchmaschinen Seminar Prinzipien und Algorithmen Peter K. Ibach Suchmaschinen.
Aufbau Integrierter Informationssysteme Suchmaschinen Michael Schmidt, Marco Schopp Martin-Luther-Universität Halle-Wittenberg Hauptseminar - Halle
Informationswirtschaft Wirtschaftsinformatik (Bachelor, 6. Semester)
Geschichte des Internets
 Präsentation transkript:

Klaus Kopperschmidt 22. Januar 2001 Meta-Suchmaschinen Klaus Kopperschmidt 22. Januar 2001

Vorstellen, Einleitung und Motivation Klassifikation von Suchdiensten Inhalt des Vortrags Vorstellen, Einleitung und Motivation Klassifikation von Suchdiensten Suchmaschinen Überlegungen zur Konzeptionierung Beispiele von Meta-Suchmaschinen Fazit und Ausblick 22. Januar 2001 Meta-Suchmaschinen

Anforderungen an eine Recherche im WWW Die Recherche sollte so vollständig, wie möglich sein. Das Ergebnis sollte eine hohe Qualität haben. Das Ergebnis sollte schnell verfügbar sein. 22. Januar 2001 Meta-Suchmaschinen

Internet Suchdienste Klassifizierung und Beispiele Katalog, Directory Yahoo, Lycos usw. Suchmaschine, Crawler, Spider, Robot Hotbot, Yahoo, Lycos, Google, Altavista, Webcrawler usw. All-in-one-form Meta-Suchmaschine Metacrawler, Highway 61, DogPile 22. Januar 2001 Meta-Suchmaschinen

ca. 27% Abdeckung bei Altavista, May 1999 WWW und Suchmaschinen ca. 27% Abdeckung bei Altavista, May 1999 Quelle: www.searchenginewatch.com Google 600.000.000 Webseiten indiziert und 1.200.000.000 bekannt, Nov. 2000 93.047.785 Domain-Namen im Juli 2000 Quelle: Internet Software Consortium http://www.isc.org/ds/WWW-200007/index.html mehr als 550.000.000.000 Seiten im „Deep Web“ Quelle: Test 8/2000 22. Januar 2001 Meta-Suchmaschinen

Suchmaschinen - Wachstum seit 1995 und aktuelle Größe Quelle: www.searchenginewatch.com Stand: 08. November 2000 22. Januar 2001 Meta-Suchmaschinen

Probleme bei Suchmaschinen Vollständige Netzabdeckung Erreichbarkeit 404-Webseite und Aktualität Bedienung (Syntax) Ungenaue Anfragen Search-Engine-Spamming 22. Januar 2001 Meta-Suchmaschinen

Klassisches Konzept einer Meta-Suchmaschine Die Benutzer stellen Anfragen. Die Benutzer bekommen das Ergebnis präsentiert Die Meta-Suchmaschine formuliert die Anfragen für die verschiedenen Suchmaschinen Excite Google ... Yahoo Die Meta-Suchmaschine verarbeitet die Ergebnisse 22. Januar 2001 Meta-Suchmaschinen

Überlegungen zur Ergebnisbehandlung Direkte Übernahme des Ergebnisses komplett ausschnittsweise Bearbeiten der Ergebnisse entfernen von „dead links“ verschmelzen der Ergebnisse (Ranking-Problem) filtern von identischen Webseiten (Eine Seite wird durch genau einen Link repräsentiert.) 22. Januar 2001 Meta-Suchmaschinen

Identische Webseiten erkennen Bsp.: http://www.cs.washington.edu/homes/speed/home.html http://www.cs.washington.edu/homes/selberg Identische Domain, unterschiedlicher Pfad Überprüfung, ob es sich um ein Standard-Alias handelt. Überprüfung, ob der Titel der Web-Seiten gleich ist. Kompletter Text-Vergleich 22. Januar 2001 Meta-Suchmaschinen

Skalen, Bsp.: Metacrawler 0-100%, Lycos 0-1, OpenText 0- Ranking - Problem Skalen, Bsp.: Metacrawler 0-100%, Lycos 0-1, OpenText 0- Unterschiedl. Bots -> unterschiedl. Indizierung bzw. Gewichtungsalgorith. -> unterschiedl. Ranking Rankings abhängig von Anzahl des vorkommenden Suchbegriffs, Wortabstand, Anzahl der Referenzen Search-Engine-Spamming Quelle: Inquirus 22. Januar 2001 Meta-Suchmaschinen

Weitergehende Überlegungen zur Architektur client-based oder server-based online vs. last-mile-Problem Anfrage-Syntax und update-Problem 22. Januar 2001 Meta-Suchmaschinen

Personal Search Assistants MetaSeek Meta-Suchmaschinen MetaCrawler, MetaGer PrologCrawler Inquirus Personal Search Assistants MetaSeek 22. Januar 2001 Meta-Suchmaschinen

University of Washington in Seattle (Diplomarbeit) MetaCrawler (I) Http://www.metacrawler.com University of Washington in Seattle (Diplomarbeit) Betrieben von Go2net, Inc. (jetzt InfoSpace) C++, Linux und Apache Webserver 10x 2*400 Mhz PentiumII mit 512MB RAM 22. Januar 2001 Meta-Suchmaschinen

MetaCrawler (II) Quelle: „The MetaCrawler Architecture Resource Aggregation on the Web“ by Selberg und Etzioni 22. Januar 2001 Meta-Suchmaschinen

Pentium 200 mit Red Hat Linux 5.0 und Apache Webserver PrologCrawler (I) Pentium 200 mit Red Hat Linux 5.0 und Apache Webserver Sicstus Prolog 3.7.1 + PiLLoW-Library weniger als 500 LOC run(simple(Query,Nres,Ord), ResultsPage) :- s_search(Query,Nres,Results), s_process(Nres,Results,FilteredResults), sort(FilteredResults,Ord,SortedResults), build_html(SortedResults,ResultsPage). 22. Januar 2001 Meta-Suchmaschinen

PrologCrawler (II) Quelle: „A Prolog Meta-Search Engine for the World Wide Web“ von E. Bolognesi und A. Brogi 22. Januar 2001 Meta-Suchmaschinen

Http://www.inquirus.com nur für akademische Testzwecke Perl Inquirus (I) Http://www.inquirus.com nur für akademische Testzwecke Perl Pentium Pro 200 Holt Links von Suchmaschinen und untersucht eigenständig die zurückgelieferten Webseiten auf Relevanz und bewertet sie. 22. Januar 2001 Meta-Suchmaschinen

Inquirus (II) Quelle: „Inquirus, the NECI meta search engine“ von S. Lawrence und C.L. Giles 22. Januar 2001 Meta-Suchmaschinen

Personal Search Assistant (I) Gibt es jede Menge z.Bsp.: PSA, WebFerret, WebShades, Unified Financial Assistant usw. Benutzer-Profile Lokal im Hintergrund Meist Browserunabhängig 22. Januar 2001 Meta-Suchmaschinen

Personal Search Assistant (II) Quelle: „Personal Search Assistant: A Configurable Personal Meta Search Engine“ von P.R. Kaushik und K.N. Murthy 22. Januar 2001 Meta-Suchmaschinen

Abschliessender Vergleich 22. Januar 2001 Meta-Suchmaschinen

Neue Jobs: Information-Broker usw. Fazit 550.000.000.000 Webseiten Weiteres exponentielles Wachstum bei geringerem Wachstum der Suchmaschinen-Indices Meta-Suchmaschinen sind kein Allheilmittel, da sie auf Suchmaschinen bauen. Neue Jobs: Information-Broker usw. 22. Januar 2001 Meta-Suchmaschinen