Wie funktionieren Suchmaschinen?

Slides:



Advertisements
Ähnliche Präsentationen
Algorithmen und Datenstrukturen
Advertisements

Hinweise zur Lizenz Diese PowerPoint-Präsentation steht unter der Creative-Commons CC-BY-NC-SA-Lizenz Sie dürfen: das Werk vervielfältigen, verbreiten.
Intelligente Anwendungen im Internet
HS-Projekt Friedrich Junge-Schule, Kl. 9c, 2011 Wie funktionieren Internet-Server? Web-Server auf eigener Domain und Game-Server für Internet-Spiele Teilnehmer:
Tipps und Tricks bei der Internetsuche
Herzlich willkommen zur Veranstaltung „Internet-Recherche“
HyperText Markup Language
Internet Applikationen – Search Engines Copyright ©2003, 2004 Christian Donner. Alle Rechte vorbehalten. Architektur Moderner Internet Applikationen.
BSZ SWBplus / Friederike Gerland 1 SWBplus Datenbank für Inhaltsverzeichnisse, Rezensionen, Abstracts.
Google Larry Page Sergej Brin 7. Sept Google Inc. PageRank – Citation Index – Qualität der Suchergebnisse Wider die Lügen im Hyperraum – Ranking.
Webseiten, die gefunden werden Dr. Eduard Heindl, Heindl Internet AG Tübingen.
Seminar Textmining WS 06/07 Aufgaben IV Postings Datei Clustering Probabilistisches Information Retrieval.
Musterlösung IT-Struktur an Schulen © M. Stütz, F. Wrede LEU - Zentrale Planungsgruppe Netze am Kultusministerium Baden-Württemberg zwei Pflege der Internetdienste.
Manfred Thaller, Universität zu Köln Köln 10. Dezember 2010
Auswertung der Interviews
Daffodil Such-/ Agentensystem zur Literaturrecherche in Digitalen Bibliotheken Prototypen PIANO, 2000 zielt auf strategische Unterstützung während Informationssuchprozesses.
Support.ebsco.com Business Source-Suche in EBSCOhost Lernprogramm.
Fallstudie. 2 Statistik April Dokumente Jan Mio. Dokumente Performance 3 Mio. Queries pro Tag 9. Juni 2000 Most popular search engines.
Sortierverfahren Richard Göbel.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/5 Grundtechniken des Information Retrieval Deskribierung Hierunter versteht man eine manuelle.
Suchmaschine vs. Katalog Such-Robots i.d.R. werden alle Seiten erfasst täglich werden mehrere Mio. Seiten besucht Redaktion relativ wenig Seiten erfasst.
XINDICE The Apache XML Project Name: Jacqueline Langhorst
Benutzen von Internetseiten
Suche über Webseiten. Eingabe Suchbegriff Lossau.
Text-Retrieval mit Oracle Vortrag von Andreas Mück & David Diestel.
Support.ebsco.com Lernprogramm zur einfachen Suche in wissenschaftlichen Bibliotheken.
Relevanz Ranking Bisher: Sind wir davon ausgegangen, dass das Ergebnis des Rankings des statistischen Verfahrens in den Index geschrieben wird und dem.
Relevanz Ranking Bisher:
MeiNetz-Suche Wie kann man in meiNetz etwas suchen? 1.durch Gruppen browsen 2.Suchfunktion.
Intelligentes Crawling im WWW mit Hilfe intuitiver Suchbedingungen
1 Nutzen Sie diese Powerpoint-Präsentation beim Selbstlernen oder in Veranstaltungen zur Einführung in das jeweilige Thema. Einführung Lernmodul Nutzungsbedingungen:
Manfred Thaller, Universität zu Köln Köln 26. November 2007
ProQuest Business Databases
Neuer Aufbau, neue Elemente Schubladen In unseren neuen Schubladenelementen hat viel Information auf wenig Raum Platz. Sie öffnen eine Schublade durch.
Seniorkom.at vernetzt Jung & Alt Das Internet ist reif
Suchmaschinen Das "Surfen" im Internet ist eine gewisse Zeit lang interes-sant, aber auf Dauer ist dies ineffektiv und teuer, wenn man bestimmte Informationen.
Zur Arbeit mit Suchmaschinen
Erste Schritte mit PHP 5 von Max Brandt, 22. September 2006.
W w w. s a f e r i n t e r n e t. a t Die Welt zu Hause Informationen suchen und finden.
Suchmaschinen am Theo Groß und Bernhard Meyer.
Fressen Tiger Menschenkinder? Eine Einführung ins Internet als Quelle MATA -Workshop 2010.
Im Internet geht alles schneller, aber es dauert länger
Theologische Hochschule Friedensau BS5P1-3: Literaturstudium und Recherche Baustein 7 Recherche im Internet 1 Dozent: Dietmar Päschel, Dipl.-Theol. Wintersemester.
CGI (Common Gateway Interface)
1 Nutzen Sie diese Powerpoint-Präsentation beim Selbstlernen oder in Veranstaltungen zur Einführung in das jeweilige Thema. Einführung Lernmodul Nutzungsbedingungen:
Wegweiser im Datenjungel
Modul 1 Suchumgebung (3): Suchsysteme
Agenda Rückblick 2. Aufbau der Software Benutzeroberfläche 4. Ausblick
Suchmaschinen.
Die Ganze Welt im Computer? Informationsbeschaffung im Internet
Web-Suche.
->Prinzip ->Systeme ->Peer – to – Peer
Google (Web-Suchmaschine) Google Books Google Scholar
Das Interenet als Recherchemedium nutzen!
Suchmaschinen im Internet
TUDWCMS Wie kann der Autor eines Dokumentes geändert werden ?
26. Oktober 2005Autor: Walter Leuenberger Computeria Urdorf Treff vom 26. Oktober 2005 Suchmaschinen im Internet Google & Co.
Topic Maps: Personal Brain
Webserver Apache & Xampp Referenten: Elena, Luziano und Sükran
Internetrecherche Sebastian Wolf, Universitätsbibliothek Bielefeld Februar 2014.
Jede Suchmaschine verfügt über einen Datenbestand, auf den zur Beantwortung von Suchanfragen zugegriffen wird. Das System zur Erfassung von.

Recherche-Workshop der Stadtbücherei Metzingen Schritte zur erfolgreichen Recherche.
Inhaltsverzeichnis erstellen
Wie verwende ich Suchmaschinen richtig?
Suchen und Finden Wie verwende ich Suchmaschinen richtig?
Marketingcontrolling Kapitel 4: Suchmaschinenmarketing Teil 1
Recherche in der Datenbank Statista
Suchmaschinen im Internet
„Online Recherche – Google & Co. richtig nutzen“
 Präsentation transkript:

Wie funktionieren Suchmaschinen? Quelle: Bekavac 2001

Elemente von Suchmaschinen 27.03.2017 Elemente von Suchmaschinen Web Roboter / Spider / Crawler Durchlaufen regelmäßig das Web nach neuen Informationen Indexierung Aufbereitung von Dokumenten Speicherung im Index / in der Datenbank der Suchmaschine Dateisystem, das für die Suche geeignet ist Retrievalsystem Suche im Index Ausgabe der Dokumentanzeige für Nutzer Ergebnis Input WWW Recherche Indexierung Retrievalsystem Index WS 2006/2007 Spree

Index und Indexierung Index 27.03.2017 Index und Indexierung Index - Datenstruktur für die unstrukturierten Daten, die so aufgebaut ist, dass sie rasch durchsucht werden kann. (Tabellenform) Indexierung - Prozess der Erstellung eines Indexes. Bsp.: Stichwortverzeichnis im Buch Schnellstmögliche Lokalisierung von Seiten, die bestimmte Themen behandeln. Google’s Index besteht aus 3 Milliarden Seiten. Index WS 2006/2007 Spree

Indexierung – invertiertes Dateisystem 27.03.2017 Indexierung – invertiertes Dateisystem Um einen schnellen Zugriff auf Textdokumente über enthaltene Stichwörter zu ermöglichen, müssen die Texte zu einem invertierten Dateisystem aufbereitet werden. Ein invertiertes Dateisystem besteht aus den direkten Dateien. Das sind die Textdokumente. dem Index. Das ist eine alphabetische Liste der in den direkten Dateien enthaltenen Stichwörter. Jede Indexeintragung verweist wiederum auf eine invertierte Datei. den invertierten Dateien. Sie sind die Verbindungen zwischen dem Index und den direkten Dateien. Sie verweisen auf alle Textdokumente, in denen das bestimmte Stichwort vorkommt. Außerdem enthalten sie Informationen, die für ein Rankingverfahren Quelle: Glöggler, Kap. 3.2 und 3.3.3 WS 2006/2007 Spree

Verbleibt auf lokalem Server Die direkte Datei Verbleibt auf lokalem Server Doc1 <p>Er konnte nie über etwas lachen, wie kann ein <b>Mensch</b> so tief verflachen!</p> Doc2 Wozu, so fragt man sich, Reichtum, Wohlstand, Macht, wenn alles dies die Menschen nur verflacht? http://www.morgenstern/texte/text1.html http://www.morgenstern/texte/text2.html WS 2006/2007 Spree

Die alphabetische Liste (Ausschnitt) Ein Wort wird nur einmal in den Index aufgenommen Wird von Suchmaschine gespeichert numerisch sortierter Index alphabetisch sortierter Index Wortnr. Stichwort 9 ein konnte 2 10 mensch lachen 6 11 so macht 20 12 tief man 16 13 verflachen 14 wozu menschen 25 15 fragt nie 3 nur 26 17 sich reichtum 18 WS 2006/2007 Spree

Indexierung – invertiertes Dateisystem 27.03.2017 Indexierung – invertiertes Dateisystem Nr. Stichwort DocID/url Position im Text tag Frequenz ... 10 http://www.morgenstern/texte/text1.html <b> 1 11 http://www.morgenstern/texte/text2.html 11 2 <p> 1 1 27 15 WS 2006/2007 Spree

Indexierung – invertiertes Dateisystem 27.03.2017 Indexierung – invertiertes Dateisystem Im alphabetischen Index herausfinden, Mensch = 10 Ablauf einer einfachen Suche nach Mensch Unter 10 im invertierten Dateisystem nachschlagen: Mensch in Doc1 1x, wichtig da fett Zur Anfrage „Mensch AND Menschen“ würde kein Dokument angezeigt. Doc1 anzeigen WS 2006/2007 Spree

Funktionsweise von Suchmaschinen 27.03.2017 Funktionsweise von Suchmaschinen Anfrage parsen Suche im Index Übereinstimmung Ranking Bewertung der Ergebnisse Sortierung nach Relevanz Wo kommen die Suchbegriffe vor? Wie oft kommen die Begriffe vor? In welcher Reihenfolge? Wie lang ist der Text? Wie viele Links verweisen auf das Dokument? Ergebnisse darstellen Text Eingabe Resultat Parse Bewertung Anfrage Index WS 2006/2007 Spree

Zum Abschluss ein Julia Salden: Google – die Macht einer Suchmaschine http://www3.ndr.de/ndrtv_pages_video/0,,OID2667208_VID2690650,00.html Und Infos zum Film http://www.tagesschau.de/thema/0,1186,OID5237910_REF_NAV_BAB,00.html WS 2006/2007 Spree