Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Wie funktionieren Suchmaschinen? Quelle: Bekavac 2001.

Ähnliche Präsentationen


Präsentation zum Thema: "Wie funktionieren Suchmaschinen? Quelle: Bekavac 2001."—  Präsentation transkript:

1 Wie funktionieren Suchmaschinen? Quelle: Bekavac 2001

2 WS 2006/2007 Spree2 Elemente von Suchmaschinen Web Roboter / Spider / Crawler –Durchlaufen regelmäßig das Web nach neuen Informationen Indexierung –Aufbereitung von Dokumenten –Speicherung im Index / in der Datenbank der Suchmaschine Dateisystem, das für die Suche geeignet ist Retrievalsystem –Suche im Index –Ausgabe der Dokumentanzeige für Nutzer WW W Indexierung Index Input Retrievalsystem Recherche Ergebnis

3 WS 2006/2007 Spree3 Index und Indexierung Index - Datenstruktur für die unstrukturierten Daten, die so aufgebaut ist, dass sie rasch durchsucht werden kann. (Tabellenform) Indexierung - Prozess der Erstellung eines Indexes. Bsp.: Stichwortverzeichnis im Buch –Schnellstmögliche Lokalisierung von Seiten, die bestimmte Themen behandeln. Googles Index besteht aus 3 Milliarden Seiten. Index

4 WS 2006/2007 Spree4 Indexierung – invertiertes Dateisystem Um einen schnellen Zugriff auf Textdokumente über enthaltene Stichwörter zu ermöglichen, müssen die Texte zu einem invertierten Dateisystem aufbereitet werden. Ein invertiertes Dateisystem besteht aus den direkten Dateien. Das sind die Textdokumente.direkten Dateien dem Index. Das ist eine alphabetische Liste der in den direkten Dateien enthaltenen Stichwörter. Jede Indexeintragung verweist wiederum auf eine invertierte Datei.Index den invertierten Dateien. Sie sind die Verbindungen zwischen dem Index und den direkten Dateien. Sie verweisen auf alle Textdokumente, in denen das bestimmte Stichwort vorkommt. Außerdem enthalten sie Informationen, die für ein Rankingverfahreninvertierten Dateien Quelle: Glöggler, Kap. 3.2 und 3.3.3

5 WS 2006/2007 Spree5 Die direkte Datei Verbleibt auf lokalem Server Doc1 Er konnte nie über etwas lachen, wie kann ein Mensch so tief verflachen! te/text1.html Doc2 Wozu, so fragt man sich, Reichtum, Wohlstand, Macht, wenn alles dies die Menschen nur verflacht? texte/text2.html

6 WS 2006/2007 Spree6 Die alphabetische Liste (Ausschnitt) Ein Wort wird nur einmal in den Index aufgenommen Wird von Suchmaschine gespeichert numerisch sortierter Indexalphabetisch sortierter Index Wortnr.Stichwort Wortnr. 9einkonnte2 10menschlachen6 11somacht20 12tiefman16 13verflachenmensch10 14wozumenschen25 15fragtnie3 16mannur26 17sichreichtum18 reichtumsich17

7 WS 2006/2007 Spree7 Indexierung – invertiertes Dateisystem Nr. StichwortDocID/url Position im Text tagFrequenz tern/texte/text1.html tern/texte/text1.html tern/texte/text2.html tern/texte/text2.html 15 1

8 WS 2006/2007 Spree8 Indexierung – invertiertes Dateisystem Im alphabetischen Index herausfinden, Mensch = 10 Unter 10 im invertierten Dateisystem nachschlagen: Mensch in Doc1 1x, wichtig da fett Doc1 anzeigen Ablauf einer einfachen Suche nach Mensch Zur Anfrage Mensch AND Menschen würde kein Dokument angezeigt.

9 WS 2006/2007 Spree9 Funktionsweise von Suchmaschinen Anfrage parsen Suche im Index –Übereinstimmung Ranking –Bewertung der Ergebnisse –Sortierung nach Relevanz Wo kommen die Suchbegriffe vor? Wie oft kommen die Begriffe vor? In welcher Reihenfolge? Wie lang ist der Text? Wie viele Links verweisen auf das Dokument? Ergebnisse darstellen Bewertung Anfrage Text Eingabe Parse Index Resultat

10 WS 2006/2007 Spree10 Zum Abschluss ein Julia Salden: Google – die Macht einer Suchmaschine 8_VID ,00.html 8_VID ,00.html Und Infos zum Film 0_REF_NAV_BAB,00.html 0_REF_NAV_BAB,00.html


Herunterladen ppt "Wie funktionieren Suchmaschinen? Quelle: Bekavac 2001."

Ähnliche Präsentationen


Google-Anzeigen