Blick hinter die Kulissen einer Suchmaschine

Slides:



Advertisements
Ähnliche Präsentationen
Projekt: Planung und Erstellung einer Webseite
Advertisements

Erkundung eines Berufs
Webseiten, die gefunden werden Dr. Eduard Heindl, Heindl Internet AG Tübingen.
Auswertung der Interviews
Fallstudie. 2 Statistik April Dokumente Jan Mio. Dokumente Performance 3 Mio. Queries pro Tag 9. Juni 2000 Most popular search engines.
Von Indonesien nach Deutschland
DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR neofonie neofonie Forschung und Entwicklung: Innovative Suchmethoden Präsentiert von Ronald.
Herzlich willkommen!. Halli, Hallo Halli, Hallo, herzlich willkommen! Halli, Hallo, jetzt geht es los! Halli, Hallo, herzlich willkommen, Vorhang auf.
Wie funktionieren Suchmaschinen?
Qualitätskriterien zur Beurteilung von Dokumentationen
Intelligentes Crawling im WWW mit Hilfe intuitiver Suchbedingungen
Qualität von Web-Suchmaschinen Search Engine Stragies Munich 2005 Dirk Lewandowski Heinrich-Heine-Universität Düsseldorf, Abt. Informationswissenschaft.
Matthias hat ein interessantes Hobby und uns seine Ausrüstung mitgebracht. Einige Kinder wissen schon sehr viel über Tennis. Trotzdem ergeben sich Fragen,
Informationen finden und beurteilen
Projekt: Planung und Erstellung einer Webseite Ziel ist die Erstellung einer Webseite, die den Anforderungen einer Organisation (z.B. Unternehmen) entspricht.
Was atmet. Eine Rose. Die Haut. Ein Molekül. Holz
Das Beste, was du für deine Zukunft tun kannst, besteht darin, heute glücklich zu sein.
SEO für Kleinbetriebe mit Google Places
Seniorkom.at vernetzt Jung & Alt Das Internet ist reif
Ideen der Informatik Suchen und Sortieren [Ordnung muss sein…]
Zur Arbeit mit Suchmaschinen
W w w. s a f e r i n t e r n e t. a t Die Welt zu Hause Informationen suchen und finden.
Fressen Tiger Menschenkinder? Eine Einführung ins Internet als Quelle MATA -Workshop 2010.
Unterwegs im Internet.
Don`t make me think! A Common Sense Approach to Web Usability
Suchen im Internet - Systematisch !!!
Im Internet geht alles schneller, aber es dauert länger
„Das Beste an meiner Entscheidung war wohl bisher, dass ich es überhaupt gewagt habe.“ Laura Lender, Austauschschülerin in Schweden 2012/13 „Ich habe mich.
Offsite –Optimierung bzw. wo Sie noch gefunden werden
Auswertung der Mitarbeiterumfrage aktive Mitarbeiter Stand: Umfragen.
Automobile Welche deutsche Automarken sieht man am häufigsten in Deutschland? Wie viele Autos gibt es pro Person in Deutschland durchschnittlich? Wann.
Von Patrik, Yannik, Marc und Luca
Ein wichtigtuender Student, der bei einem Fußballspiel anwesend war, machte sich die Mühe, einem älteren Mann, der neben ihm saß, zu erklären, warum.
Wer von euch hat Lust auf ein Spiel?
Zuerst…ein bisschen Wiederholung - Adjektive
Wie schreibe ich meine Facharbeit?
Einfach so zum Lesen und Nachdenken
Elternabend der Schule … vom …
Seite 1 Institut für Wirtschaftsinformatik Universität Bern Proseminar –Literaturrecherche.
Fachberater für Computer an Förderschulen © Wolfgang Bossert 2007 Was ist web 2.0?
Checkliste für die Einleitung
Suchmaschinen.
Wolfgang´s Powerpoint Präsentation Ich habe gelernt.
Die Computertradition. Die ersten Anfänge von Informationsorganisation liegen bereits Jahrhunderte zurück: Philosophie: Übersicht über das Weltwissen.
Gefährliche Post Eine kurze Präsentation über die Gefahren von -Anhängen. Klicken Sie hier einmal und lehnen Sie sich zurück.
Information Retrieval, Vektorraummodell
Management, Führung & Kommunikation
Die Ganze Welt im Computer? Informationsbeschaffung im Internet
Freunde und… das Internet
JANIK BAUMANN | MANUEL LOPEZ | RYAN HILLHOUSE | LUKAS KAMBER
Suchmaschinen im Internet
Pop Songs Die Ärtze – ‘Deine Schuld’ Inhaltsübersicht 1)Allgemein 2)Unser deutscher Lieblingssong 1) Allgemein 2) Deshalb wählten wir diesen Song 3)
26. Oktober 2005Autor: Walter Leuenberger Computeria Urdorf Treff vom 26. Oktober 2005 Suchmaschinen im Internet Google & Co.
Открытый урок в 8 классе Thema: Das Schulsystem in Deutschland.
- Für die meisten bedeutet Internetrecherche das Eintippen eines Suchbegriffs in eine Suchmaschine. - Wenn das Gesuchte aber schwieriger ist, muss man.
E r f a h r u n g e n.
Dreamteam: Web 2.0 und der Katalog Anne Christensen und Thomas Hapke GBV-Verbundkonferenz
Arten von Suchwerkzeugen
Könntest Du in einem Jahr sagen
Wer klickt denn da? Von „Silver Surfers“ und „Eye Catchern“ Das Internet-Verhalten der Nutzer.
Recherche-Workshop der Stadtbücherei Metzingen Schritte zur erfolgreichen Recherche.
Übungsart: Seite: Bearbeitet von: Siegbert Rudolph Lesemotivationstraining Titel: Quelle: Nächste Seite 1 Übungsart: Titel: Textquelle: Leseübungen: Da.
Der wichtigste Körperteil
Wie verwende ich Suchmaschinen richtig?
Googelnde Wikipedianer
Suchen und Finden Wie verwende ich Suchmaschinen richtig?
Der Infinitiv Grammatikteil 1.
Suchmaschinen im Internet
Wie sucht man im Internet und welche Web-Browser kennt man
 Präsentation transkript:

Blick hinter die Kulissen einer Suchmaschine

Matthias Dreier, SCIL St. Gallen, matthias.dreier@unisg.ch

Werner Hartmann, ETH Zürich und infoSense, hartmann@infosense.ch

Warum eine didaktische Suchmaschine?

Typisches Suchverhalten Bekannte Sites sind wichtige Ausgangspunkte für User und werden immer wieder besucht. User surfen auf dem Web und benutzen dabei eine lokale Backtracking-Strategie. User verwenden oft Suchmaschinen und wechseln den Suchdienst eher selten. User planen die Suche kaum, verwenden einfache Suchanfragen und nutzen die Interaktion mit dem Suchdienst (z.B. Relevanzfeedback) kaum. User schätzen die Glaubwürdigkeit der Informationen auf dem Web als hoch ein. Marilyn Domas White, Mirja Iivonen: Questions as a factor in Web search strategy. Information Processing and Management 37 (2001), Heft 5, 721–740.

Gefragt: Langlebiges Konzeptwissen Gängige Suchmaschinen sind heute technisch fast ausgereizt. Entscheidende Verbesserungen können nur durch systematischeres Vorgehen der Benutzer erreicht werden. Amanda Spink: A user-centered approach to evaluating human interaction with Web search engines: an exploratory study. In: Information Processing and Management 38 (2002), Heft 3, 401–426. Amanda Spink, Bernard J. Jansen, Dietmar Wolfram, Tefko Saracevic: From E-Sex to E-Commerce: Web Search Changes. In: IEEE Computer 35 (2002), Heft 3, 107–109. Marilyn Domas White, Mirja Iivonen: Questions as a factor in Web search strategy. Information Processing and Management 37 (2001), 5, 721–740.

Mangelndes Problembewusstsein Eine aktuelle Untersuchung aus den USA zeigt: 96% der User sind überzeugt von ihren Suchfähigkeiten, 62% sogar sehr überzeugt 87% haben gute Erfahrungen mit Suchmaschinen, 17% sagen sogar, sie finden immer was sie suchen 68% glauben, Suchmaschinen liefern zuverlässige, unparteiische Informationen Fallows, D. (2005) Search Engine Users. Internet searchers are confident, satisfied and trusting – but they are also unaware and naïve. PEW Internet & American Life Project, Washington.

Was müsste man über Suchmaschinen wissen?

Das müsste man wissen: Typen von Fragestellungen Geschlossene Frage, bekannte Quelle Wie hoch ist die Lebens- erwartung gemäss BFS in der Schweiz? Offene Frage, bekannte Quelle Was unternimmt die WHO zur Bekämpfung der Bilharziose in Afrika? Geschlossene Frage, unbekannte Quelle Welche Bedeutung hat der Ausdruck „geile Reben“? Offene Frage, unbekannte Quelle Wie unterscheiden sich die US- und EU-Ansätze bzgl. Datenschutz im Internet?

Das müsste man wissen: Ausbeute versus Präzision relevante Dokumente gefundene Dokumente Dokumentenkollektion geringe Ausbeute geringe Präzision Dokumentenkollektion relevante Dokumente gefundene Dokumente hohe Ausbeute geringe Präzision Dokumentenkollektion relevante Dokumente gefundene Dokumente geringe Ausbeute hohe Präzision Dokumentenkollektion relevante Dokumente gefundene Dokumente hohe Ausbeute hohe Präzision

Warum geht das so schnell? Eine halbe Million Dokumente ... ... aus der ganzen Welt ... ... im Bruchteil einer Sekunde ... UNMÖGLICH!

Das müsste man wissen: Gute Vorbereitung ist alles Web-Roboter beschafft Dokumente aus Internet Suchsystem indexiert Dokumente und erstellt Tabelle mit Begriffen

Informationsanbieter müssten wissen: Das sieht eine Suchmaschine

Das müsste man wissen: So sieht ein Index aus! Das „Stichwortverzeichnis“ einer Suchmaschine

So arbeitet die Suchmaschine mit dem Index Gesucht: Übersicht über die Planeten unseres Sonnensystems Anfrage: mars Resultat: Alle Webseiten zum Begriff „mars“ aus dem Index, kaum etwas zu Planeten

So arbeitet die Suchmaschine mit dem Index Anfrage: mars

Zweiter Versuch Gesucht: Übersicht über die Planeten unseres Sonnensystems Anfrage: mars pluto saturn Resultat: Suchmaschine kombiniert Listen zu „mars“, „saturn“ und „pluto“ aus dem Index. => bessere Resultate

Zweiter Versuch Anfrage: mars pluto saturn

Das müsste man wissen: Wenige häufige Worte Sex Bier Fussball Auto .... Iglu Gölä Börkin Neadron Seltene Suchbegriffe helfen der Suchmaschine

Darf man in der Schweiz ohne Führerausweis ein Auto umparkieren, wenn man den Motor nicht anlässt?

Das müsste man wissen: Jeder Vergleich braucht Normalisierung Dokument Anfrage Da der Rote Sumpfkrebs mit Raubfischen bekämpft werden kann, ist diese Massnahme dem Gifteinsatz gegen Sumpfkrebse vorzuziehen. Krebse bekämpfen mit Gift Normalisierung rot sumpf krebs raub fisch kaempf massnahm gift einsetz sumpf krebs vorzieh krebs kaempf gift

Ganz viele Löcher ......

Wer kann das erklären?

Das müsste man wissen: Offene Fragestellungen - schlechte Normalisierung kann verheerend sein Google ist so erfolgreich, weil präzisionsorientiert Google ist so präzisionsorientiert, weil die Suchbegriffe mit „UND“ verknüpft werden. nur eine minimale Normalisierung stattfindet. Bei der einfachen Google-Suche bleibt die Ausbeute auf der Strecke.

Das müsste man wissen: Dokumentenbasierte Rangierung Anfrage: Ausdehnung Ozonloch Antarktis Dokument 1: Dokument 2: Packeis Die Ausdehnung des Packeises über der Antarktis beträgt im Winter über 20 Millionen Quadratkilometer. Ozonloch Das Ozonloch über der Antarktis erreichte im September 2001 eine Fläche von 29 Millionen Quadratkilometer.

Das müsste man wissen: Dokumentenunabhängige Rangierung

Das müsste man wissen: Geldbasierte Rangierung

Art des Informations-bedürfnisses Das müsste man wissen: Art des Informations-bedürfnisses Internet Resultate Web Roboter Dokumente Benutzer- schnittstelle Indexierung von Anfragen Anfragen Indexierung von Dokumenten Vergleich von Anfragen mit Dokumenten Index

Unsere Unterrichtserfahrung: Leute verstehen „Index“ nicht Das Problem: Index einer Suchmaschine ist eine Black-Box. Didaktische Konsequenz: Index sichtbar machen Experimente mit dem Index ermöglichen

Was zeigt Soekia? Erfassen von Dokumenten Index Indexierung Ausbeute / Präzision Dokumentenbasierte Rangierung

„Gezippter“ Ablauf einer Unterrichtseinheit mit Soekia

Vorkenntnisse der Schüler/innen Alle haben schon verschiedene Suchmaschinen benutzt. Alle haben schon einmal den Blick hinter die Kulissen einer Webseite geworfen und wissen, dass Webseiten in html geschrieben sind. Ausbeute und Präzision wurden thematisiert. Lernziele: Wir lernen effizienter und effektiver suchen!

1. Teil: Index einer Suchmaschine Index entspricht dem Stichwortverzeichnis am Schluss eines Buches ....... Nur ist der Index einer Suchmaschine ein bisschen grösser ;-) Entdecken Sie die Funktionsweise von Suchmaschinen selber!

Schnell einige html-Seiten erzeugen <body> Das ist meine Webseite, abgespeichert als meineseite.html Für den Index spannend sind Worte mit vielen Formen: Fussball, Fussballer, Fussballerin, Fussballes, Fussbälle, Fussballs, Fussballspiel, …. </body> </html>

Entdeckendes Lernen

2. Teil: Ausbeute und Präzision Wann wurde das Ozonloch entdeckt? Entdecken Sie die Bedeutung der Normalisierung selber!

Lernaufgabe Normalisierung, Ausbeute und Präzision

3. Teil: Rangierung Warum erscheint Avis vor Hertz? Spielen Sie mit den verschiedenen Rangierungsprinzipien!

Zum Abschluss: Spamwettbewerb

www.educeth.ch/informatik/soekia