„Suchmaschinen – Prinzipien und Allgorithmen“ Fallstudie

Slides:



Advertisements
Ähnliche Präsentationen
Einsatz neuer Technologien auf dem Slavistik-Portal Ivo Ulrich, Staatsbibliothek zu Berlin 32. ABDOS-Tagung, Martin (Slowakei), 19. Mai 2009.
Advertisements

Das Web in der politischen Bildung – Das Politische im Web
WML – Wireless Markup Language Vortrag von Eduard Jakel.
1993: Gründung der uni-X Software GmbH in Tecklenburg Software-Programmierung 1994: Internet-Provider und Berater im ISP-Bereich 1995: Start als regionaler.
Aufbau des Internets Überblick Prof. Dr. T. Hildebrandt
Basis-Architekturen für Web-Anwendungen
Klaus Kopperschmidt 22. Januar 2001
„Philosopher‘s Index“ by OvidSP
Standortfaktoren INTERN - Ausdrucksstark präsentieren.
Quantitative Internet- Charakteristiken Wie viele Pages hat das Internet? Bei welchen Wachstums-/Änderungsraten? Wie viele Suchanfragen haben die Suchmaschinen?
Fallstudie. 2 Statistik April Dokumente Jan Mio. Dokumente Performance 3 Mio. Queries pro Tag 9. Juni 2000 Most popular search engines.
UML im Überblick – Dipl. Ing. Ulrich Borchert / FH Merseburg 1/22
DOM (Document Object Model)
Suchmaschine vs. Katalog Such-Robots i.d.R. werden alle Seiten erfasst täglich werden mehrere Mio. Seiten besucht Redaktion relativ wenig Seiten erfasst.
XINDICE The Apache XML Project Name: Jacqueline Langhorst
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil 5.
Qualität von Web-Suchmaschinen Search Engine Stragies Munich 2005 Dirk Lewandowski Heinrich-Heine-Universität Düsseldorf, Abt. Informationswissenschaft.
Branchengespräch IT: Bericht aus der Branche Wissenstransferverbund – Studierende in die regionalen Unternehmen Melanie Kanzler Projektmanagerin BITKOM.
Deutsches Institut für Menschenrechte / Bibliothek Internet-Ressourcen des internationalen Menschenrechtsschutzes.
Internet Protocol [IP] Adressen und Adressklassen
ProQuest Business Databases
Was bedeutet "Internet"? Begriff: Inter net
DNS Domain Name System oder Domain Name Service
Entwickelt ihr Business
Hypertext Markup Language
Multilevel Optimization of E-Commerce - Strategy
thefreedictionary.com English, Medical, Legal, Financial, and Computer Dictionaries, Thesaurus, Acronyms, Idioms, Encyclopedia,
Your name Bedeutung von Internet- Technologien Gruppe 1 Andreas Feuerstein Philipp Hochratner Christian Weinzinger.
Wie spät ist es?.
BSCW and Teleworking Copyright, 1998 © Michael Sonntag Teleworking: A course using the Internet
Heute ist Dienstag, der 28. August 2007.
ESRI EUROPEAN USER CONFERENCE
Titel Sicherung der Prozeßqualität von Screenings
Jürgen Müller Internet Service Jürgen Müller (April 1997) pro.vider.de Internetagentur GmbH (April 2000) Dipl.-Ing (FH): Fachhochschule Lübeck Master of.
Oliver Spritzendorfer Thomas Fekete
SCAPE Informationstag und Demo-Event Österreichische Nationalbibliothek Max Kaiser Leiter Abteilung Forschung und Entwicklung Österreichische Nationalbibliothek.
Stand der Normung um XML (eXtensible Markup Language) & die Aktivitäten des DIN (Stand: November 2000) Bernd Bösler, Referent im DIN/NBü DIN Deutsches.
Wikis und Wikipedia Michal Simko Otis Skopik.
Peer-to-Peer-Netzwerke
Daten- und Metadatenstandards SoSe 2009 IT-Zertifikat der Philosophischen Fakultät der Universität zu Köln Dozent: Patrick Sahle 26. Juni 2009: Dublin.
Werbung und Marketing: Worauf muss geachtet werden?
Update: PR & Marketing Aktivitäten Registrar-Tag Klemens Pidner nic.at Datum:
Das kostenlose Lexikon im Internet Stelle dir eine Welt vor, in der alle freien Zugang zum gesamten Wissen der Menschen haben Computeria Wallisellen Joachim.
Willkommen zum Brückensemester
Webspace Stephan Herbst Christian Köhler. Themen des Vortrages Kurze Einführung ins Thema Kurze Einführung ins Thema Webspace - Was? Wozu? Wo? Wie? Webspace.
Jugendgemeinderat im Netz
26. Oktober 2005Autor: Walter Leuenberger Computeria Urdorf Treff vom 26. Oktober 2005 Suchmaschinen im Internet Google & Co.
Eidgenössisches Volkswirtschaftsdepartement EVD Bundesamt für Berufsbildung und Technologie BBT Förderagentur für Innovation KTI Förderagentur für Innovation.
1 INFORMATIKSERVER Hans Adam, Rainer Blaschke
Webserver, Apache und XAMPP
ROS – Robot Operating System
Webserver Apache & Xampp Referenten: Elena, Luziano und Sükran
Geschichte - Entstehung - Was ist PHP? Einordnung - Allgemeines
© Copyright 2013 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. HP PartnerOne Program.
92. Deutscher Bibliothekartag
Ein Business Blog erstellen, das tats ä chlich Geld verdient?
Jede Suchmaschine verfügt über einen Datenbestand, auf den zur Beantwortung von Suchanfragen zugegriffen wird. Das System zur Erfassung von.
OAISter wichtigste Verbundkatalog für digitale Ressourcen Open Access wissenschaftliche Literatur und Materialien im Internet frei zugänglich zu machen.
Äquator. Vor ca. 600 [Mio. Jahren] Vor ca. 560 [Mio. Jahren]
NIC, deNIC & andere NIC Vorlesung Internetdienste
New Yorker Technologie-Börsenindex
Siebten Kapitels Nach der Durcharbeitung des siebten Kapitels sollten Sie den Aufbau und die Funktionsweise des Internet erklären können die Möglichkeiten.
2008/02 ALPENLINKS.AT Web 2.0 Verzeichnis. Alpenlinks.at2 Überblick  Schnell wachsendes Linkverzeichnis für den deutschen Sprachraum  Redaktionelle.
Mehr als ein Modewort? Exzerpt nach Tim O‘Reilly, Michael Karrer
Prof. Dr.-Ing. Franz-Josef Behr Geodaten und Datenmodell
Geschichte des Internets
Vortrag von Philip Reetz
Enterprise Search Solution
 Präsentation transkript:

„Suchmaschinen – Prinzipien und Allgorithmen“ Fallstudie NorthernLight Matthias Horbank

Geschichte - gegründet September 1995 in Cambridge, Massach. online seit August 1997 damals 20 Mio. Pages und 1.800 Special Collection Sources heute über 240 Mio. Pages und 20 Mio. Special Collections rein privates Unternehmen Investoren z.B. Reuters Group. PCL und Hewlett-Packard Quelle: northernlight.com

Aufbau - Besonderheit Custom Search Folders 1 - Folder sind nicht fest vorgegeben - werden bei jeder Suchanfrage neu generiert - Informationen zum Algorithmus unbekannt (patentiert) - vier Typen: Subject, Source, Document Type, Language - Folder verschachteln sich, bis max. 26 Einträge pro Folder Quelle: northernlight.com

Aufbau - Besonderheit Custom Search Folders 2

Aufbau - Besonderheit Custom Search Folders 3

Aufbau - Besonderheit Custom Search Folders 4

Aufbau - Besonderheit Custom Search Folders 5

Aufbau - Special Collections - enthalten Sammlungen von Artikeln verschiedener Veröffentlichungen - sie sind i.a. nicht im Internet verfügbar - können gleichzeitig oder unabhängig vom Web durchsucht werden - kurzes, kostenloses Summary - ganzer Artikel gegen Gebühr von ein bis vier Dollar - Special Collections sollen in wissenschaftskreisen sehr beliebt sein Quelle: northernlight.com

Technologie - Server läuft auf Apache 1.3.9 unter Solaris - Name des Spiders ist Gulliver - läuft auf drei Hosts: scooby.~, taz.~ und gulliver.northernlight.com - läßt sich durch Tag „gulliver“ ausschließen - indiziert 2-3 Mio. Pages pro Tag Quellen: northernlight.com, The Web Robots Database

Statistiken 1 - Nummer der indizierten Seiten (Stand 15.6.2000, 19:50 Uhr): 242,317,169 - zu prüfen durch: Quelle: northernlight.com

Statistiken 2 Quelle: searchengineshowdown.com

Statistiken 3 Quelle: Search Engine Watch

Statistiken 4 Quelle: Search Engine Watch

Vielen Dank für die Aufmerksamkeit !

Gestern registrierte .DE-Domains: 54.137 Quelle: nic.de