Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Google & Google-Labs Adrian Schuster. Übersicht Google n Geschichtliches n Arbeitsweise/Technik n Funktionen –Suchmaschine Google.com vs. Google.de –Bilder,

Ähnliche Präsentationen


Präsentation zum Thema: "Google & Google-Labs Adrian Schuster. Übersicht Google n Geschichtliches n Arbeitsweise/Technik n Funktionen –Suchmaschine Google.com vs. Google.de –Bilder,"—  Präsentation transkript:

1 Google & Google-Labs Adrian Schuster

2 Übersicht Google n Geschichtliches n Arbeitsweise/Technik n Funktionen –Suchmaschine Google.com vs. Google.de –Bilder, Newsgroups, Nachrichten, Katalog, Directory, Expertenrat, Toolbar, Compute

3 Übersicht Google Labs n Funktionen –VoiceSearch –Keys –Glossary –Sets n Rund um Google –Google Weblog, Googlefight

4 n Googol ~ Google –1000000000000000000000000000...0 –10 100 – Milton Sirotta (Neffe von Edward Kasner) n Gründerväter –Sergey Brin –Lawrence Page Geschichtliches

5 n Suchmaschinenprojekt an der Stanford University n BackRub mit Fähigkeit, die Links zur indizierten Seite zu erfassen. n Nutzung von gewöhnlicher Hardware n Suche nach Investoren Geschichtliches

6 n 7. September 1998: Google Inc. Menlo Park, California –Garagenfirma –10.000 Anfragen n 1999: Suchmaschine von AOL/Netscape mit 3 Mill. Anfragen n 2001: Aufkauf von Deja.com Geschichtliches

7 n heute: – >500 Angestellte – >150 Millionen Anfragen – >54 Millionen Benutzer (50% non-US) – >3 Milliarden Webseiten – >800 Millionen usenet-Posts – >330 Millionen Bilder – 36 Länderdomains Geschichtliches

8 n heute: – >100 Millionen Dollar jährlicher Umsatz – ca. 100% jährliches Wachstum Geschichtliches

9 n Browserhäufigkeit n Nutzersprachen n Mai 2001 - Oktober 2002

10 Technik n The Anatomy of a Large-Scale Hypertextual Web Search Engine 1998 n The PageRank Citation Ranking: Bringing Order to the Web 1998

11 Technik n größter kommerzieller Linux-Cluster n >10.000 Maschinen n 5 verteilte Datacenter n Google Search Appliances –Linux-Server

12 n Suchmaschine –simpel –leichtgewichtig –beständig n einfach –AND-Verknüpfung –keine Wildcards Funktionen

13 n Filetypen –12 Haupttypen Portable Document Format (pdf), PostScript (ps), Lotus 1-2-3 (wk1, wk2, wk3, wk4, wk5, wki, wks, wku), * Lotus WordPro (lwp), MacWrite (mw), Excel (xls), PowerPoint (ppt), Word (doc), Works (wks, wps, wdb), Write (wri), Rich Text Format (rtf), Text (ans, txt) –[filetype:rtf] n ähnliche Seiten (GoogleScout) Suchmaschine

14 n Übersetzungen –Englisch übersetzt in Deutsch Französisch Spanisch Portugiesich Italienisch –Erkennung von 36 Sprachen n I´m feeling lucky Suchmaschine

15 n erweitert n Syntax –[_-ausgeschlossen] –[_+eingeschlossen] –keine Wildcards (aber Paltzhalter * ) –keine Groß-/Kleinschreibung Suchmaschine

16 n Syntax –["genauer Wortlaut"] –OR oder | –[site:www.distributed.net] –[link:www.distributed.net] –[related:www.distributed.net] –[info:www.distributed.net] –[stocks: amd shr] Suchmaschine

17 n Syntax –[allintitle:arthur dent] –[intitle:beeblebrox ] –[allinurl:online/public] –[inurl:public_html] –z. B. inurl:fu-berlin site:fu-berlin.de –cache:www.inf.fu-berlin.de/inst/ags.html –date: ? Suchmaschine

18 .com vs..de n Filtermechanismus, der Suchergebnisse des deutschen Ablegers zensiert –auch Frankreich, Schweiz –keine offiziellen Informationen erhältlich n gleicher Datenbstand wie google.com n Filterung der URLs vor Anzeige der Suchergebnisse n Seiten im Cache vorhanden

19 .com vs..de n z.B. Stormfront.org n nicht sichtbar: –www2.stromfront.org –www3.stromfront.org –www4.stromfront.org –women.stromfront.org n sichtbar: –irc.stormfront.org:8000

20 Bilder images.google.com n 390 Millionen Bilder

21 Bilder images.google.com n Beurteilung/Indizierung – -Tag –Bildbeschreibung –Seiteninhalt –Bildanalyse –Duplikatentfernung n alle Suchtags möglich

22 Bilder images.google.com

23 n SafeSearch –Filterung von pornography and explicit sexual content

24 Newsgroups groups.google.com n usenet

25 Newsgroups groups.google.com n >35.000 Gruppen n >700 Millionen Postings n usenet-Start in 1979

26 Newsgroups groups.google.com n Übersicht einer Newsgroup

27 Newsgroups groups.google.com n ältestes Posting in Net.general From: sdcarl!rusty Mon May 11 09:00:58 1981 To: ucbvax^mark Subject: newsgroup fa, net, etc. Won't we need to change the.ngfile also? Also is ALL an acceptable newsgroup on the left side of the dot such that ALL.ALL will catch everything? Rusty is right (or is that "Rusty is Wright"?) - we have ALL in our.ngfile so I tend to forget this. ALL.ALL may or may not work, but ALL certainly does. Mark I plan to make the change on Tuesday unless something horrible happens.

28 Newsgroups groups.google.com n archiviert von Henry Spencer (Department of Zoology Toronto) –1981 - 1991 –141 Bänder á 120 MB

29 Nachrichten news.google.com

30 n 4000 Nachrichtenquellen n mehrmals tägliche Aktualisierung n Gruppierung nach Themen ausschließlich mittels Algorithmen n Artikel der letzten 30 Tage

31 Directory directory.google.com

32 n Webinterface für Open Directory Project (dmoz.org) n >1,5 Millionen Einträge n Verknüpfung mit Webindex zur besseren Sortierung

33 Kataloge catalogs.google.com

34 n 5400 Rubriken n mailorder-Kataloge verschiedenster Anbieter

35 Kataloge catalogs.google.com n Ergebnisanzeige

36 Expertenrat answers.google.com

37 n 500 freiwillige Experten für verschiedenste Fachgebiete bzw. Informationssuche n 2 - 200$ Kosten für Expertenantwort entsprechend der selbst eingeschätzten Schwierigkeit n 0,50$ Gebühr für Google

38 Toolbar toolbar.google.com n Button-Leiste zur Integration in Browser –nur Windows ab M$IE 5.x n Eingabefeld für Suche n PageRank-Anzeige n integrierte Update-Funktion n mit integriertem

39 Compute toolbar.google.com/dc n Distributed Computing –Berechnung der dreidimensionalen Faltung von Proteinen mit bekannter Aminosäurenstruktur –ca. 20 MB pro Monat n unauffällig mit Toolbar installiert n zufällige Aktivierung durch Google- Server

40 labs.google.com n Spielwiese für Google-Entwickler n erste Stufe im Entwicklungsprozeß n keine direkte Unterstützung der Funktionen n möglicherweise zukünftige Bestandteile der Google Services

41 Google Labs Technologien n VoiceSearch (labs.google.com/gvs.html) –Suchanfrage via Telefon –Spracherkennung und Darstellung des Ergebnisses auf spezieller Seite n Keyboard Shortcuts (labs.google.com/keys) –Navigation innerhalb der Suchergebnisse mittels Tastatur

42 Glossary labs.google.com/glossary n Finden von Wörtern, Phrasen und Akronymen

43 Glossary labs.google.com/glossary n z. B. Benzodiazepine

44 Sets labs.google.com/sets n generierte Wortlisten anhand von eigenen Beispielen

45 labs.google.com/sets

46 Rund um Google n Google Weblog (google.blogspace.com) –Sammlung von Links bezüglich Google

47 Rund um Google n Googlefight (www.googlefight.com) –Vergleich der Ergebnisanzahl zweier Suchbegriffe


Herunterladen ppt "Google & Google-Labs Adrian Schuster. Übersicht Google n Geschichtliches n Arbeitsweise/Technik n Funktionen –Suchmaschine Google.com vs. Google.de –Bilder,"

Ähnliche Präsentationen


Google-Anzeigen