Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
Veröffentlicht von:Mareike Lavis Geändert vor über 10 Jahren
1
Google & Google-Labs Adrian Schuster
2
Übersicht Google n Geschichtliches n Arbeitsweise/Technik n Funktionen –Suchmaschine Google.com vs. Google.de –Bilder, Newsgroups, Nachrichten, Katalog, Directory, Expertenrat, Toolbar, Compute
3
Übersicht Google Labs n Funktionen –VoiceSearch –Keys –Glossary –Sets n Rund um Google –Google Weblog, Googlefight
4
n Googol ~ Google –1000000000000000000000000000...0 –10 100 – Milton Sirotta (Neffe von Edward Kasner) n Gründerväter –Sergey Brin –Lawrence Page Geschichtliches
5
n Suchmaschinenprojekt an der Stanford University n BackRub mit Fähigkeit, die Links zur indizierten Seite zu erfassen. n Nutzung von gewöhnlicher Hardware n Suche nach Investoren Geschichtliches
6
n 7. September 1998: Google Inc. Menlo Park, California –Garagenfirma –10.000 Anfragen n 1999: Suchmaschine von AOL/Netscape mit 3 Mill. Anfragen n 2001: Aufkauf von Deja.com Geschichtliches
7
n heute: – >500 Angestellte – >150 Millionen Anfragen – >54 Millionen Benutzer (50% non-US) – >3 Milliarden Webseiten – >800 Millionen usenet-Posts – >330 Millionen Bilder – 36 Länderdomains Geschichtliches
8
n heute: – >100 Millionen Dollar jährlicher Umsatz – ca. 100% jährliches Wachstum Geschichtliches
9
n Browserhäufigkeit n Nutzersprachen n Mai 2001 - Oktober 2002
10
Technik n The Anatomy of a Large-Scale Hypertextual Web Search Engine 1998 n The PageRank Citation Ranking: Bringing Order to the Web 1998
11
Technik n größter kommerzieller Linux-Cluster n >10.000 Maschinen n 5 verteilte Datacenter n Google Search Appliances –Linux-Server
12
n Suchmaschine –simpel –leichtgewichtig –beständig n einfach –AND-Verknüpfung –keine Wildcards Funktionen
13
n Filetypen –12 Haupttypen Portable Document Format (pdf), PostScript (ps), Lotus 1-2-3 (wk1, wk2, wk3, wk4, wk5, wki, wks, wku), * Lotus WordPro (lwp), MacWrite (mw), Excel (xls), PowerPoint (ppt), Word (doc), Works (wks, wps, wdb), Write (wri), Rich Text Format (rtf), Text (ans, txt) –[filetype:rtf] n ähnliche Seiten (GoogleScout) Suchmaschine
14
n Übersetzungen –Englisch übersetzt in Deutsch Französisch Spanisch Portugiesich Italienisch –Erkennung von 36 Sprachen n I´m feeling lucky Suchmaschine
15
n erweitert n Syntax –[_-ausgeschlossen] –[_+eingeschlossen] –keine Wildcards (aber Paltzhalter * ) –keine Groß-/Kleinschreibung Suchmaschine
16
n Syntax –["genauer Wortlaut"] –OR oder | –[site:www.distributed.net] –[link:www.distributed.net] –[related:www.distributed.net] –[info:www.distributed.net] –[stocks: amd shr] Suchmaschine
17
n Syntax –[allintitle:arthur dent] –[intitle:beeblebrox ] –[allinurl:online/public] –[inurl:public_html] –z. B. inurl:fu-berlin site:fu-berlin.de –cache:www.inf.fu-berlin.de/inst/ags.html –date: ? Suchmaschine
18
.com vs..de n Filtermechanismus, der Suchergebnisse des deutschen Ablegers zensiert –auch Frankreich, Schweiz –keine offiziellen Informationen erhältlich n gleicher Datenbstand wie google.com n Filterung der URLs vor Anzeige der Suchergebnisse n Seiten im Cache vorhanden
19
.com vs..de n z.B. Stormfront.org n nicht sichtbar: –www2.stromfront.org –www3.stromfront.org –www4.stromfront.org –women.stromfront.org n sichtbar: –irc.stormfront.org:8000
20
Bilder images.google.com n 390 Millionen Bilder
21
Bilder images.google.com n Beurteilung/Indizierung – -Tag –Bildbeschreibung –Seiteninhalt –Bildanalyse –Duplikatentfernung n alle Suchtags möglich
22
Bilder images.google.com
23
n SafeSearch –Filterung von pornography and explicit sexual content
24
Newsgroups groups.google.com n usenet
25
Newsgroups groups.google.com n >35.000 Gruppen n >700 Millionen Postings n usenet-Start in 1979
26
Newsgroups groups.google.com n Übersicht einer Newsgroup
27
Newsgroups groups.google.com n ältestes Posting in Net.general From: sdcarl!rusty Mon May 11 09:00:58 1981 To: ucbvax^mark Subject: newsgroup fa, net, etc. Won't we need to change the.ngfile also? Also is ALL an acceptable newsgroup on the left side of the dot such that ALL.ALL will catch everything? Rusty is right (or is that "Rusty is Wright"?) - we have ALL in our.ngfile so I tend to forget this. ALL.ALL may or may not work, but ALL certainly does. Mark I plan to make the change on Tuesday unless something horrible happens.
28
Newsgroups groups.google.com n archiviert von Henry Spencer (Department of Zoology Toronto) –1981 - 1991 –141 Bänder á 120 MB
29
Nachrichten news.google.com
30
n 4000 Nachrichtenquellen n mehrmals tägliche Aktualisierung n Gruppierung nach Themen ausschließlich mittels Algorithmen n Artikel der letzten 30 Tage
31
Directory directory.google.com
32
n Webinterface für Open Directory Project (dmoz.org) n >1,5 Millionen Einträge n Verknüpfung mit Webindex zur besseren Sortierung
33
Kataloge catalogs.google.com
34
n 5400 Rubriken n mailorder-Kataloge verschiedenster Anbieter
35
Kataloge catalogs.google.com n Ergebnisanzeige
36
Expertenrat answers.google.com
37
n 500 freiwillige Experten für verschiedenste Fachgebiete bzw. Informationssuche n 2 - 200$ Kosten für Expertenantwort entsprechend der selbst eingeschätzten Schwierigkeit n 0,50$ Gebühr für Google
38
Toolbar toolbar.google.com n Button-Leiste zur Integration in Browser –nur Windows ab M$IE 5.x n Eingabefeld für Suche n PageRank-Anzeige n integrierte Update-Funktion n mit integriertem
39
Compute toolbar.google.com/dc n Distributed Computing –Berechnung der dreidimensionalen Faltung von Proteinen mit bekannter Aminosäurenstruktur –ca. 20 MB pro Monat n unauffällig mit Toolbar installiert n zufällige Aktivierung durch Google- Server
40
labs.google.com n Spielwiese für Google-Entwickler n erste Stufe im Entwicklungsprozeß n keine direkte Unterstützung der Funktionen n möglicherweise zukünftige Bestandteile der Google Services
41
Google Labs Technologien n VoiceSearch (labs.google.com/gvs.html) –Suchanfrage via Telefon –Spracherkennung und Darstellung des Ergebnisses auf spezieller Seite n Keyboard Shortcuts (labs.google.com/keys) –Navigation innerhalb der Suchergebnisse mittels Tastatur
42
Glossary labs.google.com/glossary n Finden von Wörtern, Phrasen und Akronymen
43
Glossary labs.google.com/glossary n z. B. Benzodiazepine
44
Sets labs.google.com/sets n generierte Wortlisten anhand von eigenen Beispielen
45
labs.google.com/sets
46
Rund um Google n Google Weblog (google.blogspace.com) –Sammlung von Links bezüglich Google
47
Rund um Google n Googlefight (www.googlefight.com) –Vergleich der Ergebnisanzahl zweier Suchbegriffe
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.