Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz

Slides:



Advertisements
Ähnliche Präsentationen
Dauermagnete Bei magnetischen Materialien unterscheidet man Eisenkerne bzw. Weicheisenstücke und Dauermagnete bzw. Hart-magnetische Materialien. Dauermagnete.
Advertisements

TAGUNG DER DEUTSCH-LUSITANISCHEN JURISTENVEREINIGUNG O processo penal português Panorâmica introdutória Der portugiesische Strafprozess ein einführender.
Ach wie gut, daß niemand weiß Der Schutz von Wissen
Herzlich Willkommen bei SIMPLE STABLE BULDING
Adjektivendungen Tabellen und Übungen.
ZWILLING Neuheiten 2008.
Das Hexenkochbuch Nicht Rattenschwänze, Spinnenbein
 Präsentation transkript:

Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl Google ist sehr kreativ, auch was die Bearbeitung seines Logos betrifft.

Themen Woher kommt Google Wie arbeitet Google Was ist an Google einmalig Warum ist Google so mächtig Wohin geht Google Ein kurzer Überblick Eduard Heindl, FH-Furtwangen

Googlesteinzeit 1995 treffen sich Sergey Brin (23) und Larry Page (24) 1996 BackRub System an der Stanford University 100.000$ von Andy Bechtolsheim 7. September 1998 Start Google Inc. Im selben Jahr als das Internet in Deutschland als Medium anerkannt wurde, haben sich Brin und Page getroffen, der Russe und der Amerikaner um das erfolgreichste Projekt nach dem Ende des kalten Kriegs zu starten, eine universelle Suchmaschine. *September 21, 1999, the beta label came off the website. Eduard Heindl, FH-Furtwangen

Firmenphilosophie perfect search engine defined by co-founder Larry Page as something that: "understands exactly what you mean and gives you back exactly what you want." Die Vision der Gründer ist eine kluge Maschine, die dem Menschen hilft seine Fragen zu beantworten Eduard Heindl, FH-Furtwangen

Live of a Query Quelle: http://www.google.com/corporate/query.html Der Lebenslauf einer Frage ist relativ einfach, die Fragen werden an einen Webserver gesendet, dahinter sucht ein massives Rechnercluster nach Einträgen und erstellt geeignete Zitate, die Antwortzeit liegt unterhalb einer halben Sekunde! Quelle: http://www.google.com/corporate/query.html Eduard Heindl, FH-Furtwangen

Der PageRank C A B E D F G H I K O M L N Google sortiert nach PageRank Je mehr Links auf ein Dokument deuten, um so besser Algorithmus berücksichtigt aber auch den PageRank der Verweisseiten Rekursives Problem „solving an equation of more than 500 million variables and 2 billion terms“ (laut Google) C A B E D F G H I Link K O M L N Eduard Heindl, FH-Furtwangen

Die Linkmatrix C A B E D F G H I K O M L N Link A B C D E F G H I K L 1 2 C A B E D F G H I Link K O M L N Eduard Heindl, FH-Furtwangen

Was ist Intelligenz Wissen wo was wichtiges steht Google's technology uses the collective intelligence of the web to determine a page's importance1 There is no human involvement or manipulation of results1 'The ultimate search engine would be smart; it would understand everything in the world,' says Page.2 [1] http://www.google.com/corporate/tech.html [2] http://www.aaai.org/AITopics/assets/AIalerts/alert.12.18.02.html Eduard Heindl, FH-Furtwangen

Besonderheiten an Google Eduard Heindl, FH-Furtwangen

Domainnamen unter den Top 5oo Yahoo Go Goo Gooooal Cool Room Moon Wanadoo Football Book Cartoon OO Objekt Orientiert Goodday tool School Choose Look Kategorie Gold Gov Pogo Bingo God Google Googelb? http://www.alexa.com/site/ds/top_500 Eduard Heindl, FH-Furtwangen

Die größte Maschine Das Rechenzentrum von Google hat 100.000 Rechenknoten mit 6 PetaByte Festplattenspeicher (Größte Rechnerkapazität der Welt)* Google hat „alle“ Dokumente des Webs gespiegelt >30 Terabyte 4.285.199.774 Dokumente, warum? 232=4.294.967.296 Aktuelles Limit für Longinteger! >1.000 Anfragen pro Sekunde Erstmals ist ein Firmennamen zu einem Verb geworden „googeln“ Anmerkung: ein PetaByte = 250 Byte = 1024 TeraByte * John Markoff in der NYT vom 13. April 2003 Eduard Heindl, FH-Furtwangen

Forschung Ungewöhnlich schnelles Wachstum bei den R&D Ausgaben! Über 100 Ph.D.´s bei Google, „industry's most unorthodox portfolio of human capital “* *NYT, June 6, 2004 Eduard Heindl, FH-Furtwangen

Zeitgeist Google kennt die Trends Aufgelöst nach Länder Aufgelöst nach Themen Statistisch aussagekräftig? www.google.com/press/zeitgeist.html Eduard Heindl, FH-Furtwangen

Google News Ein Roboter der Zeitung liest und schreibt Google News sortiert aus über 2400 Quellen wichtige Meldungen in die einzelnen Rubriken Zusätzlich können zu Suchbegriffen News Meldungen abgefragt werden Zweiter Platz hinter Washington Post im Online Journalismus EPpy Award Eduard Heindl, FH-Furtwangen

Noch ist der Roboter nicht perfekt Autofahren, Autorennen und schwere Verletzungen liegen nahe zusammen Eduard Heindl, FH-Furtwangen

Der kleine Unterschied Technik und Techno Eduard Heindl, FH-Furtwangen

Google Ads Werbung leicht gemacht Jeder kann zu beliebigen Worten Textanzeigen schalten Bezahlt wird nur wenn jemand klickt Selten geklickte Worte werden entfernt Gute Anzeigen werden öfter eingeblendet Eduard Heindl, FH-Furtwangen

Gute Texte schlechte Texte Auf diese Anzeige haben 1,2% der Nutzer geklickt! Auf diese 50% mehr! (1,9%) Werbung optimieren zum Preis einer Pizza Eduard Heindl, FH-Furtwangen

Noch ein Beispiel Welche Anzeige hat mehr Besucher? 0,7% 2,8% Die Daten sind hochsignifikant, da 3000 mal geklickt wurde Eduard Heindl, FH-Furtwangen

Google Adsense Geldverdienen leicht gemacht Bezahlung nach Klicks Einnahmen bis zu XX€1 pro tausend Besucher Einblendung ist kontextsensitiv Wesentlich höhere Klickrate als bei klassischer Bannerwerbung [1]Google untersagt seinen Content-Partnern die Einnahmen offen zu legen Eduard Heindl, FH-Furtwangen

Und so lautet der Beschluß Daß die Maschine etwas lernen muß Eduard Heindl, FH-Furtwangen

Der Lernvorgang Lernen bedeutet Ergebnisse liefern und diese verbessern Nutzer WWW Suchmaschine Eduard Heindl, FH-Furtwangen

Suchmachinen Version 0.1 Keywords vor 1995 Fiz Karlsruhe Patentsuche Nutzer Content Such- maschine Bib liothekar Eduard Heindl, FH-Furtwangen

Suchmaschinen I. Art Such- maschine Volltextsuche ~ 1995 Lycos Altavista Nutzer WWW Such- maschine Eduard Heindl, FH-Furtwangen

Suchmaschine II. Art Neue Algorithmen Linkstruktur Textcluster WWW Nutzer WWW Suchmaschine Vorver- arbeitung Eduard Heindl, FH-Furtwangen

Suchmaschinen III. Art Textverständnis Rückkopplung Neuronale Algorithmen Nutzer WWW Suchmaschine lesen IQ verstehen Eduard Heindl, FH-Furtwangen

Triebkräfte Webseite Suchmaschine Such- maschinen- optimiert Neue Nutzer Nutzer Webseite Suchmaschine liefert Link Nutzt Link Kommt wieder zufrieden Verbessert Algorithmus Such- maschinen- optimierer liefert Link Nutzer Nutzer Nutzt Link Such- maschinen- optimiert Neue Suchmaschine Geht fremd unzufrieden Bekommt Werbe- einnahmen Eduard Heindl, FH-Furtwangen

Zyklus Suchsystem Kluge Nutzer Content Verbessert Algorithmus Anbieter Bekommt Werbe- einnahmen Eduard Heindl, FH-Furtwangen

Fragen Wie vollständig ist die Welt im WWW repräsentiert? Fast alle Dokumente sind Produkte menschlicher Ansichten Viel Dokumente sind, zumindest in Fragmenten, Kopien Wahrheitsgehalt nur über Kontext zu erschließen Es gibt keine vollständigere digitale Wissensbasis WWW Eduard Heindl, FH-Furtwangen

Wissen im Internet Datenbestand ist mehrsprachig wenige Sprachen relevant, 50% englisch Daten sind hochgradig redundant Vorteil wenn Interpretation nötig Multimediadaten (Bilder, Filme) Erfordert komplexe Analyse Bild-Text Kopplung vorhanden Erlaubt lernen aus Bildern Eduard Heindl, FH-Furtwangen

Fragen zum Lesen lesen Einfaches Einlesen Problem: viele Seiten haben unklare Strukturen (Tabellen!) Problem: häufig wechselnde Inhalte Datenbank sollte die Link-Struktur des WWW nutzen lesen Eduard Heindl, FH-Furtwangen

Frage nach Weltbild Wird ein Vorwissen benötigt Kann das System aus Nutzerverhalten lernen Spielt die Datenstruktur eine Rolle Welche Algorithmen lernen effizient verstehen Eduard Heindl, FH-Furtwangen

Was ist Intelligenz IQ Wissen für erfolgreiches Handeln bereithalten Wissen verarbeiten Wissen richtig einsetzen Wissen durch Information erweitern Neues Wissen generieren IQ Eduard Heindl, FH-Furtwangen

Schleifen I Eduard Heindl, FH-Furtwangen

Schleifen II Eduard Heindl, FH-Furtwangen

Zukunft 1000 Touché ©Tom / Thomas Körner. Berlin 1998 Eduard Heindl, FH-Furtwangen

Die Googlemauer Medien Google Adsense Anzeigentunnel Anbieter Interessent Google Adsense Adwords Eduard Heindl, FH-Furtwangen

Effiziente Märkte Zwischen Informationen vermitteln Anbieter Kunde Optimal vermitteln Eduard Heindl, FH-Furtwangen

Strategisches Risiko Dunkelheit im Internet! Was passiert wenn: Google ausfällt? Hackerangriff Physischer Angriff Für manche Länder manipuliert wird Zensiert Ergebnisse vertauscht Verkauft wird (z.B. an Microsoft) Eduard Heindl, FH-Furtwangen

Von der Steinzeit Zeitalter Wenn zwischen der Hand des Menschen und der zu behandelnden Materie ein bestimmendes Material wirkt Wenn zwischen dem Gehirn des Menschen und dem zu findenden Wissen eine bestimmende Instanz steht? Eduard Heindl, FH-Furtwangen

Google geht an die Börse 2.718.281.828 Aktien zu einem Preis von 0,01 $ DON’T BE EVIL   Don’t be evil. We believe strongly that in the long term, we will be better served—as shareholders and in all other ways—by a company that does good things for the world even if we forgo some short term gains. This is an important aspect of our culture and is broadly shared within the company. Risks Related to Our Business and Industry   We face significant competition from Microsoft and Yahoo. Eduard Heindl, FH-Furtwangen

Börsenwert von Google Abschätzungen (kurzfristig) 200.000.000 Suchergebnisse täglich Wert pro Ergebnis 5ct Jährliche Einnahme $ 3,6 Mrd. Maximalwert (langfristig) 500 Mio. Google Nutzer Täglich 5 min gespart = $ 1,0 Jährliche Einnahmen = $ 182,5 Mrd. Eduard Heindl, FH-Furtwangen

The End Zum Weiterlesen Dieser Vortrag: heindl.de/google google.com/about.html google.com/ads google.com/adsense labs.google.com labs.google.com/papers.html google.indicateur.com searchenginewatch.com The End Eduard Heindl, FH-Furtwangen