Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Wie funktioniert das World Wide Web ?

Ähnliche Präsentationen

Präsentation zum Thema: "Wie funktioniert das World Wide Web ?"—  Präsentation transkript:

1 Wie funktioniert das World Wide Web ?
WWW, HTML, HTTP,... Wie funktioniert das World Wide Web ?

2 Überblick Das WWW Wie funktioniert das WWW (lang)
Warum war/ist das WWW so erfolgreich ? Historie, Vorgänger,... Wie funktioniert das WWW (kurz) Grundlagen: TCP/IP und DNS Wie funktioniert das WWW (lang) HTML HTTP Anatomie eines Webservers Wir basteln eine Website Software Installation/Konfiguration eines Webservers Dokumente

3 Hype, warum ? Vorraussetzung: weltweites Netzwerk
Internet, war schon vor dem WWW da , FTP, Gopher,... Jeder kann, praktisch ohne Aufwand, Informationen finden Surfen (Informationen sind verknüpft) Suchen (Suchbare Verzeichnisse) Informationen veröffentlichen Einfache Werkzeuge Browser Editoren Multimedial Keine zentrale Kontrolle/Zensur Jeder kann alles veröffentlichen

4 Literatur Andrew S. Tanenbaum, Computer Networks, Prentice Hall 1996
W. Richard Stevens, TCP/IP Illustrated, Vol. 1-3, Addison Wesley, 1994 P. Albitz and Cricket Liu, DNS and BIND, O'Reilly 2001 Tim Berners-Lee, Weaving the Web, Harper Collins 1999 Tim Berners-Lee, Information Management: A proposal, CERN 1989, z.B. Vannevar Bush; As we may think; The Atlantic Monthly; July, 1945; Volume 176, No. 1; pages z.B. Philip Greenspun, Database backed Web sites, Ziff Davis, 1997

5 As we may think The investigator is staggered by the findings and conclusions of thousands of other workers -- conclusions which he cannot find time to grasp, much less to remember, as they appear. [...] Professionally our methods of transmitting and reviewing the results of research are generations old and by now are totally inadequate for their purpose. [...] Mendel's concept of the laws of genetics was lost to the world for a generation because his publication did not reach the few who were capable of grasping and extending it [...] A record if it is to be useful to science, must be continuously extended, it must be stored, and above all it must be consulted. [...] When data of any sort are placed in storage, they are filed alphabetically or numerically, and information is found (when it is) by tracing it down from subclass to subclass. [...] The human mind does not work that way. It operates by association [...] If the user wishes to consult a certain book, he taps its code on the keyboard, and the title page of the book promptly appears before him, projected onto one of his viewing positions. [...] This is the essential feature of the memex. The process of tying two items together is the important thing. [...] Wholly new forms of encyclopedias will appear, ready made with a mesh of associative trails

6 Informationen Jeder braucht Informationen
Informationen müssen existieren Dokumente, Bücher, Zeitschriften,... und gefunden werden knowledge management Kataloge Hierarchien nicht immer eindeutig Metadaten welche (jetzt und später) wichtig ? Klassifikationen (Schlagworte) Jeder nutzt seine eigenen !!

7 Ordnung zum ersten: Gopher

8 Zum zweiten: Udine,HyperG,...
Ende der achtziger Jahre entstanden viele Hypertext- Informationssysteme, hauptsächlich hierarchisch strukturiert, die versuchten, die Schwächen von Gopher und anderen zu überwinden.

9 Und Chaos: T. Berners-Lee
The actual observed working structure of the organisation is a multiply connected "web" whose interconnections evolve with time. In this environment, a new person arriving, or someone taking on a new task, is normally given a few hints as to who would be useful people to talk to. Information about what facilities exist and how to find out about them travels in the corridor gossip and occasional newsletters, and the details about what is required to be done spread in a similar way. [...] A problem, however, is the high turnover of people. When two years is a typical length of stay, information is constantly being lost.[...] Often, the information has been recorded, it just cannot be found. [...] CERN is a model in miniature of the rest of world in a few years time. CERN meets now some problems which the rest of the world will have to face soon [...] the method of storage must not place its own restraints on the information This is why a "web" of notes with links (like references) between them is far more useful than a fixed hierarchical system. The system we need is like a diagram of circles and arrows, where circles and arrows can stand for anything.

10 Requirements Remote access across networks. CERN is distributed, and access from remote machines is essential. Heterogeneity Access is required to the same data from different types of system (VM/CMS, Macintosh, VAX/VMS, Unix) Non-Centralisation Information systems start small and grow. They also start isolated and then merge. A new system must allow existing systems to be linked together without requiring any central control or coordination. Access to existing data If we provide access to existing databases as though they were in hypertext form, the system will get off the ground quicker. Private links One must be able to add one's own private links to and from public information. One must also be able to annotate links,as well as nodes, privately.

11 Informationen

12 Architektur

13 Integration

14 WWW Die am CERN entwickelten Protokolle und Werkzeuge wurden rasch weltweit akzeptiert, insb. als grafische Browser entwickelt wurden (NCSA-Mosaic) Warum ? Jeder kann mit minimalem Aufwand Dokumente publizieren und integrieren Die Protokolle sind so einfach (primitiv) und portabel, dass jedes System angebunden werden kann Link sind privat, d.h. werden nicht zentral registriert unidirektional bidirektionale Links (z.B. HyperG) konnten sich nicht durchsetzen broken link Problematik keine zentrale Struktur lost in hyperspace Relevanz von Informationen (altavista vs. google,...)

15 Architektur Browser Webserver TCP/IP Dateien ???
Wie funktioniert das eigentlich ? Darstellung: HTML Abwicklung: HTTP

16 HTML Auszeichnungssprache Tags stellen Semantik des Dokuments dar
Dokument <HEAD>...</HEAD>, <HTML></HTML>,... Metadaten <META>, <TITLE>, <AUTHOR>,... Struktur <h1>, <ul>, <p> Links <a href=" stellen Semantik des Dokuments dar enthalten Links Präsentation durch Browser heute auch Präsentation durch HTML Formatierung <FONT>, ... Logik JavaScript, DHTML,...

17 HTML-Dokument <HTML> <HEAD>
<TITLE>Ein schönes Dokument </TITLE> </HEAD> <BODY> <h1>Eine Überschrift</h1> Etwas Text <P> Ein Absatz <IMG SRC="bunt.gif"> Ein Bild <A HREF=" klicken</a> <P> Eine Liste <UL> <LI> erstens </LI> <LI> zweitens </LI> <LI> drittens </LI> </UL> </BODY> </HTML>

18 Tabellen <HTML> <HEAD> <TITLE>Ein schönes Dokument </TITLE> </HEAD> <BODY> <h1>Eine Überschrift</h1> Etwas Text <TABLE BORDER=3> <TR> <TD>Spalte 1</TD> <TD>Spalte 2</TD> <TD>Spalte 3</TD> </TR> <TR> <TD COLSPAN=2>Spalte 1 und 2</TD> <TD>Spalte 3</TD> </TR> <TR> <TD COLSPAN=3>ganz schön breit</TD> </TR> </TABLE> </BODY> </HTML>

19 HTML Ursprünglich nur zur Strukturierung gedacht
heute auch zur Formatierung da keine Positionierung,... schwierig hauptsächlich durch FONTS, Farben Tabellen Bilder browserabhängig Style sheets Pfusch --> PDF, XML,...

20 HTTP Wie kommen die Dokumente zum Browser ? Ursprünglich Struktur
Auslieferung von Dateien deshalb einfaches, zustandsloses Protokoll Struktur Browser fordert eine Seite an (GET) Webserver liest Datei und schickt sie zurück fertig keine Anmeldung,... bei jeder Anfrage wird neue Verbindung aufgebaut einfach !!!

21 Frage ... GET /mini.html HTTP/1.0 Connection: Keep-Alive
User-Agent: Mozilla/4.51 [de]C-CCK-MCD DT (WinNT; I) Host: dbserv Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, image/png, */* Accept-Encoding: gzip Accept-Language: de Accept-Charset: iso ,*,utf-8

22 und Antwort HTTP/1.1 200 OK Date: Thu, 17 May 2001 09:12:50 GMT
Server: Apache/ (Unix) (SuSE/Linux) Last-Modified: Thu, 17 May :05:17 GMT ETag: "3aed8-40-3b03944d" Accept-Ranges: bytes Content-Length: 64 Connection: close Content-Type: text/html X-Pad: avoid browser bug <html> <head> <title>Hallo</title> <body> Hallo </body> </html>

23 dynamische Seiten GET <Pfad> liefert eine Datei aus
Mimetype in Content-Type Was aber, wenn Inhalt nicht als Datei vorliegt ? z.B. Suche nach Inhalten, Uhrzeit,... CGI Common Gateway Interface Wenn eine Datei in speziellem Verzeichnis (meist cgi-bin) angefordert wird, "weiß" der Webserver, daß diese ausgeführt werden soll GET /cgi-bin/SayHello ruft das programm SayHello im entsprechenden Verzeichnis auf Parameter werden im Environment übergeben

24 CGI Environment DOCUMENT_ROOT="/usr/local/httpd/htdocs"
GATEWAY_INTERFACE="CGI/1.1" HTTP_ACCEPT="image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, image/png, */*" HTTP_ACCEPT_CHARSET="iso ,*,utf-8" HTTP_ACCEPT_ENCODING="gzip" HTTP_ACCEPT_LANGUAGE="de" HTTP_CONNECTION="Keep-Alive" HTTP_HOST=" " HTTP_USER_AGENT="Mozilla/4.51 [de]C-CCK-MCD DT (WinNT; I)" PATH="/sbin:/bin:/usr/sbin:/usr/bin" QUERY_STRING="" REMOTE_ADDR=" " REMOTE_PORT="1049" REQUEST_METHOD="GET" REQUEST_URI="/cgi-bin/printenv" SCRIPT_FILENAME="/usr/local/httpd/cgi-bin/printenv" SCRIPT_NAME="/cgi-bin/printenv" SERVER_ADDR=" " SERVER_ADMIN="[no address given]" SERVER_NAME="mac.e-technik.uni-ulm.de" SERVER_PORT="80" SERVER_PROTOCOL="HTTP/1.0" SERVER_SIGNATURE="<ADDRESS>Apache/ Server at mac.e-technik.uni-ulm.de Port 80</ADDRESS>\n" SERVER_SOFTWARE="Apache/ (Unix) (SuSE/Linux)" UNIQUE_ID="OwOfSMCoAW4AAAGfAxA"

25 Parameter Wie erhält z.B. Suchprogramm das zu suchende Wort
URL der Form: z.B. ...suche?Begriff=Internet QueryString QUERY_STRING="Begriff=Internet" mehrere mit ?p1w1&p2=w2... Eingabe durch Benutzer ? HTML Forms, INPUT Tags <FORM METHOD="GET" ACTION=" <INPUT TYPE="text" NAME="Begriff"> <INPUT TYPE="submit"> </FORM>

26 Parameter contd. Problem: viele/lange Parameter Lösung: POST
GET /Suche?Begriff=Internet HTTP/1.0 Connection: Keep-Alive User-Agent: Mozilla/4.51 [de]C-CCK-MCD DT (WinNT; I) Host: localhost Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, image/png, */* Accept-Encoding: gzip Accept-Language: de Accept-Charset: iso ,*,utf-8 Problem: viele/lange Parameter Länge von URL ist begrenzt Platz im Environment ist begrenzt (OS spezifisch) Lösung: POST POST /Suche HTTP/1.0 Connection: Keep-Alive Content-type: application/x-www-form-urlencoded Content-length: 16 Begriff=Internet

27 Methoden Auswahl im <FORM METHOD="xxx"...> Tag GET POST xxx=GET
xxx=POST GET maximale Länge von Parametern beschränkt Probleme bei Sonderzeichen (blank,...) URL encoding können als Bookmark gespeichert werden besser nicht für Bestellungen,... POST unbeschränkte Länge der Parameter auch ganze Dateien,...

28 Typische Anwendung Suchmaschine <HTML> <HEAD>
<TITLE>Telefonbuch</TITLE> </HEAD> <BODY><h1>Telefonbuch</h1> <FORM METHOD="POST" ACTION=" Name:<INPUT TYPE="text" NAME="Name"> <INPUT TYPE="submit"> </FORM> </BODY> </HTML>

29 Ergebnis <HTML> <HEAD>
<TITLE>Telefonbuch Liste</TITLE> </HEAD> <BODY><h1>Suchergebnis</h1> <UL> <LI> <a href="ShowDetail?ID=4711">Müller, Hans</a></LI> <LI> <a href="ShowDetail?ID=4243">Müller, Hugo</a></LI> <LI> <a href="ShowDetail?ID=1234">Müller, Karin</a></LI> </UL> </BODY> </HTML>

30 Website erstellen Was muß ich tun ? muß ich das alles selber machen ?
Rechner im Netz (TCP/IP) haben Webserver installieren z.B. Apache, kommen wir noch dazu oder andere, z.B. Microsoft IIS HTML-Dateien erstellen von Hand, oder z.B. mit Frontpage in Verzeichnissen organisieren Zugriffsrechte festlegen fertig muß ich das alles selber machen ? nein, meistens über Provider (ISP, z.B. T-Online) ja, im Intranet firmeninternes Netzwerk - z.B. HitNet

Herunterladen ppt "Wie funktioniert das World Wide Web ?"

Ähnliche Präsentationen