Seminar „WWW und Datenbanken“ - SS2001

Slides:



Advertisements
Ähnliche Präsentationen
DI Christian Donner cd (at) donners.com
Advertisements

OASE Elektronische Antragstellung des Deutsch-Polnischen Jugendwerks.
Menüstruktur automatisch angepasste Menüstruktur auf der Internetseite = Neue Seite im Content – Management- System ergibt neuen.
Webinar für [Name der Gruppe] [Name des Institutes]
Einer der Dienste im Internet
Datenbankanbindung mit ASP Wilhelm-Schickard-Schule Tübingen
Wieso gibt es diese Unterrichtseinheit?
WWW World Wide Web.
Martin Klossek Seminar „XML: Datenrepräsentation und Abfragesprachen “ - WS2001/2002.
Inhalt – Technische Grundlagen
:33 Internet Applikationen – Hard und Softwareplattform Copyright ©2003, 2004 Christian Donner. Alle Rechte vorbehalten. Architektur Moderner.
:35 Architektur Moderner Internet Applikationen – Sonderthema 1 Copyright ©2003 Christian Donner. Alle Rechte vorbehalten. Architektur Moderner.
Inhaltlich orientierter Zugriff auf unstrukturierte Daten
Pflege der Internetdienste
Seminar Internet-Dienste
Datenbankzugriff im WWW (Kommerzielle Systeme)
NATURAL Web-Integration 1 / 27/28-Feb-98 TST NATURAL Web-Integration Arbeitskreis NATURAL Süd Theo Straeten SAG Systemhaus GmbH Technologieberater Stuttgart.
Markplätze für Agenten Seminar Softwareagenten Timo Hoelzel.
Internetstruktur Das Internet besteht aus vielen Computern, die weltweit untereinander vernetzt sind.
Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.
Datenbankanbindung mit ASP Wilhelm-Schickard-Schule Tübingen
Anwendungen. © Prof. T. Kudraß, HTWK Leipzig Historie des WWW Grundlage Internet – Entwickelt Ende der 60er Jahre vom US-Militär (ARPA-Net) – Technische.
Technik Gestaltung Navigation Daten. Übersicht Client Webbrowser InternetServer.
Rigi und Web2Rsf vorgestellt von Tobias Weigand. Inhalt Ziel von Web2Rsf und Rigi Vorstellung des Parsers Web2Rsf Vorstellung des Werkzeugs Rigi Analyse.
Herzlich willkommen beim 1. Workshop der AG Methodik
Vorlesung Datenschutz, FB Informatik, Universität Dortmund, SoSe Übung/Hausaufgabe Cookies – Betrachtung aus der Sicht des Datenschutzes Was geht.
Wolfgang Schmidt Data-Mining im Internet.
Lehre, Studium, Forschung LSF Software-System HIS-GX ist eine Webanwendung für:L ehre, S tudium und F orschung bietet vielfältige Funktionalitäten für.
Seite Common Gateway Interface. Konzepte. Übersicht 1Einleitung 2Was ist CGI? 3Wozu wird CGI verwendet? 4Geschichtlicher Überblick 5Grundvoraussetzungen.
Die Bank von morgen - eine neue Welt für IT und Kunden? 23. Oktober 2001.
FH-Hof HTML - Einführung Richard Göbel. FH-Hof Komponenten des World Wide Webs WWW Browser HyperText Transfer Protocol (HTTP) via Internet WWW Server.
Clusteranalyse von Maria Eickhold und Tobias Töpfer.
von Julia Pfander und Katja Holzapfel E 12/2
Welche Funktion hat die php.ini? -Beinhaltet wichtige Einstellungen für PHP. Genannt seien hier u.a. der Speicherort von Cookies, Parameter der Kompilierung,
Browser das Internet lesen.
Simulation komplexer technischer Anlagen
Mark Doll – 1/21V3D2 Workshop 2003, Frankfurt/Main 19./ http:// Ansätze für eine Web-basierte Initiierung qualitätsbasierter Kommunikationsdienste.
Einstellungen im Web für Outlook
Whitepaper - Feb © mailways GmbH Das Chat-Fenster auf Seite des Kunden Menschen wollen von Menschen beraten werden. Mit Hilfe des Internet lassen.
Dawn (direction anticipation in web-navigation) sebastian stober - direction anticipation in web-navigation2 Motivation Suchmaschinen & Verzeichnisse.
Gegenstand EDV Thema: Informative Webseiten
Client-Server Modell Advanced IT Basics Nicolas Frings.
Internet: Funktionsweise und Dienste
Chat – Systeme Projekt: Virtueller Seminarraum (WS 02/03)
Grundlagen: Client-Server-Modell
Entwicklung verteilter Anwendungen II, SS 13 Prof. Dr. Herrad Schmidt SS 13 Kapitel 4 Folie 2 REST Web Services (1)
Internet und SMS Internet und SMS Daniel Rickenbacher Jeremy Deuel.
CGI (Common Gateway Interface)
CRM TimeLog… TimeLog … Wie gross ist der Anteil der Lohnkosten in Ihrem Unternehmen?
Wegweiser im Datenjungel
Whitepaper - Feb © mailways GmbH Menschen wollen von Menschen beraten werden. Mit Hilfe des Internet lassen sich kostenschonende Wege für jede Phase.
1 Kommunikation im Netz Beratungsrektor Johannes M. L. Pasquay Die modernen Informations- und Kommunikationsmedien, allen voran das Internet mit dem World.
Mag. Andreas Starzer weloveIT – EDV Dienstleistungen
Adserver Funktionsweise eines Adservers und die daraus entstehenden Möglichkeiten des Zielgruppentargetings.
HTTP IT-Zertifikat Universität zu Köln Allgemeine Technologien II
Client-Server-Modell
Die Management-Tools von Z&H COACH beinhalten zentrale Hilfsmittel für ein Management-System. Sorgfältig angewendet führen diese Tools Ihr Unternehmen.
W W W - World Wide Web. Das World Wide Web kommt aus dem Englischen und bedeutet ‚Weltweites Netz‘ ist ein über das Internet abrufbares Hypertext-System.
© Fink/Spengler/AINF-Lehrgang 2003 – Folie 1 AINF/3. Jahrgang Netzwerke Anwendungen (Clientseitig) Karl Brenner, Andreas Fink, Gerhard Jüngling, Albert.
Willkommen zum Brückensemester
prof. dr. dieter steinmannfachhochschule trier © prof. dr. dieter steinmann Folie 1 vom Montag, 30. März 2015.
->Prinzip ->Systeme ->Peer – to – Peer
Auswertung von Web- Server-Zugriffen: Mechanismen und Vergleich von Lösungen Alexander Maier.
Datenbanken im Web 1.
Internet-Grundtechnologien. Client / Server Client („Kunde“): fordert Information / Datei an im Internet: fordert Internetseite an, z.B.
1 Wolfgang Wiese, Regionales RechenZentrum Erlangen WCMS 3. August 2000 Wolfgang Wiese RRZE / Lehrstuhl für Informatik VII
Webserver Apache & Xampp Referenten: Elena, Luziano und Sükran
Internet - Grundbegriffe Unterlagen zum Kurs "Wie erstelle ich eine Homepage?"
Zugriff-Analyse mit WebTrends
Systeme II 6. Die Anwendungsschicht
 Präsentation transkript:

Seminar „WWW und Datenbanken“ - SS2001 21.05.2001 - Martin Klossek Seminar „WWW und Datenbanken“ - SS2001

Web Log Mining - Martin Klossek Im World Wide Web werden täglich unzählbar viele Dateien von Servern an Arbeitsplatzrechner geliefert... Anfragen Webserver Dateien 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Die Webserversoftware protokolliert dabei jede gelieferte Datei wie statische + dynamische Htmlseiten Bilder (.png, .gif, .jpg, ...) Java-Applets, Flash, ... Speicherung der Zugriffe in Logdatei 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Erzeugte Logfiles werden sehr groß! Auswertung und Visualisierung Informationen wie # Zugriffe pro Monat / Woche / Tag # Zugriffe pro Datei / Seite Zugreifende Rechner Browsertypen ... 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek eCommerce 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Komplexe Sites wie Portale und Online-Shops verlangen Informationen über ihre Besucher Können Logfiles mehr als nur die bloßen Verbindungsdaten lieferen? Ja! ...mit Web Log Mining 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Web Log Mining beantwortet Fragen von Websitebetreibern Wer besucht meine Website? Wer kauft dort ein (bei Online-Shops!)? Welche Seiten werden in einer Session zusammen besucht? Welche Seiten werden nacheinander besucht (Sequenz)? 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek oder auch folgende Fragen Welche Werbemaßnahmen, welche Banner sollte ich einsetzen? Wie unterscheiden sich Käufer von Nicht-Käufern (eCommerce)? Verhalten sich registrierte Benutzer anders als anonyme? Wie erhöhe ich die Anzahl meiner Besucher und Kunden? 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Übersicht Motivation Begriffsabgrenzung DataMining Domäne Web Log Mining Prozess des Web Log Mining unterstützt durch Fallbeispiele Ausblick 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Data Mining Data Mining is data and discovery driven not: confirmation or verification driven Information Data Mining Daten Muster Regeln 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Data Mining Data Mining Software analysiert Daten und liefert Regeln und Muster Mustererkennung Hypothesenfindung Statistiksoftware bietet Mittel zum Bestätigen von Hypothesen, die Sachverständige aufgestellt haben 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Data Mining Einige Verfahren sind Assoziationsanalyse Sequenzanalyse Clusteranalyse Entscheidungsbäume Allgemein sind Methoden des „Maschinellen Lernens“ nutzbar (beispielsweise Neuronale Netze) 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Data Mining Anwendungen von Data Mining haben spezifischen Kontext, der mit Domänenwissen bezeichnet wird Beachte: Data Mining und hier im speziellen Web Log Mining sind nicht standardisiert, sondern anwendungs-und fragenabhängig... 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Übersicht Motivation Begriffsabgrenzung DataMining Domäne Web Log Mining Prozess des Web Log Mining unterstützt durch Fallbeispiele Ausblick 21.05.2001 Web Log Mining - Martin Klossek

Webserver Architektur Anfragen Protokoll Logfiles - Requestobjekt - Client-Infos - Cookies Dateien Webserver Daten Skripte - Dateien - Status - Cookies Datenbank 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Protokollierung Protokoll Logfiles Verschiedene Webserver am Markt Apache Internet Information Server Netscape iPlanet NCSA CERN ... Aber: Ein Format für Logdateien http://www.netcraft.com 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Format Logfiles Protokoll Logfiles Common Log Format ascii-Datei jede Zeile entspricht einer Anfrage an den Webserver verschiedene Felder beschreiben die Anfrage IP rfc931 authuser Datum requeststring ... 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Format Logfiles Protokoll Logfiles Felder sind... IP rfc931 authuser [Datum] ... z. B. 141.2.114.129 z. B. [21/May/2001:17:02:22 +0100] ... “requeststring“ statuscode bytes z. B. 202, 304 oder 404... z. B. "GET /start.php3 HTTP/1.1" 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Format Logfiles Protokoll Logfiles Im Extended Log Format erweitert um die Felder Referrer Die im Browser zuvor angezeigte URL, z. B. "http://www.stormzone.de/uni/future.html" user_agent Der Browserstring des Clients, z. B. "Mozilla/4.0 (compatible; MSIE 5.01; Windows 98)" 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Transaktionen Jede Zeile im Logfile stellt eine Anfrage an den Webserver dar Eine Anfrage besteht dabei aus Html-Datei / Skript Grafikdateien, Stylesheets, Applets, ... Eine Transaktion ist der Abruf einer Folge von Seiten... 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Session Menge von Anfragen eines Besuchers in einer begrenzten Zeitspanne wird als Session bezeichnet Charakterisiert durch IP Uhrzeit SessionBenutzerA,2001-05-21 = { index.html, seite1.html, seite2.html, ... } 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Session Problem: Datensätze nicht immer eindeutig, daher zur Unterscheidung: Begrenzung der Session auf ca. 25 Minuten oder Inaktivitätsspanne Identifizierung über Sessionkeys in URL oder Cookies, beispielsweise https://ssl.moneyshelf.com/DE/de/functions/Cash/cashAllAccounts.jhtml;$sessionid$P4AB000FXLOPKCQCECCSFFIKAIQIIIV0 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Weitere Daten Für weitere Analysen ist Anreicherung der Daten sinnvoll, beispielsweise Benutzerdaten aus Formularen Demographische Datenbanken 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Übersicht Motivation Begriffsabgrenzung DataMining Domäne Web Log Mining Prozess des Web Log Mining unterstützt durch Fallbeispiele Ausblick 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Prozess Web Log Mining Aufgabenstellung: Gegeben sind Logdaten einer Website Ziel: Gewinnen neuer Informationen Hier: Einige Ergebnisse aus einem Web Log Mining Projekt Allgemein: Je nach Fragestellungen variieren die verwendeten Analysen 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Prozess Web Log Mining 1 Aufbereitung Bereinigung Anreicherung 2 Mustererkennung Bewertung Integration in laufendes System 3 4 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Datenaufbereitung Übertragen der Daten aus Logfiles in Format, das für die eingesetzte Data Mining Software lesbar ist Auswahl der relevanten Felder im Logfile Speicherung in Datenbank Extraktion von Transaktionen und Sessions 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Datenaufbereitung Entfernen von redundanten und überflüssigen Daten falls möglich Entdecken und Entfernen von Ausreißern - falls möglich Anreichern der Logdaten mit Daten aus Personendatenbank – falls vorhanden und den Fragestellungen entsprechend 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Mustererkennung Zu Beginn wurden einige Frage-stellungen vorgestellt. Schauen wir uns einige näher an Welche Seiten wurden in einer Session zusammen besucht? Clickstreams der Besucher Gruppen von Besuchern ähnlichen Verhaltens? Unterschiede zwischen Käufern und Nichtkäufern? 21.05.2001 Web Log Mining - Martin Klossek

Assoziationsanalyse Welche Seiten wurden in einer Session zusammen besucht? Assoziationsanalye Erzeugt Regeln der Form Prämisse „wenn A.html“ Konsequenz „dann B.html“ Mit Konfidenzfaktor conf und Supportfaktor sup A.html  B.html0,9; 0,2 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Assoziationsanalyse Die gefundenen Regeln geben Aufschluß darüber, wie sich die jeweiligen Seiten ergänzen Umgestaltung der Website denkbar, so dass von Seite A auf Seite B und umgekehrt verwiesen wird... ...je deutlicher Support- und Konfidenzfaktor für diese Regel 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Assoziationsanalyse 21.05.2001 Web Log Mining - Martin Klossek

Assoziationsanalyse Visualisierung von Regeln mit conf + sup-Faktor 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Sequenzanalyse Clickstreams der Besucher Die Assoziationsanalye sagt nichts über die Reihenfolge der Seitenabrufe aus, dazu die: Sequenzanalyse (hier Pfadanalyse) Finden von Regeln für nacheinander besuchte Seiten mit Häufigkeit A.html  D.html F.html B.html0,05 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Sequenzanalyse Gewinnen von Erkenntnissen über die Reihenfolge der Informationssuche von Besuchern ( Siteoptimierung!) E D A G C B F „clickstreams“ 21.05.2001 Web Log Mining - Martin Klossek

Sequenzanalyse „clickstreams“ Häufigkeiten Ergebnisse einer Sequenzanalyse (unter Zusammenfassung von Seiten zu semantischen Gruppen) 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Clusteranalyse Suche nach Gruppen von Besuchern mit ähnlichen Verhalten Clusteranalyse Bilden von Clustern mit homogenen Merkmalen im Cluster hoher Heterogenität zwischen den Clustern Dabei werden die Merkmale aller Objekte miteinander über ein Proximitätsmaß verglichen (z. B. Euklidische Norm) 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Clusteranalyse Reine Logdaten bieten nur Pfade, Verweildauer und technische Details (wie Browsertyp) als Merkmale an Sinnvoll daher bei Logdaten von registrierten Benutzern mit Personeninformationen Im folgenden ein Beispiel mit Anreicherung durch Personendaten 21.05.2001 Web Log Mining - Martin Klossek

Datenbank mit Personendaten Clusteranalyse Datenbank mit Personendaten 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Clusteranalyse Gefundene Cluster 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Clusteranalyse Cluster: „Männer über 38 wohnhaft in Region 4 Mögen eCommerce“ 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Clusteranalyse Mit Hilfe der Clusteranalyse und angereicherten Logdaten lassen sich also Angaben über die Art der Besucher der Website machen Denkbar: „Automatische Personalisierung“, um Besuchern des gleichen Clusters ähnliche Informationen anzubieten! 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Entscheidungsbäume Online-Shop: Unterscheidung zwischen Käufern und Nichtkäufern? Entscheidungsbäume Hier Segmentierung der um Personen-daten angereicherten Logdaten, um Käufer von Nicht-Käufern zu unterscheiden Ableiten von Regeln zur Vorhersage des Kaufverhaltens von Besuchern 21.05.2001 Web Log Mining - Martin Klossek

Entscheidungsbäume Kauf wahrscheinlich bei: „Keine Requests Information/Fun, mehr als 5 Requests von Communication“ 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Übersicht Motivation Begriffsabgrenzung DataMining Domäne Web Log Mining Prozess des Web Log Mining unterstützt durch Fallbeispiele Ausblick 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Ausblick Beobachtungen und Vermutungen Für große Sites ist Web Log Mining unerläßlich, um Bannerwerbung optimal zu platzieren Personalisierung zu ermöglichen und so vermutlich den Umsatz zu steigern (Kundenbindung contra Kundenaquise!) Streuverluste durch one2one-Marketing zu verringern 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Ausblick Interessante Möglichkeiten Standardisierung von Web Log Mining Verfahren Integration in Serversoftware siehe Microsoft Commerce Server 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Ausblick sowie zu überlegen... Verbindung von Web Content und Web Log Mining? Optimierung und Weiterentwicklung von Analyseverfahren Aber auch: Datenschutzrechtliche Begrenzungen! 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Fazit „Web Log Mining“ ist kein Hypethema sondern ein aus wirtschaftlichen Erfordernissen enstandenes Verfahren zur Analyse von Verbindungsdaten, das Anwendung findet. 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Kontakt Kontakt: martin@klossek3000.de Folien und Ausarbeitung in verschiedenen Formaten unter http://www.stormzone.de/uni/ Hauptstudium/seminare/wwwdb/list.php3 21.05.2001 Web Log Mining - Martin Klossek

Web Log Mining - Martin Klossek Das war‘s 21.05.2001 Web Log Mining - Martin Klossek