Erstellen einer Webseitenstatistik mithilfe eines OLAP-Servers

Slides:



Advertisements
Ähnliche Präsentationen
Die Performance von Webseiten optimieren
Advertisements

Das Content-Management-System Sebastian Raubinger
Martin Köllner XMLCompany XML-Datenbanken Xindice als Datenquelle einer Website im Zusammenspiel mit Cocoon und authentic TM.
Datenbankanbindung mit ASP Wilhelm-Schickard-Schule Tübingen
Web 2.0 Ringelmann Arthur.
Eine Page von Fachinformatikern für Fachinformatiker
FI Knowledge Base Eine Page von Fachinformatikern für Fachinformatiker.
Datenbankzugriff im WWW (Kommerzielle Systeme)
P. Sahle und S. Kurz Historisch Kulturwissenschaftliche Informationsverarbeitung IT-Zertifikat der Philosophischen Fakultät Moderne Technik.
Bastian Cramer, Universität Paderborn Entwurfsmuster für Webanwendungen Projektgruppe: Generierung von Webanwendungen aus visuellen Spezifikationen.
Seminar: XML für Fortgeschrittene Referent: Katrin Apel
Daniel Höfler Markus Thurner XMLApplicationPlatform Siemens OpenStage 60/80.
Stefanie Selzer - Pascal Busch - Michael Kropiwoda
Wikimedia Informationstechnik Türker Yigitoglu, Sebastian Seider MT 7 / SS 2007.
Colibi Bibliothekssystem der Computerlinguistik. Einführung Motivation Was braucht Colibi? Software Datenbankdesign.
XINDICE The Apache XML Project Name: Jacqueline Langhorst
Content-Management-System
Technik Gestaltung Navigation Daten. Übersicht Client Webbrowser InternetServer.
Web-Content-Management-System
NetUSE Web Application Framework Kai Voigt NetUSE AG 28. Februar 2003.
Erhard Künzel für Info 9. Klasse: digitale-schule-bayern.de © Erhard Künzel.
Einführung MySQL mit PHP
Einführung und Überblick
Seite Common Gateway Interface. Konzepte. Übersicht 1Einleitung 2Was ist CGI? 3Wozu wird CGI verwendet? 4Geschichtlicher Überblick 5Grundvoraussetzungen.
Eine online-basierte Lösung am Nordeuropa-Institut
Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme
... und alles was dazugehört
Lommy® SAFE Individuelles Überwachen von Fahrzeugen und Gütern.
Ein Toolkit für hierarchische Bibliotheksdaten Ein Toolkit zur Präsentation von hierarchischen Bibliotheksdaten Andres von Arx UB Basel, August 2006.
MyBAQ Webbasierte Prüfungssoftware
O.Univ.-Prof. Dr. Dimitris Karagiannis Datenbanken administrieren mit phpMyAdmin Martin Marinschek
Janine Blaßnig Cornelia Uhl
Neue Module und weitere Entwicklung in uniLIME Gerald Schuster, Advanced Technical Software, Wien.
Projektarbeit PHP 5.3 / MySQL & Content Management Systems
Erstellen einer Webseitenstatistik mithilfe eines OLAP-Servers
Consulting and Solutions.NET Vortragsreihe – Vorstellung der Referenten Happy Arts Software Markus Kämmerer IT-Erfahrung seit 1987,
PHP und MYSQL am Organisatorisches Der komplette Kurs im Schnelldurchgang Bewertung von wichtig und unwichtig Historisch Kulturwissenschaftliche.
Mark Bendix | 02. Juli 2007 | Prüf.-Nr
Typo3 Templates und TypoScript
Grundlagen: Client-Server-Modell
Das Client/Server – Modell und die XAMPP-Distribution
25. Januar 2007Klasse IT '041 Projekt Solar Server Schulprojekt der Klasse IT `04.
Vergleich verschiedener Konzepte für das Software Engineering Praktikum.
Marko Dragicevic Thomas Bergauer 27.Mai 2008
CGI (Common Gateway Interface)
Allgemeines zu Datenbanken
HORIZONT 1 XINFO ® Das IT - Informationssystem PL/1 Scanner HORIZONT Software für Rechenzentren Garmischer Str. 8 D München Tel ++49(0)89 / 540.
Einrichtung eines Data-Warehouse Servers
PHP Basic.
Webhosting an der Universität Zürich
Abschlusspräsentation E-Valuation - Implementierung ökonomischer Bewertungsmethoden E-Valuation – Implementierung ökomomischer Bewertungmethoden,
Dedizierte Systeme Typo3 Installation Dedizierte Systeme – Typo3 Installation – Christoph Stollwerk IT Zertifikat der Philosophischen Fakultät WS 2008/2009.
CMS Content-Management-Systeme (CMS), dienen der Verwaltung und Pflege von Dokumenten und Inhalten in Inter- und Intranetanwendungen. Den Entwickler oder.
© 2001 Sven Dammann1 Aufbau Integrierter Informationssysteme XML Bearbeitung und relationale Abbildung Sven Dammann Martin-Luther-Universität Halle-Wittenberg.
Stundenplanung Programm zur Stunden- und Zimmerplanung auf der Basis von Datenbanken und unter Berücksichtigung von Mehrfachnutzung im (lokalen) Netz (Internet.
1 Wolfgang Wiese, Regionales RechenZentrum Erlangen WCMS 3. August 2000 Wolfgang Wiese RRZE / Lehrstuhl für Informatik VII
Webserver, Apache und XAMPP
Webserver Apache & Xampp Referenten: Elena, Luziano und Sükran
WINLearn Technische Umsetzung. Basistechnologie Oberfläche in HTML JSP (JavaServerPages) zur Datenauswertung Datenhaltung: Datenbank oder Filesystem JDBC.
Abschlussprojekt von Lars Reinken.  Anwendung (GUI)  Server und ihre Aufgaben  Datenbankstruktur (MSSQL)  Serverkonfiguration (IIS)  Programmaufbau.
Datenbanken Produkte Dienstleistungen Referenzen.
Datenbanken Produkte Dienstleistungen Referenzen.
© 2003, Rudolf Jansen Einsatz der XML-Features der Oracle 9i DB zur Systemintegration Rudolf Jansen Freiberuflicher Entwickler und Autor
Application Performance Management Udo Brede.  Komplexe Umgebungen  Häufige Änderungen  Hohe Aktivität Database Servers Application Servers Web Servers.
LINUX II Unit 7 LAMP Server. LAMP ● Linux – Apache - MySQL – PHP ● Leistungsfähiges und kostenloses System zur Genrierung von dynamischen Webseiten und.
Google App Engine - Technische Stärken und Schwächen
Datenbanken.
ORACLE XE Bernd Tuba, Trier, Deutsche Post ITSolutions GmbH.
Von Wietlisbach, Lenzin und Winter
 Präsentation transkript:

Erstellen einer Webseitenstatistik mithilfe eines OLAP-Servers Projektarbeit Erstellen einer Webseitenstatistik mithilfe eines OLAP-Servers Jan Lübeck Envers AG

Agenda Einleitung Ist - Analyse Konzept Realisierung Fazit Einleitung

Einleitung

Seit 2000 in DU-Rheinhausen Zur Zeit 11 Mitarbeiter Die Envers AG Seit 2000 in DU-Rheinhausen Zur Zeit 11 Mitarbeiter IT Dienstleistungen Entwicklung/Vermarktung von Softwarelösungen

Eigenes CMS “Flexcove 3” Modularer Aufbau Serverseitiges Sessionsystem Das CMS Eigenes CMS “Flexcove 3” Modularer Aufbau Serverseitiges Sessionsystem Administration über Controlcenter

Ist-Analyse

Speicherung pro Seitenzugriff Datensammlung Speicherung pro Seitenzugriff Relationale Datenbank ( MySQL ) 2 Tabellen 1. Tabelle: Zugriffsdaten 2. Tabelle: Parameter pro Zugriff( 1:n ) Große Datenmengen Flexible Datensammlung

Anzeige pro Zeiteinheit: Auswertung Anzeige pro Zeiteinheit: Benutzerzahlen Seitenaufrufe Referer Javascript Bildschirmauflösung

Daten per SQL-Statements Neuberechnung bei jeder Abfrage Performance Daten per SQL-Statements Neuberechnung bei jeder Abfrage „Joins“ mit anderen Datenbanken Langsam: 4 bis 11 Minuten

Google Analytics: Log-Auswertung: Generell: Externe Tools Javascript nötig Log-Auswertung: Entweder Langsam Oder Statisch Wenig Information Generell: Abhängigkeit vom Datenformat

Konzept

Beschleunigung der Auswertung Einsatz eines OLAP-Servers Sollkonzept Beschleunigung der Auswertung Einsatz eines OLAP-Servers Abfrage per Webbrowser Linux/Apache/PHP Gleiches UI Gleicher Datenumfang

PALO Linux, Apache, PHP ( Anforderung ) OLAP-Server Bedingungen: Software Linux, Apache, PHP ( Anforderung ) OLAP-Server Bedingungen: Linux Möglichst kostengünstig PHP-Schnittstelle PALO

Realisierung

Softwareinstallation Palo

Online Analytics Processing Daten in “Cubes” OLAP Online Analytics Processing Daten in “Cubes” “Cube” ist Sinnbild Enthält Werte Dimensionen Definieren die Bedingungen Enthalten Elemente Summenelemente

Wert( Gesamt, Jahr, Zugriffe ) OLAP Schlüssel Zugriffe - Admin - Benutzer - Bot Monat - Jahr - Januar - Februar - … Jahr - Gesamt - … - 2007 - 2008 Abfrage von Werten Wert( 2008, Januar, Bot) Wert( 2008, Jahr, Benutzer ) Wert( Gesamt, Jahr, Zugriffe )

Definition der Dimensionen Zeitliche Einteilung Datum( “Year”, “Month”, “Day” ) “Hour”, “Minute”, “Second” Art der Zusammenfassung “Request” “Session” ( Bot, User, Admin )

Definition der Dimensionen Schlüssel-Wert-Paare HTTP-Variablen: Übergabeparameter Javascript-Parameter, wenn verfügbar Summierung als Hierarchie Typ, Name, Schlüssel Beispiel: HTTP|HTTP_REFERER|www.google.de

HTTP|User_Agent|Firefox Beispiel HTTP HTTP|Referer HTTP|Referer|www.google.de HTTP|Referer|www.msn.com HTTP|User_Agent HTTP|User_Agent|Firefox HTTP|User_Agent|IE_7

Auslesen der Daten von MySQL Füllen der Dimensionen Benutzer Zugriffe Importscript Auslesen der Daten von MySQL Füllen der Dimensionen Benutzer Zugriffe Schlüssel Füllen des Cubes

Trennung von Daten und Darstellung Auswertung Trennung von Daten und Darstellung Klasse „Analysis“ Wertet Überparameter aus Ermittelt Daten Erstellt XML-Daten XSLT-Prozessor Erhält XML-Daten Benutzt XSLT-Template Erstellt HTML-Daten

Fazit

Weitere Seitenaufrufe Vergleich   Bisherige Auswertung Neue Auswertung Zeitvorteil Erster Seitenaufruf 11 Minuten 4 Minuten 275% Weitere Seitenaufrufe 1-6 Minuten 15-45 Sekunden 400-800% Import Ad-Hoc Ca. 10 Minuten -

Zu bewältigende Hürden Ausblick Erfahrungen mit PALO Relativ unflexibel Skaliert nicht Langsam im Import Alternative: HOLAP Zu bewältigende Hürden Zugriff über PHP Einsatz Linux oder Windows

Vielen Dank für Ihre Aufmerksamkeit