Erstellen einer Webseitenstatistik mithilfe eines OLAP-Servers

Slides:



Advertisements
Ähnliche Präsentationen
Die Performance von Webseiten optimieren
Advertisements

Das Content-Management-System Sebastian Raubinger
Martin Köllner XMLCompany XML-Datenbanken Xindice als Datenquelle einer Website im Zusammenspiel mit Cocoon und authentic TM.
Entwicklung UnivIS-Anbindung auf Basis von PHP und DOM-XML
Datenbankanbindung mit ASP Wilhelm-Schickard-Schule Tübingen
Web 2.0 Ringelmann Arthur.
Objekt – Relationales – Modell Tomasz Makowski IN
Eine Page von Fachinformatikern für Fachinformatiker
FI Knowledge Base Eine Page von Fachinformatikern für Fachinformatiker.
Datenbankzugriff im WWW (Kommerzielle Systeme)
Bastian Cramer, Universität Paderborn Entwurfsmuster für Webanwendungen Projektgruppe: Generierung von Webanwendungen aus visuellen Spezifikationen.
Daniel Höfler Markus Thurner XMLApplicationPlatform Siemens OpenStage 60/80.
Stefanie Selzer - Pascal Busch - Michael Kropiwoda
Wikimedia Informationstechnik Türker Yigitoglu, Sebastian Seider MT 7 / SS 2007.
FH-Hof Eine kleine Theorie der Zeit Richard Göbel.
Colibi Bibliothekssystem der Computerlinguistik. Einführung Motivation Was braucht Colibi? Software Datenbankdesign.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/9 Data Mining Ist die Wissensgewinnung aus Datensammlungen (Knowledge Discovery in Database).
XINDICE The Apache XML Project Name: Jacqueline Langhorst
Content-Management-System
Universeller Zugriff auf multimediale Dokumentstrukturen auf der Basis von RDF und MPEG-7 Stefan Audersch BerlinXSW Juni.
Data Warehousing Oberseminarvortrag zum Thema: von Daniel Schulte
Technik Gestaltung Navigation Daten. Übersicht Client Webbrowser InternetServer.
Erhard Künzel für Info 9. Klasse: digitale-schule-bayern.de © Erhard Künzel.
Einführung MySQL mit PHP
Einführung und Überblick
Eine online-basierte Lösung am Nordeuropa-Institut
Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme
... und alles was dazugehört
Lommy® SAFE Individuelles Überwachen von Fahrzeugen und Gütern.
Ein Toolkit für hierarchische Bibliotheksdaten Ein Toolkit zur Präsentation von hierarchischen Bibliotheksdaten Andres von Arx UB Basel, August 2006.
MyBAQ Webbasierte Prüfungssoftware
Grundlagen der sicheren PHP Programmierung Parametermanipulationen und Injektionslücken Stefan Esser Hardened-PHP Project.
Data Warehouse mit Visual FoxPro
Sistema GeoDAT, S.L. GeoBIS, GeoEIS, GIS-Komponente … 2005.
Neue Module und weitere Entwicklung in uniLIME Gerald Schuster, Advanced Technical Software, Wien.
Projektarbeit PHP 5.3 / MySQL & Content Management Systems
Erstellen einer Webseitenstatistik mithilfe eines OLAP-Servers
PHP und MYSQL am Organisatorisches Der komplette Kurs im Schnelldurchgang Bewertung von wichtig und unwichtig Historisch Kulturwissenschaftliche.
Problemstellung Heterogene DV-Strukturen Mangelnde Kapazität in der EDV-Abteilung Historische Daten nicht verfügbar Analysen belasten die vorhandene Infrastruktur.
Typo3 Templates und TypoScript
Grundlagen: Client-Server-Modell
Das Client/Server – Modell und die XAMPP-Distribution
Vergleich verschiedener Konzepte für das Software Engineering Praktikum.
Marko Dragicevic Thomas Bergauer 27.Mai 2008
CGI (Common Gateway Interface)
Allgemeines zu Datenbanken
HORIZONT 1 XINFO ® Das IT - Informationssystem PL/1 Scanner HORIZONT Software für Rechenzentren Garmischer Str. 8 D München Tel ++49(0)89 / 540.
Einrichtung eines Data-Warehouse Servers
PHP Basic.
Webhosting an der Universität Zürich
Abschlusspräsentation E-Valuation - Implementierung ökonomischer Bewertungsmethoden E-Valuation – Implementierung ökomomischer Bewertungmethoden,
Dedizierte Systeme Typo3 Installation Dedizierte Systeme – Typo3 Installation – Christoph Stollwerk IT Zertifikat der Philosophischen Fakultät WS 2008/2009.
Transparente Information als Grundlage für ein erfolgreiches Controlling Claus Anton Finze, Projektleiter, DaWaVision.
CMS Content-Management-Systeme (CMS), dienen der Verwaltung und Pflege von Dokumenten und Inhalten in Inter- und Intranetanwendungen. Den Entwickler oder.
© 2001 Sven Dammann1 Aufbau Integrierter Informationssysteme XML Bearbeitung und relationale Abbildung Sven Dammann Martin-Luther-Universität Halle-Wittenberg.
Stundenplanung Programm zur Stunden- und Zimmerplanung auf der Basis von Datenbanken und unter Berücksichtigung von Mehrfachnutzung im (lokalen) Netz (Internet.
Partner Präsentation Interaktives Planen in der Fertigung.
TypoScript.
1 Wolfgang Wiese, Regionales RechenZentrum Erlangen WCMS 3. August 2000 Wolfgang Wiese RRZE / Lehrstuhl für Informatik VII
Webserver, Apache und XAMPP
Webserver Apache & Xampp Referenten: Elena, Luziano und Sükran
WINLearn Technische Umsetzung. Basistechnologie Oberfläche in HTML JSP (JavaServerPages) zur Datenauswertung Datenhaltung: Datenbank oder Filesystem JDBC.
© 2003, Rudolf Jansen Einsatz der XML-Features der Oracle 9i DB zur Systemintegration Rudolf Jansen Freiberuflicher Entwickler und Autor
LINUX II Unit 7 LAMP Server. LAMP ● Linux – Apache - MySQL – PHP ● Leistungsfähiges und kostenloses System zur Genrierung von dynamischen Webseiten und.
Ein Toolkit zur Präsentation von hierarchischen Bibliotheksdaten Andres von Arx UB Basel, August 2006.
Datenbanken.
ORACLE XE Bernd Tuba, Trier, Deutsche Post ITSolutions GmbH.
Von Wietlisbach, Lenzin und Winter
 Präsentation transkript:

Erstellen einer Webseitenstatistik mithilfe eines OLAP-Servers Projektarbeit Erstellen einer Webseitenstatistik mithilfe eines OLAP-Servers Jan Lübeck Envers AG

Agenda Einleitung Ist - Aufnahme Soll - Konzept Realisierung Fazit

Einleitung

Seit 2000 in DU-Rheinhausen Zur Zeit 11 Mitarbeiter Die Envers AG Seit 2000 in DU-Rheinhausen Zur Zeit 11 Mitarbeiter IT Dienstleistungen Entwicklung/Vermarktung von Softwarelösungen

Eigenes CMS “Flexcove 3” Modularer Aufbau Serverseitiges Sessionsystem Das CMS Eigenes CMS “Flexcove 3” Modularer Aufbau Serverseitiges Sessionsystem Administration über Controlcenter

Ist - Aufnahme

Speicherung pro Seitenzugriff Datensammlung Speicherung pro Seitenzugriff Relationale Datenbank ( MySQL ) 2 Tabellen 1. Tabelle: Zugriffsdaten 2. Tabelle: Parameter pro Zugriff( 1:n ) Große Datenmengen Flexible Datensammlung

Anzeige pro Zeiteinheit/Zeitraum: Auswertung Anzeige pro Zeiteinheit/Zeitraum: Benutzerzahlen Seitenaufrufe Referer Javascript Bildschirmauflösung

Daten per SQL-Statements Neuberechnung bei jeder Abfrage Performance Daten per SQL-Statements Neuberechnung bei jeder Abfrage „Joins“ mit anderen Datenbanken Langsam: 4 bis 11 Minuten

Google Analytics: Log-Auswertung: Generell: Externe Tools Javascript nötig Keine Benutzer-Auswertung Log-Auswertung: Langsam oder Statisch Wenig Information Generell: Abhängigkeit vom Datenformat

Soll - Konzept

Online Analytics Processing Daten in “Cubes” OLAP Online Analytics Processing Daten in “Cubes” “Cube” ist Sinnbild Enthält Werte Dimensionen Definieren die Bedingungen Enthalten Elemente Summenelemente Elemente erlaeutern!

Wert( Gesamt, Jahr, Zugriffe ) OLAP Schlüssel Zugriffe - Admin - Benutzer - Bot Monat - Jahr - Januar - Februar - … Jahr - Gesamt - … - 2007 - 2008 Abfrage von Werten Wert( 2008, Januar, Bot) Wert( 2008, Jahr, Benutzer ) Wert( Gesamt, Jahr, Zugriffe )

Methoden zur Speicherung OLAP Operationen Slicing/Dicing ( Scheiben/Würfel ) Drill-Down / Drill-Up ( Detailgrad ) Pivoting ( Drehen ) Methoden zur Speicherung MOLAP ( Multidimensionales „Array“ ) ROLAP HOLAP

Beschleunigung der Auswertung Einsatz eines OLAP-Servers Sollkonzept Beschleunigung der Auswertung Einsatz eines OLAP-Servers Abfrage per Webbrowser Linux/Apache/PHP Gleiches UI Gleicher Datenumfang

PALO Linux, Apache, PHP ( Anforderung ) OLAP-Server Bedingungen: Software Linux, Apache, PHP ( Anforderung ) OLAP-Server Bedingungen: Linux Möglichst kostengünstig PHP-Schnittstelle PALO

Realisierung

Softwareinstallation Palo

Definition der Dimensionen Zeitliche Einteilung Datum( “Year”, “Month”, “Day” ) “Hour”, “Minute”, “Second” Art der Zusammenfassung “Request” “Session” ( Bot, User, Admin )

Definition der Dimensionen Schlüssel-Wert-Paare HTTP-Variablen: Übergabeparameter Javascript-Parameter, wenn verfügbar Summierung als Hierarchie Typ Schlüssel Wert

Beispiel HTTP HTTP| Referer HTTP| Referer| www.google.de HTTP| Referer| www.msn.com HTTP| User_Agent HTTP| User_Agent| Firefox HTTP| User_Agent| IE_7

Auslesen der Daten von MySQL Füllen der Dimensionen Benutzer Zugriffe Importscript Auslesen der Daten von MySQL Füllen der Dimensionen Benutzer Zugriffe Schlüssel Füllen des Cubes

Trennung von Daten und Darstellung Auswertung Trennung von Daten und Darstellung Klasse „Analysis“ Wertet Überparameter aus Ermittelt Daten Erstellt XML-Daten XSLT-Prozessor Erhält XML-Daten Benutzt XSLT-Template Erstellt HTML-Daten

Fazit

Weitere Seitenaufrufe Vergleich   Bisherige Auswertung Neue Auswertung Zeitvorteil Erster Seitenaufruf 11 Minuten 4 Minuten 275% Weitere Seitenaufrufe 1-6 Minuten 15-45 Sekunden 400-800% Import Ad-Hoc Ca. 10 Minuten -

Zu bewältigende Hürden Ausblick Erfahrungen mit PALO Relativ unflexibel Skaliert nicht Langsam im Import Alternative: HOLAP Zu bewältigende Hürden Zugriff über PHP Einsatz Linux oder Windows

Vielen Dank für Ihre Aufmerksamkeit