Abgrenzung, Einordnung und Anwendungen Sebastian Hentschel Data Warehousing Abgrenzung, Einordnung und Anwendungen Sebastian Hentschel
09. Juni 2005
Agenda Begriffe Historie Anwendungsbereiche Aufbau eines DW-Systems OLAP vs. OLTP Fazit 09. Juni 2005
Agenda Begriffe Historie Anwendungsbereiche Aufbau eines DW-Systems OLAP vs. OLTP Fazit 09. Juni 2005
Begriffe Definition nach Inmon (1996): „A data warehouse is a subject oriented, integrated, non-volatile, and time variant collection of data in support of management‘s decisions.“ 09. Juni 2005 William H. Inmon
Begriffe Definition nach Bauer/Günzel: „Ein Data-Warehouse ist eine physische Datenbank, die eine integrierte Sicht auf (beliebige) Daten darstellt, um Analysen zu ermöglichen.“ 09. Juni 2005
Begriffe Definition nach Zeh: „Ein Data-Warehouse ist ein physischer Datenbestand, der eine integrierte Sicht auf zugrundeliegende Datenquellen ermöglicht.“ 09. Juni 2005
Begriffe Data Warehouse Physische Datenbank Integrierte Sicht auf Daten Häufig historisierte Daten Periodische Updates, aber keine Veränderungen Ausgangspunkt für OLAP und Data Mining 09. Juni 2005
Begriffe Unterschiede zu klassischen DBMS: Zusätzlich Datenverdichtung, Partitionierung, Redundanz Anwendungssicht, Datensicht, Entwicklungssicht siehe OLTP/OLAP 09. Juni 2005
Begriffe Data Warehouse Systeme Informationssystem Komponenten zur Integration und Analyse Statischer Charakter 09. Juni 2005
Begriffe Data Warehousing Prosess zur Planung, zum Aufbau und zum Betrieb eines DW-Systems Dynamischer Vorgang von der Datenbeschaffung über das Speichern bis zur Analyse der Daten 09. Juni 2005
Begriffe Data Mart „kleines“ Data Warehouse auf bestimmte Geschäftsprozesse oder Problemstellungen bezogen dezentral Einführung kostengünstiger und schneller als DW 09. Juni 2005
Agenda Begriffe Historie Anwendungsbereiche Aufbau eines DW-Systems OLAP vs. OLTP Fazit 09. Juni 2005
Historie Triebfedern Betriebswirtschaftliches Berichtswesen Statistik Integration 09. Juni 2005
Historie 1960er: Executive Information Systems (EIS) 1980er: Management Information Systems (MIS) 1988: EBIS-Architektur von IBM 1992: Einführung DW-Konzept (Inmon) 1993: OLAP (Codd) Heute: Business-Warehouse-Systeme bzw. Business-Intelligence-Systeme 09. Juni 2005
Historie Fehlende Voraussetzungen der Anfangszeit Schnelle und flächendeckende Kommunikationstechnologie Grafische Benutzeroberflächen Ausreichende, kostengünstige und schnelle Datenspeicher Kostengünstige und leistungsfähige Prozessoren Große Datenbasen durch integrierte operative Systeme Scheitern der MIS-Ansätze der 60er, 70er, 80er 09. Juni 2005
Agenda Begriffe Historie Anwendungsbereiche Aufbau eines DW-Systems OLAP vs. OLTP Fazit 09. Juni 2005
Anwendungsbereiche Betriebswirtschaft Informationsbereitstellung zur erfolgreichen Abwicklung von Geschäftsprozessen (Kennzahlen) Analyse zur Untersuchung von Abweichungen und Auffälligkeiten Planung Kampagnenmanagement 09. Juni 2005
Anwendungsbereiche Wissenschaft (statistical and scientific databases) Bsp. Project Earth Observing System Technik Umweltdaten, geografische Daten Bsp. Wasseranalysen 09. Juni 2005
Agenda Begriffe Historie Anwendungsbereiche Aufbau eines DW-Systems OLAP vs. OLTP Fazit 09. Juni 2005
Aufbau eines DW-Systems 09. Juni 2005 Quelle: Uni Kaiserslautern
Aufbau Datenquellen Metadaten OLAP-Server Data Mining 09. Juni 2005
Agenda Begriffe Historie Anwendungsbereiche Aufbau eines DW-Systems OLAP vs. OLTP Fazit 09. Juni 2005
OLAP vs. OLTP OLTP: Online Transactional Processing Operative Systeme (viele kurze Transaktionen im Mittelpunkt) Keine Redundanz, Normalisierung (reine Lehre) Aktueller Datenbankzustand Bsp.: Flugbuchung Ziel: viele TA pro sek, TA-Sicherheit bei parallelen Anfragen, Minimierung der Antwortzeit 09. Juni 2005
OLAP vs. OLTP OLAP: Online Analytical Processing Informative Systeme Große Anfragen Redundanz notwendig Historisierung Tages-/Wochenaktualität ausreichend Voraggregation Bsp.: Getränkemarkt (Quelle: Sattler/Saake) Ziel: Antwortzeit von wenigen sek 09. Juni 2005
OLAP vs. OLTP Beispiel Umsatz, Portfolio Werbung 09. Juni 2005 Quelle: Sattler/Saake
OLAP vs. OLTP Anfragen Wie viele Flaschen Cola wurden letzten Monat verkauft? Wie hat sich der Verkauf von Rotwein im letzten Jahr in den Regionen entwickelt? Wer sind unsere Top-Kunden? Von welchem Lieferanten beziehen wir die meisten Kisten? 09. Juni 2005
OLAP vs. OLTP Anforderungen Ständig neue Anfragen (Gliederungsebenen, Fokus, …) Schnelle Berichterstellung Gleiche Antwortzeit für Standard- und Ad-hoc-Anfragen Keine Einbindung von IT-Abteilungen bei neuer Anfragestruktur 09. Juni 2005
OLAP vs. OLTP 09. Juni 2005
OLAP vs. OLTP Bsp. Anfragen OLTP OLAP UPDATE Personal SET Bonus = Bonus * 1.1, Gehalt = Gehalt * 0.95 WHERE Name = ‘Meier‘; UPDATE Kunden SET Betreuer = ‘Meier‘ WHERE Name = ‘Huber‘; COMMIT; OLAP SELECT MONTH(V.Datum),R.Region,P.Produktfamilie FROM Verkäufe V ,Produkte P ,Regionen R WHERE V.ProduktNr = P.ProduktNr AND V.RegionNr = R.RegionNr AND YEAR(V.Datum) = 2004 AND P.Produktfamilie = ‘Rotwein‘ GROUP BY MONTH(V.Datum), R.Region 09. Juni 2005
OLAP vs. OLTP Codd`sche Regeln 1. Multidimensionale konzeptionelle Sicht 2. Transparenz 3. Zugriffsmöglichkeiten 4. Konstante Antwortzeiten 5. Client/Server-Architektur 6. Generische Dimensionalität 7. Dynamische Behandlung dünn besetzter Matrizen Ted Codd 09. Juni 2005
OLAP vs. OLTP Codd`sche Regeln 8. Mehrbenutzerunterstützung 9. Kreuzdimensionale Operationen 10. Intuitive Datenbearbeitung 11. Flexible Berichterstellung 12. Unbegrenzte Anzahl von Dimensionen und Klassifikationshierarchien 1995 Erweiterung um 6 weitere Regeln 09. Juni 2005
OLAP vs. OLTP FASMI (fast analysis of shared multidimensional information) Geschwindigkeit Analysemöglichkeit Sicherheit Multidimensionalität Kapazität 09. Juni 2005
Agenda Begriffe Historie Anwendungsbereiche Aufbau eines DW-Systems OLAP vs. OLTP Fazit 09. Juni 2005
Fazit „Wir ertrinken in Informationen und dürsten nach Einsicht.“ John Naisbitt 09. Juni 2005
Fazit DW kann helfen Aber Einführung allein genügt nicht Sorgfältige Planung, Kostenanalyse und Nutzenabschätzung unumgänglich Sonst Gefahr des Scheiterns Dennoch immenses Marktwachstum 09. Juni 2005
Fazit 09. Juni 2005 Quelle: http://www. Olapreport.com
Vielen Dank für die Aufmerksamkeit… 09. Juni 2005