Betriebliche Anwendung von Datenbanksystemen: Data Warehouse Was ist ein Data Warehouse? Unterschied Online Transaction Processing / Online Analytical Processing (OLTP – OLAP) Aufbau Data Warehouse Stern-Schema Daten-Würfel Optimierung des Zugriffs SAP Business Information Warehouse (SAP BW) Data Mining Data Warehouses
Was ist ein Data Warehouse? Data Warehouses
Vom MIS zum Data Warehouse Management Information System Decision Support System / Entscheidungsunterstützendes System Financial / Enterprise Information System Business Intelligence Viele Abkürzungen für eine Sache Data Warehouses
Definitionen für Data Warehouses Ein Data Warehouse ist eine zentrale Datensammlung aller Daten oder signifikanter Teile von Daten, die innerhalb verschiedener Unternehmens-Systeme anfallen. Ein Data Warehouse ist eine Kopie von Transaktionsdaten, die speziell für Abfragen und Berichte strukturiert ist. Ein Data Warehouse ist eine Datensammlung, die Management-Entscheidungen unterstützen soll. Data Warehouses enthalten sehr unterschiedliche Daten, die die gegebenen Unternehmensbedingungen innerhalb eines vorgegebenen Zeitraums kohärent abbilden. Data Warehouses
Inmon-Definition: Data Warehouse Dauerhafte Sammlung von Informationen unternehmensweite Integration von Daten Zeitraumbezug als Bestandteil der Daten Themenausrichtung an Sachverhalten des Unternehmens „A data warehouse is a subject-oriented, integrated, nonvolatile, time-variant collection of data in support of management’s decision”. (Bill Inmon) Data Warehouses
Reflexion dieser Definition subject-oriented Fragestellungen sind nicht orientiert am Objektverhalten (im Kleinen) sondern an statistischen Analysen von Geschäftsprozessen im Großen integrated Datenanalyse nicht technisch, sondern logisch betrachten. Nicht technische Transformation, sondern fachlich-einheitliche Informationen. Kein Zeitpunktbezug, sondern Zeitraumanalysen time-variant Zugriff nur über Lese- und Einfügeoperationen. Keine zeitpunktaktuellen aber unveränderliche Informationen. nonvolatile in support of management‘s decision Continuous Improvement Ein Data Warehouse ist ein Datenbestand, der eine integrierte Sicht auf die zugrunde liegenden Datenquellen ermöglicht, um fundierte Entscheidungen für Wandel in Unternehmen zu unterstützen. Data Warehouses
Continuous Improvement (Re-)Definition der Geschäftsprozesse (Erfolgs-)Kontrolle durch Auswertungen von Informationen Wissensbasierte Entscheidungen Erzeugtes Wissen Data Warehouses
Data Warehouse: erweiterte Definition Data Warehouses
Aufbau SAP BW Data Warehouses
Aufbau des SAP BW © SAP AG Data Warehouses
Nutzenpotentiale Technischer Nutzen Betriebswirtschaftlicher Nutzen Verbesserte Datenintegration Keine Datenprüfungen notwendig (Reporting only) Schnelle Abfragen möglich Entlastung operativer Anwendungen Flexible Zugriffsmöglichkeiten Betriebswirtschaftlicher Nutzen Verbesserte Informationsbereitstellung Frühzeitiges Erkennen von Trends Continuous Improvement Frühwarnsystem (Exception Reporting) Verbesserung der Kundenzufriedenheit durch Entwicklung kundenorientierter Strategien Data Warehouses
Online Transaction Processing (OLTP) und Online Analytical Processing (OLAP) Data Warehouses
OLTP: Online Transaction Processing Beispiele Flugbuchungssystem Bestellungen in einem Handelsunternehmen Charakterisierung Hoher Parallelitätsgrad Viele (Tausende pro Sekunde) kurze Transaktionen TAs bearbeiten nur ein kleines Datenvolumen „mission-critical“ für das Unternehmen Hohe Verfügbarkeit muss gewährleistet sein Normalisierte Relationen (möglichst wenig Update-Kosten) Nur wenige Indexe (wegen Fortschreibungskosten) Data Warehouses
Operative Systeme -> DW Reservie- rungs- system Personal- ver- waltung ... Auftrags- verarbeitung Reservie- rungs- system Auftrags- verarbeitung Personal- ver- waltung Data Warehouse ... Data Warehouses
Data Warehouse-Anwendungen: OLAP-Online Analytical Processing Wie hat sich die Auslastung der Transatlantikflüge über die letzten zwei Jahre entwickelt? oder Wie haben sich besondere offensive Marketingstrategien für bestimmte Produktlinien auf die Verkaufszahlen ausgewirkt? Data Warehouses
Sammlung und periodische Auffrischung der Data Warehouse-Daten OLAP-Anfragen Decision Support Data Mining OLTP-Datenbanken und andere Datenquellen Data Warehouse Data Warehouses
Transaktionsorientierte und analyseorientierten Systeme Transaktionsorientierte Systeme Operative Systeme Auswertungsorientierte Systeme Weniger häufige, komplexe Anfragen Grosse Datenmengen je Anfrage Häufige, einfache Anfragen Kleine Datenmengen je Anfrage Schnelle Kalkulation wichtig Schneller Update wichtig Parallele Ausführung von OLAP-Anfragen auf operationalen Datenbe-ständen könnte Leistungsfähigkeit der OLTP-Anwendungen beeinträchtigen Operieren auf fastaktuellen und historischen Daten Operieren hauptsächlich auf aktuellen Daten Datenbanksystem kann nicht gleichzeitig für OLTP- und für OLAP-Anwendungen optimiert werden OLTP (Online Transaction Processing) OLAP (Online Analytical Processing) Data Warehouses
OLTP versus OLAP Data Warehouses
Zusammenhang OLTP / OLAP Data Warehouses
Architektur von SAP/R3 Data Warehouses
SAP R/3: Enterprise Resource Planning/Modelling (ERP-System) WAN (Internet) Applikations-server LAN Relationales DBMS als Backend-Server (Hana, MaxDB, Oracle, Informix, DB2, MS SQL-Server, Adabas) Data Warehouses
Dreistufige Client/Server-Architektur (3 Tier, SAP R/3) sehr viele (Tausende) Clients ein Datenbank- Server mehrere Applikations- Server zur Skalierung Sehr schnelles LAN „langsame“ Netzverbindung (WAN, Internet, Telefon, ...) Data Warehouses
Interne Architektur von SAP R/3 Applikationsserver Data Warehouses
Transaktionsverarbeitung in SAP R/3 Data Warehouses