Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Thema 1 Data WareHouse Volker Jahns. Themen 1. Einführung - Motivation 2. Aufbau eines DWh 3. Data Marts vs. Data WareHouse 4. Operative Daten vs. Analytische.

Ähnliche Präsentationen


Präsentation zum Thema: "Thema 1 Data WareHouse Volker Jahns. Themen 1. Einführung - Motivation 2. Aufbau eines DWh 3. Data Marts vs. Data WareHouse 4. Operative Daten vs. Analytische."—  Präsentation transkript:

1 Thema 1 Data WareHouse Volker Jahns

2 Themen 1. Einführung - Motivation 2. Aufbau eines DWh 3. Data Marts vs. Data WareHouse 4. Operative Daten vs. Analytische Daten 5. Datenbereitstellung

3 [1.] Einführung - Motivation  Eine Technik / Konzept unterschiedliche Daten in zentraler Form zu speichern  Zentrale Informationsquelle für Daten  Ermöglicht globale Sicht auf heterogene Daten  Verfolgt das Ziel der Integration und Separation Was ist ein Data Ware House? Definition: Ein Data-Warehouse ist eine zentrale Datensammlung (meist eine Datenbank), deren Inhalt sich aus Daten unterschiedlicher Quellen zusammensetzt. Die Daten werden von den Datenquellen in das Data-Warehouse geladen und dort vor allem für die Datenanalyse und zur betriebswirtschaftlichen Entscheidungshilfe in Unternehmen langfristig gespeichert.

4  DW‘s sind in den Bereich der Softwareentwicklung einzuordnen  Entwicklung durchläuft ein eigenständigen Prozess  Fachkenntnisse aus der IT und Fachabteilung sind notwendig [1.] Einführung - Motivation Grundlegendes für den Aufbau eines DW

5  Der Aufbau eines DW kann in zwei grundlegende Phasen gegliedert werden  Beide Entwürfe werden in dem ALC (Application Life Cycle) – Prozess detailliert ausgeführt, um eine fundierte Basis für die Umsetzung des DW zu bilden. [2.] Aufbau eines Data WareHouses Grundlegendes für den Aufbau eines DW Konzeptueller Entwurf IT Entwurf Aufbau

6 [2.] Aufbau eines Data WareHouses Grundlegendes für den Aufbau eines DW Anforderungen ETL ERP‘s VertriebProduktionReWe Mehrwert Unternehmen Magic

7 [2.] Aufbau eines Data WareHouses  Der ALC – Prozess wird in folgende Phasen gegliedert Grundlegendes für den Aufbau eines DW Deployment Management Verificiation

8 [2.] Aufbau eines Data WareHouses Deployment Grundlegende Fragen in der Vorstudienphase: FACHABTEILUNG  Was sind die Ziele?  Was will man damit erreichen bzw. welche Situation verbessern?  Können damit Erfolgspotentiale/Wettbewerbsfaktoren geweckt bzw. gefördert werden?  Welchen ROI haben wir bzw. gibt es einen?  DW geeignet oder „Oversized“ ?

9 [2.] Aufbau eines Data WareHouses Deployment Grundlegende Fragen in der Vorstudienphase: IT – Abteilung  Was für operative Systeme sind vorhanden?  Welche Daten müssen/sollen übernommen werden?  Wo liegen die größten Probleme?  Daten Qualität  Daten Granularität  Daten Konsistenz  Welche DW – Anbieter sind für uns optimal?  Welche Anforderungen aus der Fachabteilung sind überhaupt realisierbar?

10 [2.] Aufbau eines Data WareHouses Drei Varianten stehen zur Verfügung Implementierung Op. Data DW Th.P. Data Th.P. Data Op. Data Th.P. Data Th.P. Data DM Op. Data Th.P. Data Th.P. Data Virtuelles DWZentrales DWData Mart

11 [2.] Aufbau eines Data WareHouses ALC – Management/Implementierung Nach der Auswahl der DW-Grobstruktur (Zentral, Virtuell oder DM), müssen folgende Fragen geklärt werden:  Granularität der Daten  Partitionierung  Horizontal  Vertikal  Denormalisierung  Externe Daten Datenhaltung ETL‘s Spezialisierung Generalisierung

12 [3.] Data Warehouse vs. Data Mart

13  Data Warehouse Eine von den operativen DV-Systemen isolierte Datenbank, die als unternehmensweite zentrale Datenbasis für alle Ausprägungen managementunterstützender Systeme dient  Data Mart Datensammlung, die auf die Bedürfnisse einer bestimmten Abteilung oder eines eingegrenzten Themas ausgerichtet ist.

14 [3.] Data Warehouse / Data Mart KriterienData MartData Warehouse AnwendungsbezugJaNein, anwendungsneutral Adressat der Datenbereitstellung AbteilungUnternehmen Vorherrschende Datenbanktechnologie MultidimensionalRelational Granularität der DatenNiedrigHoch DatenmengeNiedrigHoch Menge historischer DatenNiedrigHoch OptimierungszielAbfragegeschwindigkeitDatenmenge Anzahl pro UnternehmenMehrereEines bis sehr wenige DatenmodellIn jedem Data Mart unterschiedlich Einheitliches Unternehemsmodell

15 [3.] Daten für operative / analytische Anwendungen (1) KriterienDaten für operative Anwendungen Daten für analytische Anwendungen ZweckUnterstützung und Abwicklung operativer Geschäftsvorfälle Informationen für das Management; Unterstützung von Entscheidungen, themenorientiert InhaltDetaillierte, aktuelle Geschäftsvorfalldaten, zeitpunktorientiert Verdichtete und bereinigte Daten, historische und z.T. zukünftige Daten, zeitraumorientiert AktualitätHoch (online, realtime)Meist keine Tagesaktualität ModellierungAltdatenbstände oft nicht modelliert (funktionsorientiert) Sachgebiets- oder themenbezogen modelliert; standardisiert und endbenutzertauglich

16 [3.] Daten für operative / analytische Anwendungen (2) KriterienDaten für operative Anwendungen Daten für analytische Anwendungen ZustandRedundant, inkonsistent, teilweise unnormalisiert Konsistent modelliert, kontrollierte Redundanzen ÄnderungenLaufendAutomatische Fortschreibung, Beständigkeit des einmal übernommenen Datenbestandes AbfragenStrukturiert, vordefiniertAd-hoc-Abfragen für komplexe, ständig wechselnde Fragestellungen; vordefinierte Standardauswertungen

17 [4.] Operative vs. Analytische Daten Operative Daten  Strukturiert für die Verarbeitung in Transaktionssystemen  Jeder Datensatz muss jederzeit für Lese- und Schreibzugriffe zur Verfügung stehen  Details über Daten sind notwendig Analytische Daten  Anderer Aufbau als „Operative Daten“  Analytische Daten wurden verändert/angepasst  Daten werden komprimiert in Kennzahlen und zusammengefasst

18 [4.] Operative vs. Analytische Daten Die Daten können mit folgenden Fragen klassifiziert werden:  Was?  Wer?  Wann?  Wie?

19 [5.] Arbeitsschritte zur Datenbereitstellung „ETL-Prgramme“

20

21 1. Extraktion = Selektion von Daten aus operativen Datenquellen für das Data Warehouse  Prüfung der Daten-Verfügbarkeit (Beachtung von Datenschutzrechten, Eigentumsrechten, Grad der Vertraulichkeit)  Festlegung des Zeitpunktes zur Daten-Extraktion  Periodische Extraktion  Extraktion auf Anfrage  Ereignisgesteuerte Extraktion  Sofortige Extraktion  Temporäre Speicherung im Arbeitsbereich des DW  „Staging Area“

22 [5.] Arbeitsschritte zur Datenbereitstellung „ETL-Prgramme“ 2. Transformation = Eliminierung von Qualitätsmängeln und betriebswirtschaftliche Aufbereitung der operativen Daten für analytische Fragestellungen mittels folgender Verfahren:  Bereinigung  Beseitigung von semantischen und syntaktischen Mängeln 1. bis 3. Klasse  Harmonisierung  betriebswirtschaftliche Vereinheitlichung unterschiedlicher Codierungen, Attribute und Schlüssel  Verdichtung  Summierung der Daten auf verschiedenen Stufen im DW  Anreicherung  Speicherung von vorberechneten Kennzahlen im DW

23 [5.] Arbeitsschritte zur Datenbereitstellung „ETL-Prgramme“ 3. Laden = Übernahme der Daten aus operativen Vorsystemen in das Data Warehouse, unterschieden wird in:  Initiales Füllen des DW mit Daten aus operativen Datenquellen und ggf. ergänzt durch Archivdaten  Zyklische Aktualisierung der analytischen Datenbasis  Aktualisierungsvarianten:  Kompletter Abzug  Nur Übernahme der Änderungen  Auswahl protokollierter Datenbanktransaktionen


Herunterladen ppt "Thema 1 Data WareHouse Volker Jahns. Themen 1. Einführung - Motivation 2. Aufbau eines DWh 3. Data Marts vs. Data WareHouse 4. Operative Daten vs. Analytische."

Ähnliche Präsentationen


Google-Anzeigen