Thema 1 Data WareHouse Volker Jahns.

Slides:



Advertisements
Ähnliche Präsentationen
Einfluss von Web Services Technologien auf organisatorische Strukturen Referent: Sergej Groß
Advertisements

Daten im Data-Warehouse
Prof. Dr. Dr. h.c. mult. August-Wilhelm Scheer
Informatik 12 | DAES Compilerbau Wintersemester 2010 / 2011 Dr. Heiko Falk Technische Universität Dortmund Lehrstuhl Informatik 12 Entwurfsautomatisierung.
Datenbanken Einführung.
ACN Closing Cockpit Andrea Mokesch
Institut für Informatik Abteilung Datenbanken Problemseminar Datacleaning Überblick Datacleaning.
1-1 Schlank und schnell zum Datawarehouse Marc Bastien Oracle Deutschland GmbH BTW Leipzig,
Inhaltlich orientierter Zugriff auf unstrukturierte Daten
Ulrich Kähler, DFN-Verein
Konzeption und prototypische Implementierung eines zentralen Informationssystems für Systemmanagement Motivation Oft wird es schwierig, die benötigten.
Customer Relationship Management
Universität Stuttgart Institut für Kernenergetik und Energiesysteme LE 3.2- LM 8 - LO 9 Definitionen zu LM 8.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/7 Datenbanken werden als Anhäufung von Werten eines Wertebereiches aufgefasst und Datenbankabfragen.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/9 Data Mining Ist die Wissensgewinnung aus Datensammlungen (Knowledge Discovery in Database).
Markplätze für Agenten Seminar Softwareagenten Timo Hoelzel.
Erweiterte Datenmodelle Referentin: Lena Becker HS: Datenbanken vs. Markup Datum:
Datenbankentwurf mit Hilfe des ER-Modells entwickeln
Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme
1 KM-Modul: Knowledge Wizard Personalisierte Verknüpfung von Wissensprozessen und Geschäftsprozessen auf Basis von Metainformationen Dr. Marc Diefenbruch.
Entscheidungsunterstützende Systeme (Data Warehouse)
Datenbanken Einführung Merkmale dateiorientierte Datenverwaltung
Datenbankentwurfsprozess
Phase 1 Phase 2 Prozessmanagement
Daten sammeln aus Verschiedenen Datenbanken Dokumenten Dateien
Was ist ITOS? –Das Unternehmen ITOS ist im Bereich Informationstechnologie tätig –Entwicklung von Konzepten wie CMS und CRM für Unternehmen, die die interne.
Spezifikation von Anforderungen
Entwicklung eines Data Warehouse © by Sistema GeoDAT, S.L.
Entwurf und Realisierung einer digitalen Bibliothek zur Verwaltung von Notenhandschriften Dipl.-Ing. Temenushka Ignatova Datenbank- und Informationssysteme,
Qualitätskontrolle von Datenintegrations-prozessen
© DVS System Software GmbH & Co. KG
Entwicklung eines Data Warehouse 2007 © by Sistema GeoDAT, S.L.
Möglichkeiten und Einsatz Ihre Vorteile
Balanced Scorecard Knut Hinkelmann
© 2005, informations-broker.netinformations-broker.net© 2005, informations-broker.netinformations-broker.net Folie-Nr Basel II: Rating verbessern.
Das Portal – Ein Tor zum Unternehmen
Copyright Melville-Schellmann 2009 Beratung und Entwicklung für CRM-Software Schritt 1 Vertragliche Grundlagen Aktion Beauftragung eines.
Problemstellung Heterogene DV-Strukturen Mangelnde Kapazität in der EDV-Abteilung Historische Daten nicht verfügbar Analysen belasten die vorhandene Infrastruktur.
Datenbanken und Datenmodellierung
Allgemeines zu Datenbanken
Data Warehouse: ETL-Praktikum
Replikation und Synchronisation
QlikView meets TM1 – eine Ehe zwischen Optik und Performance
Skalierbare Reporting-Systeme zwischen Excel™ und Data Warehouse
00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Multidimensionale Datenstrukturen - semantische und logische Modellierung Teilvortrag: logische Modellierung.
Betriebliche Anwendung von Datenbanksystemen: Data Warehouse
IT Kosten Reduzierung und effizientere Dienstleistungen Wir optimieren Strukturen und Prozesse und reduzieren dabei Ihre IT Kosten Ihr OPTICONSULT International.
Mehr Zeit für den Kunden und wirtschaftlicher Arbeiten mit BIB-Control
Analytisches CRM Phonnet Gruppe 1 (Loher, Meier, Rehhorn, Piasini)
Content Management System
Das Unternehmen.
Eike Schallehn, Martin Endig
Die Management-Tools von Z&H COACH beinhalten zentrale Hilfsmittel für ein Management-System. Sorgfältig angewendet führen diese Tools Ihr Unternehmen.
Finanzcontrolling aus einer Hand – Financial Data Warehouse
Kompetenzzentrum für Befragungen Trigon Entwicklungberatung
Nachtrag Abgrenzung OLAP / OLTP
Methoden der Sozialwissenschaften
- Studienarbeit - Entwurf und Umsetzung von kombinierten Anfragen für die Ähnlichkeitssuche auf digitalen Bilder auf der Basis von Regionen und Features.
DATAframe ® Transparenz in Ihrem Unternehmen Referent: XXXXXXX Datum:
Komponenten und Phasen des Data Warehousing
Funktion der Arbeitspapiere
1 RICHTER + RICHTER GbR Unternehmensberatung Entengasse 7, D Aschaffenburg Tel: +49 (0) Fax: +49 (0) mailto:
Daten-Verarbeitung-Tirol GmbH Benjamin Kostner Lightwave – Bedienkonzept und Design | Entwicklung Geschichte Neues Design vor drei Jahren begonnen Basis.
AGU IT 2006, Seite 1 Produktionsauftragsverwaltung Produkte für WinCC Herstellvorschrift und Produktionsaufträge Lizenzpreis pro Anwendung 3850,-€Einrichtung.
Comprehensive Information Base (CIB) – ein Prototyp zur semantischen Datenintegration Stefan Arts
Effektives Delta Laden DOAG SID Data Warehouse. Ziele Welche CDC Methoden gibt es? Typische Fallen Verschiedene Lösungsansätze praktische Beispiele.
/Folie 1Holger Frietsch Historisierung von Zuordnungsänderungen für Dimensionen in relationalen ORACLE8-Data Warehouse- Datenbanken Holger Frietsch.
Alfred Schlaucher, Data Warehouse Architect, Oracle Oracle Data Warehouse.
Nachtrag Abgrenzung OLAP / OLTP
 Präsentation transkript:

Thema 1 Data WareHouse Volker Jahns

Themen 1. Einführung - Motivation 2. Aufbau eines DWh 3. Data Marts vs. Data WareHouse 4. Operative Daten vs. Analytische Daten 5. Datenbereitstellung

[1.] Einführung - Motivation Was ist ein Data Ware House? Eine Technik / Konzept unterschiedliche Daten in zentraler Form zu speichern Zentrale Informationsquelle für Daten Ermöglicht globale Sicht auf heterogene Daten Verfolgt das Ziel der Integration und Separation Definition: Ein Data-Warehouse ist eine zentrale Datensammlung (meist eine Datenbank), deren Inhalt sich aus Daten unterschiedlicher Quellen zusammensetzt. Die Daten werden von den Datenquellen in das Data-Warehouse geladen und dort vor allem für die Datenanalyse und zur betriebswirtschaftlichen Entscheidungshilfe in Unternehmen langfristig gespeichert.

[1.] Einführung - Motivation Grundlegendes für den Aufbau eines DW DW‘s sind in den Bereich der Softwareentwicklung einzuordnen Entwicklung durchläuft ein eigenständigen Prozess Fachkenntnisse aus der IT und Fachabteilung sind notwendig

[2.] Aufbau eines Data WareHouses Grundlegendes für den Aufbau eines DW Der Aufbau eines DW kann in zwei grundlegende Phasen gegliedert werden Beide Entwürfe werden in dem ALC (Application Life Cycle) – Prozess detailliert ausgeführt, um eine fundierte Basis für die Umsetzung des DW zu bilden. Konzeptueller Entwurf Aufbau IT Entwurf

[2.] Aufbau eines Data WareHouses Grundlegendes für den Aufbau eines DW Unternehmen Mehrwert Magic Vertrieb Produktion ReWe ERP‘s ETL Anforderungen

[2.] Aufbau eines Data WareHouses Grundlegendes für den Aufbau eines DW Der ALC – Prozess wird in folgende Phasen gegliedert Deployment Management Verificiation

[2.] Aufbau eines Data WareHouses Deployment Grundlegende Fragen in der Vorstudienphase: FACHABTEILUNG Was sind die Ziele? Was will man damit erreichen bzw. welche Situation verbessern? Können damit Erfolgspotentiale/Wettbewerbsfaktoren geweckt bzw. gefördert werden? Welchen ROI haben wir bzw. gibt es einen? DW geeignet oder „Oversized“ ?

[2.] Aufbau eines Data WareHouses Deployment Grundlegende Fragen in der Vorstudienphase: IT – Abteilung Was für operative Systeme sind vorhanden? Welche Daten müssen/sollen übernommen werden? Wo liegen die größten Probleme? Daten Qualität Daten Granularität Daten Konsistenz Welche DW – Anbieter sind für uns optimal? Welche Anforderungen aus der Fachabteilung sind überhaupt realisierbar?

[2.] Aufbau eines Data WareHouses Implementierung Drei Varianten stehen zur Verfügung DW DM DM Op. Data Th.P. Data Op. Data Th.P. Data Op. Data Th.P. Data Virtuelles DW Zentrales DW Data Mart

[2.] Aufbau eines Data WareHouses ALC – Management/Implementierung Nach der Auswahl der DW-Grobstruktur (Zentral, Virtuell oder DM), müssen folgende Fragen geklärt werden: Granularität der Daten Partitionierung Horizontal Vertikal Denormalisierung Externe Daten Generalisierung Spezialisierung Datenhaltung ETL‘s

[3.] Data Warehouse vs. Data Mart

[3.] Data Warehouse vs. Data Mart Eine von den operativen DV-Systemen isolierte Datenbank, die als unternehmensweite zentrale Datenbasis für alle Ausprägungen managementunterstützender Systeme dient Data Mart Datensammlung, die auf die Bedürfnisse einer bestimmten Abteilung oder eines eingegrenzten Themas ausgerichtet ist.

[3.] Data Warehouse / Data Mart Kriterien Data Mart Data Warehouse Anwendungsbezug Ja Nein, anwendungsneutral Adressat der Datenbereitstellung Abteilung Unternehmen Vorherrschende Datenbanktechnologie Multidimensional Relational Granularität der Daten Niedrig Hoch Datenmenge Menge historischer Daten Optimierungsziel Abfragegeschwindigkeit Anzahl pro Unternehmen Mehrere Eines bis sehr wenige Datenmodell In jedem Data Mart unterschiedlich Einheitliches Unternehemsmodell

[3.] Daten für operative / analytische Anwendungen (1) Kriterien Daten für operative Anwendungen Daten für analytische Anwendungen Zweck Unterstützung und Abwicklung operativer Geschäftsvorfälle Informationen für das Management; Unterstützung von Entscheidungen, themenorientiert Inhalt Detaillierte, aktuelle Geschäftsvorfalldaten, zeitpunktorientiert Verdichtete und bereinigte Daten, historische und z.T. zukünftige Daten, zeitraumorientiert Aktualität Hoch (online, realtime) Meist keine Tagesaktualität Modellierung Altdatenbstände oft nicht modelliert (funktionsorientiert) Sachgebiets- oder themenbezogen modelliert; standardisiert und endbenutzertauglich

[3.] Daten für operative / analytische Anwendungen (2) Kriterien Daten für operative Anwendungen Daten für analytische Anwendungen Zustand Redundant, inkonsistent, teilweise unnormalisiert Konsistent modelliert, kontrollierte Redundanzen Änderungen Laufend Automatische Fortschreibung, Beständigkeit des einmal übernommenen Datenbestandes Abfragen Strukturiert, vordefiniert Ad-hoc-Abfragen für komplexe, ständig wechselnde Fragestellungen; vordefinierte Standardauswertungen

[4.] Operative vs. Analytische Daten Operative Daten Strukturiert für die Verarbeitung in Transaktionssystemen Jeder Datensatz muss jederzeit für Lese- und Schreibzugriffe zur Verfügung stehen Details über Daten sind notwendig Analytische Daten Anderer Aufbau als „Operative Daten“ Analytische Daten wurden verändert/angepasst Daten werden komprimiert in Kennzahlen und zusammengefasst

[4.] Operative vs. Analytische Daten Die Daten können mit folgenden Fragen klassifiziert werden: Was? Wer? Wann? Wie?

[5.] Arbeitsschritte zur Datenbereitstellung „ETL-Prgramme“

[5.] Arbeitsschritte zur Datenbereitstellung „ETL-Prgramme“

[5.] Arbeitsschritte zur Datenbereitstellung „ETL-Prgramme“ Extraktion = Selektion von Daten aus operativen Datenquellen für das Data Warehouse Prüfung der Daten-Verfügbarkeit (Beachtung von Datenschutzrechten, Eigentumsrechten, Grad der Vertraulichkeit) Festlegung des Zeitpunktes zur Daten-Extraktion Periodische Extraktion Extraktion auf Anfrage Ereignisgesteuerte Extraktion Sofortige Extraktion Temporäre Speicherung im Arbeitsbereich des DW  „Staging Area“

[5.] Arbeitsschritte zur Datenbereitstellung „ETL-Prgramme“ Transformation = Eliminierung von Qualitätsmängeln und betriebswirtschaftliche Aufbereitung der operativen Daten für analytische Fragestellungen mittels folgender Verfahren: Bereinigung  Beseitigung von semantischen und syntaktischen Mängeln 1. bis 3. Klasse Harmonisierung betriebswirtschaftliche Vereinheitlichung unterschiedlicher Codierungen, Attribute und Schlüssel Verdichtung Summierung der Daten auf verschiedenen Stufen im DW Anreicherung Speicherung von vorberechneten Kennzahlen im DW

[5.] Arbeitsschritte zur Datenbereitstellung „ETL-Prgramme“ Laden = Übernahme der Daten aus operativen Vorsystemen in das Data Warehouse, unterschieden wird in: Initiales Füllen des DW mit Daten aus operativen Datenquellen und ggf. ergänzt durch Archivdaten Zyklische Aktualisierung der analytischen Datenbasis Aktualisierungsvarianten: Kompletter Abzug Nur Übernahme der Änderungen Auswahl protokollierter Datenbanktransaktionen