1 Oracle Warehouse Technologie Single-Engine-Based-Data-Warehouse.

Slides:



Advertisements
Ähnliche Präsentationen
Datenbankdesign mit ACCESS.
Advertisements

Daten im Data-Warehouse
Prof. Dr. Dr. h.c. mult. August-Wilhelm Scheer
Daten- und Informationsqualität. © Prof. T. Kudraß, HTWK Leipzig Management der Informationsqualität Keine verbindlichen Standards oder Vorgaben für Informationsqualität.
spezielle Nutzersichten formale Ebene (deskriptive Regeln)
EControl –Identity Lifecycle Management kann so einfach sein Management Erstellung Nutzer-Selbstverwaltung Audit Wolfgang Berger Omni Technology Solutions.
Einsatz von SiSy in der Berufsausbildung
Institut für Informatik Abteilung Datenbanken Problemseminar Datacleaning Überblick Datacleaning.
1-1 Schlank und schnell zum Datawarehouse Marc Bastien Oracle Deutschland GmbH BTW Leipzig,
Inhaltlich orientierter Zugriff auf unstrukturierte Daten
8 Behandlung von Begriffen 8.1 Grundlagen aus Logik und Psychologie
Objektrelationales Mapping mit JPA Testing Jonas Bandi Simon Martinelli.
Mehrwert aus Daten gewinnen mit Datamining und Textmining
Analyse von Voice-over-IP-Software im Vergleich zu Hardwarelösungen und Integration in ein bestehendes, heterogenes VoIP-Netz Auswertung und Empfehlung.
Enterprise Resource Planning
Business to Business Integration anhand von ERP-Systemen
Universität Stuttgart Institut für Kernenergetik und Energiesysteme Aufgaben des Testens Vergleich des Verhaltens einer Software mit den an sie gestellten.
AGXIS – Ein Konzept für eine generische Schnittstellenbeschreibung Dr.-Ing. Ulrich Hussels, RISA GmbH 07. Juni 2005 Workshop Umweltdatenbanken 2005.
Datenbankdesign und Normalisierung
Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme
IS: Datenbanken, © Till Hänisch 2000 CREATE TABLE Syntax: CREATE TABLE name ( coldef [, coldef] [, tableconstraints] ) coldef := name type [länge], [[NOT]NULL],
PinK Plattform für intelligente Kollaborationsportale Dr. Joachim Quantz, e.V. Berlin, 13. September 2005.
Komplexe Systemlandschaft
Access 2000 Datenbanken.
Datenintegrität Referentielle Integrität create table
Oracle Warehouse Builder 11g
Der Datenqualität auf der Spur Data Profiling mit Oracle Warehouse Builder – Analysen rund um die Cheers GmbH Alfred Schlaucher.
Probleme mit der Einwahl? Operator:
Manpower Associates is a $14
Phase 1 Phase 2 Prozessmanagement
Betrügern auf der Spur WIN-Treffen 2010 Falko Meyer 04 BW.
Architektur und Funktionalitäten der Oracle XML DB - ein Überblick mit ausgewählten praktischen Beispielen - im Rahmen des 17. Workshop Grundlagen von.
Spezifikation von Anforderungen
Das Wasserfallmodell - Überblick
ProExcellence - Module
Synergieeffekte durch softwaregestützte Prozessmodelle
Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Anforderungen von eScience und Grid-Technologie.
Geschäftsprozessmanagement in KMU
© DVS System Software GmbH & Co. KG
Sistema GeoDAT, S.L. GeoBIS, GeoEIS, GIS-Komponente … 2005.
Case Study | Approval Plan Profiler Case Study Approval Plan Profiler Echtzeitverarbeitung bibliographischer Informationen iucon GmbH | NEWBOOKS.
Datenbank.
Allgemeines zu Datenbanken
Eidgenössisches Departement des Innern EDI Bundesamt für Statistik BFS Eidgenössisches Finanzdepartement EFD Bundesamt für Informatik und Telekommunikation.
Six Sigma Nina Welsch Oktober 2013 ©2007 IndiTango AG | |
Data Warehouse: ETL-Praktikum
00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Multidimensionale Datenstrukturen - semantische und logische Modellierung Teilvortrag: logische Modellierung.
prof. dr. dieter steinmannfachhochschule trier © prof. dr. dieter steinmann Folie 1 Klausurschwerpunkte Hilfe.
XML und Datenbanken © 2006 Markus Röder
Normalisierungsprozess
Mehr Zeit für den Kunden und wirtschaftlicher Arbeiten mit BIB-Control
Das Unternehmen.
Integritätsbedingungen (Constraints)
Nachtrag Abgrenzung OLAP / OLTP
Oracle Portal think fast. think simple. think smart. Dieter Lorenz, Christian Witt.
SS 2015 – IBB4C Datenmanagement Fr 17:00 – 18:30 R Vorlesung #1 Datenmanagement.
Komponenten und Phasen des Data Warehousing
made by Aberer, Spiegel & Tschegg
Datenbanken Produkte Dienstleistungen Referenzen.
Datenbanken Produkte Dienstleistungen Referenzen.
Bachelorkolloquium – Thema:
Oracle Exadata und HP Oracle Database Machine © 2008 Oracle Corporation – Proprietary and Confidential Alfred Schlaucher (Oracle Data Warehouse) EXTREME.
Datenqualitätsanalysen mit Oracle Alfred Schlaucher, Data Warehouse Architect, Oracle.
© CSP GmbH & Co. KG 2005 Einleitung HerausforderungenLösung Architektur Demonstration Langzeitarchivierung für Oracle Datenbanken Stefan Brandl, Dipl.-Inf.,
Alfred Schlaucher, Data Warehouse Architect, Oracle Oracle Data Warehouse.
OWB Enterprise Edition Option Alfred Schlaucher Oracle Warehouse Builder Enterprise Edition.
SQL Basics Schulung –
Bewerbungsgespräch Herr Niemeyer
Datenbanken Von Amed und Alicia.
 Präsentation transkript:

1 Oracle Warehouse Technologie Single-Engine-Based-Data-Warehouse

2 Data Profiling mit Oracle Warehouse Builder Datenqualität bei der Integration von Unternehmensdaten Erste praktische Erfahrungen anhand von Praxisanforderungen

3 Alfred Schlaucher Leitender Berater Business Integration & Data Warehouse ORACLE Deutschland GmbH Tel.: 040 /

4  Schlechte Daten „Ein Klagelied“ (oder sollten wir sie verschweigen?)  Beispielhafter Ablauf einer Data Profiling Analyse - ein Beispiel  Erfahrungen / Abgrenzungen Datenqualität gewinnen mit Oracle Warehouse Builder - Data Profiling

5 Es entstehen täglich mehr schlechte Daten, als wir denken  Eingabefehler in Masken vertippt  Dateneingabeprozesse lückenhaft Daten nicht zur Hand wenn sie zum Eingeben gebraucht werden  Keine Daten möglich sinnlose Eingabekombination  Mutwillige Fehler „die müssen nicht alles wissen“  Systembedingte Fehler Unvollständige Transaktion Datenübertragung abgebrochen Transaktion Datenbank Replikat

6 Versteckte Kosten durch schlechte Datenqualität  Manuelles Nacharbeiten von Daten  Beschwerden -> Aufwand in Call Center  Erhöhte Projektkosten bei Einführung neuer Systeme Bis 25% gestoppt, bis zu 60% Verzug aufgrund falscher oder fehlender Daten  Verspätete Unternehmensberichte  Verlorene Kunden durch schlechten Support  Produktionsausfälle durch Störung in der Supply Chain

7 SCMERP CRM Bereitstellung Data Warehouse BI Tool A BI Tool B BI Tool C Data Marts Unter- schiedliche Daten und Fehlerquellen Datenqualität bezogen auf den Warehousing – Prozess Konsolidierter Datenbereich Konsoli- dierung Heterogene Datenmodelle / Konsistenz / Homonyme / Synonyme Kontinuität des Ladevorgangs / Vollständigkeit Widerspruchsfreiheit zwischen den Quellen Matadaten Eindeutige Datenobjekte Beschreibungen Homonyme / Synonyme Anwendungsneutral

8 Qualitäts- kontrolle Qualitäts- sicherung Total Quality Control Total Quality Management Qualitätsplanung „Proaktives Qualitätsmanagement“ Qualitätslenkung Qualitätssicherung Kontinuierliche Qualitätsverbesserung  Designqualität  Ausführungsqualität Strategieen Erwartungen Planung Umsetzung Einhaltung der Vorgaben Hilfsmittel Strukturelle Unterstützung Weiterentwicklung der Qualitätsstandards Entwicklungsprojekte ?

9 OWB: Integriertes Vorgehen in der Datenbeschaffung Data Profiling Data Profiling Data Quality Data Quality Rules ETL Rules Oracle Warehouse Builder

10

11 Was wird geprüft

12  Schlechte Daten „Ein Klagelied“ (oder sollten wir sie verschweigen?)  Beispielhafter Ablauf einer Data Profiling Analyse - ein Beispiel  Erfahrungen / Abgrenzungen Datenqualität gewinnen mit Oracle Warehouse Builder - Data Profiling

13 Das Beispiel

14 Wo anfangen? - eignen sich die Daten für das Data Profiling? - Was ist über die Daten bekannt Environment - Datenmengen - Rechner - erste Überraschungen Zurechtschneiden der Daten - Daten aufbrechen - Teilmengen - Sampling - Mehrfach - Profiling - Einsatz von ETL Analysieren der Daten - „Augenfällige“ Erkenntnisse -> der erste Schuss - „Dinge, die sofort auffallen“ -> Domains / Pattern / PK - Visuelles Analysieren - Graphikeinsatz - Beziehungen analysieren Ableiten von Regeln und Korrekturen - Automatisches Erkennen - Benutzerdefinierte Regeln - Generieren von Korrekturmappings Dokumentieren der Ergebnisse - Ergebnisblatt - Definition Metadaten - Orga - Handbuch Regeln, die nicht abgedeckt werden und deren Lösung - komplexe Lookup – Beziehungen - Rekursive Strukturen - Tupel – übergreifende Abhängigkeiten Ablauf Data Profiling Analyse ETL - Prozess - Mappings - Routinen - Workflow - Metadatenrepository Korrekte Daten X7

15 Wo anfangen  Eignen sich alle Problemstellungen? Beispiel Wahlweise vertauschte Spalten  Sind die Datenstrukturen bekannt? Datenmodelle IT - Abteilung  Sind die erwarteten Regeln bekannt? Fachanwenderwissen Geschäftsprozesse  Erfahrung: Nicht alle Daten und Problemstellungen sind „Data Profiling – tauglich“

16 Environment  Möglichst innerhalb einer Datenbank (kein DBLINK)  Quellsystemtabellen sollten mit PARALLEL gekennzeichnet sein (Grad nicht festlegen)  Bei operativen Systemen, die nicht modifiziert werden können -> zu Analysezwecken „Transportable Modules anwenden“  SGA > 500MB, wenn möglich 2-3 GB  buffer cache hit ratio im Bereich von %  Erfahrung: Laptop reicht nicht Source Schema Profiling Stage Oracle Source Schema Transportable Module External Table SAP Integrator non Oracle Gateway / ODBC / FTP Oracle 9i / 10g RAC DB2 SQL Server Informix Teradata

17 Profiling Performance 10 Spalten 10 Zeilen 20 Zeilen 5 Spalten 5 x 20 = x 10 = 100

18 Column Level Object Level

19 An dieser Stelle erfolgt ein Kundenbeispiel als Demo

20 Ergebnisblatt (Beispiele)

21 Varianten von Prüfungen Attribut – bezogen  Not Null / Pflichtfelder  Formatangaben  Check Constraint  Wertbereiche Ober-/Untergrenzen / Wertelisten Satz – bezogen (Tupel)  Abhängigkeiten von Werten in anderen Attributen desselben Satzes Satzübergreifend (Relationen)  Primary Key / Eindeutigkeit  Aggregat – Bedingungen Ober- Untergrenzen von Summen Anzahl Sätze pro Intervall usw.  Rekursive Zusammenhänge Verweise auf andere Sätze derselben Tabelle (Relation) Tabellenübergreifende (Interrelational)  Foreign Key  Aggregat – Bedingungen Ober- Untergrenzen von Summen Anzahl Sätze pro Intervall usw.  Rekursive Zusammenhänge Verweise auf Sätze einer anderen Tabelle (Relation) Zeit – bezogen (Tupel)  Zeitinvariante Inhalte Anz. Bundesländer  Zeitabhängige Veränderungen  Über die Zeit mit anderen Daten korrelierende Feldinhalte Verteilungs – bezogen  Arithmetische Mittel  Varianz / Standardabweichungen  Qualitätsmerkmale und Mengen

22  Schlechte Daten „Ein Klagelied“ (oder sollten wir sie verschweigen?)  Beispielhafter Ablauf einer Data Profiling Analyse - ein Beispiel  Erfahrungen / Abgrenzungen Datenqualität gewinnen mit Oracle Warehouse Builder - Data Profiling

23 Erfahrungen während der Arbeit  Data Profiling zergliedert sich mehrere Steps  Ähnlich wie bei Data Mining Verfahren ergeben sich erst im Verlauf des Projektes neue Aspekte und Fragestellungen, die den weiteren Verlauf bestimmen können Zurechtschneiden der Daten Entwurf einer Analysestrategie  Die Masse der Prüfungsergebnisse könnte auch durch direkte SQL – Abfragen ermittelt werden aber man kommt nicht drauf Gleichzeitiges Betrachten / Erkennen von mehreren Spalten automatisches, batchgetriebenes, gleichzeitiges Suchen von Aspekten Ansonsten müssten Prüfungen einzeln, Attribut – weise erfolgen viele manuelle SQL – Statements auf vermutete Fehler

24 Erfahrungen während der Arbeit  Systemfehler erkennen durch gleichzeitiges Betrachten von Fehlern Vergleichen von Anzahl  Visuelle Darstellungen geben die Möglichkeit des intuitiven Erfassens von potentiellen Problemen und Zusammenhängen  Die Ergebnisse sind automatisch dokumentiert und unterstützen damit das Qualitätsmanagement.  Die Einbettung in das ETL – Tool macht sich positiv bemerkbar Zurechtschneiden der Daten Umsetzen der gefundenen Ergebnisse in Korrekturläufe

25 Erfahrungen während der Arbeit  Hardware – Umgebung muss stimmen  Die Analyse – Umgebung und die Datenbereitstellung muss geplant werden  Komplexere Abhängigkeiten z. B. zeilenübergreifende Zusammenhänge bedürfen zusätzlicher Prüflogik.

26 Datenqualität mit Oracle Warehouse Builder Weitere Informationen: Tel.: 040 /

27