Manpower Associates is a $14

Slides:



Advertisements
Ähnliche Präsentationen
Algorithmen und Datenstrukturen
Advertisements

Sudoku Übersicht Spielregeln Strategien Knoch
Risiko-Management im Projekt
Datenbankdesign mit ACCESS.
Daten im Data-Warehouse
Daten- und Informationsqualität. © Prof. T. Kudraß, HTWK Leipzig Management der Informationsqualität Keine verbindlichen Standards oder Vorgaben für Informationsqualität.
Heute 1.F – Test zur Varianzhomogenität 2.Bartlett-Test zur Varianzhomogenität 3.Chi – Quadrat Tests für Häufigkeiten 4.Chi – Quadrat Tests zur Verteilungsanpassung.
1-1 Schlank und schnell zum Datawarehouse Marc Bastien Oracle Deutschland GmbH BTW Leipzig,
Mehrwert aus Daten gewinnen mit Datamining und Textmining
Analyse von Voice-over-IP-Software im Vergleich zu Hardwarelösungen und Integration in ein bestehendes, heterogenes VoIP-Netz Auswertung und Empfehlung.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Datenbankdesign und Normalisierung
EINI-I Einführung in die Informatik für Naturwissenschaftler und Ingenieure I Vorlesung 2 SWS WS 99/00 Gisbert Dittrich FBI Unido
Hypothesen testen: Grundidee
HERA und Changemanagement Scenario. HERA und Changemanagement2 Ausgangssituation Bob erstellt während der Anforderungserhebung mit HERA ein Use Case Projekt.
Datenbanken 2: Die relationale Datentabelle
Oracle Warehouse Builder 11g
Der Datenqualität auf der Spur Data Profiling mit Oracle Warehouse Builder – Analysen rund um die Cheers GmbH Alfred Schlaucher.
Probleme mit der Einwahl? Operator:
Manpower Associates is a $14
Die Bank von morgen - eine neue Welt für IT und Kunden? 23. Oktober 2001.
SAP R/3 Kapazitätsmanagement Erfahrungsbericht Jürgen Pfister M A P K I T.
Relationale Datenbankmodelle
Wie macht man ein Sudoku? Transformations-Methode:
Externe Bewertung in IB-Biologie
In die erste Zeile jeweils Überschriften für die Spalten eingeben, z.B.: Dann in die Spalten die Daten eingeben! In die Spalte Bemerkung werden Daten.
Zur Veranstaltung Business Intelligence
2007 Office - Bestellung Backup Medium -Schritt für Schritt Anleitung- Hinweis: Die Bildausschnitte wurden mit Windows Vista Ultimate (Aero Oberfläche)
Vorgehen Im nächsten Schritt markieren wir die Spalte „Anmeldedatum“ und gehen auf die Funktion „Text in Spalten“.
GIS - Seminar Wintersemester 2000/2001
IT-Projektmanagement SS 2013 Prof. Dr. Herrad Schmidt
Vorlesung #4 Überführung des ER-Modells in das relationale Modell
Allgemeines zu Datenbanken
HORIZONT 1 XINFO ® Das IT - Informationssystem PL/1 Scanner HORIZONT Software für Rechenzentren Garmischer Str. 8 D München Tel ++49(0)89 / 540.
HORIZONT 1 XINFO ® Das IT - Informationssystem Assembler HORIZONT Software für Rechenzentren Garmischer Str. 8 D München Tel ++49(0)89 /
HORIZONT 1 XINFO ® Das IT - Informationssystem Eclipse Plugin HORIZONT Software für Rechenzentren Garmischer Str. 8 D München Tel ++49(0)89 / 540.
Innovator Die Komponenten.
XML und Datenbanken © 2006 Markus Röder
verstehen planen bearbeiten
Normalisierungsprozess
Algorithmen und Datenstrukturen Übungsmodul 11
Allgemeine Funktionalitätsbeschreibung
Mehr Zeit für den Kunden und wirtschaftlicher Arbeiten mit BIB-Control
ADAT©2004 Dipl. - Ing. Walter SabinSeite: 19 Version 1.0a Programme - Zusatzsoftware Oracle: –Forms –Reports –Designer –Jdeveloper –APEX (Application Express)
SQL Server nach MySQL Datenbank-Migration SQLWays – Software für Migration Präsentation Copyright (c) Ispirer Systems Ltd. Alle.
Netzwerke.
Das Information Warehouse Die Stärken eines zentralen dispositiven Information-Warehouse als informative Kernkomponente in einer heterogenen operativen.
Mathematik 1 und 2 bei Dr. rer. nat. Otto Schafmeister
Stoppen der Eingabeaufforderung einer Abfrage j drücken Sie dann F5, oder klicken Sie auf Bildschirmpräsentation > Von Beginn an, um den Kurs zu starten.
Montag, 9. Juli 2001  ====!"§==Systems = Seite 1 Projekt SAPscript  Dana Stepanek SAPscript  Symbole MitSymbolen können Programm- bzw. Systemdaten oder.
PHP PHP ( „PHP Hypertext Preprocessor") ist eine Skriptsprache
Installation, Konfiguration, Online stellen, Zugriff © by Lars Koschinski 2003.
SS 2014 – IBB4B Datenmanagement Do 17:00 – 18:30 R Vorlesung #4 Überführung des ER-Modells in das relationale Modell.
Startende Thema WebQuest. themafragenprozessquellenpräsentationbeurteilung thema Motiviere hier die Kinder für das Thema.
Komponenten und Phasen des Data Warehousing
SS 2015 – IBB4C Datenmanagement Fr 17:00 – 18:30 R Vorlesung #4 Überführung des ER-Modells in das relationale Modell.
Prof. K. Gremminger Folie 1 Vorlesung Datenbanksysteme SS 2002 Marktanteile RDBS Deutschland ,9% 9,5% 4,4% 4,7% 23,8% 7,7% Quelle: Dataquest Oracle.
Datenmigrationstools: DTW – Kontenplan
Sortierverfahren Mit VB 2010 express edition JBS Tr, info Q1.
Programmiersprachen II Vorbesprechung Klausur Prof. Dr. Reiner Güttler Fachbereich GIS HTW.
Datenqualitätsanalysen mit Oracle Alfred Schlaucher, Data Warehouse Architect, Oracle.
1 Oracle Warehouse Technologie Single-Engine-Based-Data-Warehouse.
Key-Value Paare (KVP) - Metadaten für Kanäle speichern und nach MDF4 exportieren PM (V1.0)
Alfred Schlaucher, Data Warehouse Architect, Oracle Oracle Data Warehouse.
OWB Enterprise Edition Option Alfred Schlaucher Oracle Warehouse Builder Enterprise Edition.
Anforderungen an ein Datenbanksystem
DOAG SID Data Warehouse
Beispiel: Sie suchen den
Microsoft Excel S-Verweis Excel: SVerweis.
 Präsentation transkript:

Bring up on stage two customers to tell the audience about their experiences. Manpower Associates is a $14.9B global company with 27,000 employees in the temporary staffing business. Manpower runs a combined PeopleSoft Enterprise and JD Edwards EnterpriseOne shop. These experts in human resources use Enterprise HCM for their own staffing and EnterpriseOne Payroll and Service Billing for handling the large volumes of US-based temporary staff. Manpower is very happy with Oracle’s support since purchasing PeopleSoft and is looking forward to a long relationship with Oracle. Spokesperson will be Jay Schaudies, Vice President, Global eCommerce. Welch Foods is the food processing and marketing arm of National Grape Cooperative Association. Organized in 1945, National Grape is a grower-owned agricultural cooperative with 1,461 members. The company, headquartered in Concord, Massachusetts, operates six plants located in Michigan, New York, Pennsylvania and Washington. The company was running a mix of legacy, home grown, and manual systems that failed to provide senior management with accurate and timely cost and production information. Welch’s required a centralized manufacturing and financial information system to improve management decision making. The solution had to be hot-pluggable with existing technologies, for example, Welch’s Plumtree portal. Welch Foods chose Oracle over SAP for this business-critical application. The key to the customer’s business problem was their ability to manage costs. The company’s costs are driven by fruit solid content in each of their products, and they use a specialized technique called BRIX for measuring and calculating the cost of materials. Welch’s compared SAP and Oracle SAP’s software was too rigid and, therefore, unable to include the BRIX calculation in their manufacturing solution. Only Oracle’s OPM could bind this custom cost method into the Quality Management Process. Technology customer yet to be determined. Current possibilities include eBay and FTD Florists.

Der Datenqualität auf der Spur Data Profiling mit Oracle Warehouse Builder – live Beispiel Alfred Schlaucher

Analyseumgebung Oracle Datenquellen Alle Gateway- lesbare Quellen SAP-Daten Flat Files Adress-/LDAP- Verzeichnisse LDAP / DBMS_LDAP / Table Function Gateway / ODBC / FTP non Oracle Oracle 9i / 10g DB2, SQL Server Informix, Teradata SAP Source Schema Profiling Stage SAP Integrator Oracle Source Schema External Table Transportable Module RAC

Vorgehensweise „Daten-Analyse“ Identifizieren Geschäftsfeld / Teilprozess Datengewinnung: Extrakt / Transformation (ETL-Aufgabe) Kundenstammdaten -> Testkunde Erstes Profiling -> 1. Sichtprüfung Fragen / Thesen formulieren Zweites Profiling -> verifizieren Custom Rules Korrigieren nachgelagert im operativen Prozess Monitoring

Herleiten der entsprechenden Prüfdaten mit ETL-Mitteln MP_Testkunde

Intuitives Erkennen von Anomalien Domain Anz_Kinder? Domain 0,1,2,3, Null Warum 0 und Null? Gibt es keine Kunden mit mehr als 3 Kindern? Warum gibt es nur 0,3% Kunden mit 0 Kindern (entspricht nicht der Erwartung)? warum gibt es eine gleichmäßige Verteilung der Werte 1,2,3 im Bereich von 32-33 %? Null kommt offenbar nur bei Firmenkunden vor Die Zahl 17 kann markant sein. Bei weiterer Prüfung stellt man fest, dass es genau 17 Firmenkunden gib Es fehlt eine einheitliche Art der Beschreibung für das Nicht-Vorhandensein (0,Null)

Intuitives Erkennen von Anomalien Domain Anrede? Herr / Frau sind offensichtlich richtige Werte Die rot-markierten Werte sind offensichtlich falsch Die beiden Werte „3“ und „Anrede“ haben im Vergleich zu den anderen falschen Werten ein signifikant hohes Vorkommen Warum? Welche Regel kann für das Feld gefunden werden? Wenn Status = ‚F‘ dann Anrede = ‚Firma‘ Wenn Status = ‚P‘ dann Anrede = ‚Herr‘ oder ‚Frau‘

Gezieltes Überprüfen von Geschäftsregeln (Custom Rule) Wenn Status = ‚F‘ dann Anrede = ‚Firma‘ und Wenn Status = ‚P‘ dann Anrede = ‚Herr‘ oder ‚Frau‘ Domain Anrede? Nur ~19% folgen der Regel. Warum? Die Domain-Analyse von des Status-Feldes ergibt den Wertebereich F (Firmenkunde) P (Privatkunde) G (guter Kunde) K (kein Kunde) Die Überprüfung der Regel hat zu einer weiteren Schwachstelle geführt. Das Attribut Status ist überladen, ( es wird für unterschiedliche Sinnzusammenhänge benutzt) es müsste eine weitere Spalte geben, z,. B. Qualität der Kundenbez.

Domains, Varianten, Ausreißer Data Profiling: Verwendung einheitlicher Codes Erkennen von abhängigen Domains – Functional Dependency Berufsgruppe Berufsgruppen_Nr Beispiel für das Finden von zusammengehörenden oder mit einander korrespondierenden Informationen. Das sind funktional von einander abhängige Informationen (Eine sehr häufige Fehlerursache). Eine solche Analyse kann aber auch Hinweise unnötige Redundanzen in den Daten liefern. In vielen Datenbeständen sind Informationen doppelt vorhanden. Eine Lösungsmöglichkeit ist das Implementieren von Ableitungsfunktionen oder das Aufbauen von Referenzdatenbeständen. In diesem Beispiel braucht man nur die BERUFSGRUPPEN_NR. Welche Berufsgruppe sich dahinter verbirgt, kann in Referenzdatenbeständen nachgelesen werden.

Domains, Varianten, Ausreißer Data Profiling: mit dem Ziel der Standardisierung Dr und Dr. Prof und Prof. Hinweis für Standardisierungs- Maßnahme Eine Domain mit fehlerhaften Inhalten Ein Hilfsmittel für einen sauberen und sicheren Umgang mit Informationen ist die Standardisierung. Einheitliche Daten verhindern Missverständnisse und machen Informationen vergleichbar. Die Domain-Analyse findet Varianten von derselben Information und visualisiert sie.

Domains, Varianten, Ausreißer Data Profiling: mit dem Ziel der Standardisierung Erkennen von Varianten Straßenbezeichnungen müssen standardisiert werden, um sie z. B, für eine Haushaltsbildung oder Adressdatenabgleich vergleichen zu können. Aufgabenstellung Haushaltsbildung / Adressdatenbereinigung. Nicht alle Strassen-Begriffe sind falsch geschrieben... aber viele. Für Dinge wie: Haupt Strasse Haupt Straße Haupt Strase Hauptstrasse Hauptstraße Hauptstr. Haupt Str. Hauptststrasse gibt es sicher einheitliche Schreibweisen. Dieses Beispiel ist allerdings nicht so einfach zu lösen, wie es auf den ersten Blick scheint. Hier müsste zunächst der Begriff in zwei Bestandteile aufgespalten werden: einen Hauptbegriff einen Begriff, der sich „irgendwie“ wie Straße anhört Dann können Regeln definiert und Referenzdatenbestände herangezogen werden. An diesem Punkt sind wir aber bereits mitten in dem Thema Adressdatenbereinigung. Hier arbeiten wir mit Partnern zusammen. (Weitere Infos bei A. Schlaucher 040 / 89091-132 GS Hamburg)

Unterstützung von Software-Projekten Durch den Feldnamen vermutet man rein numerische Inhalte Übereinstimmung von Feldname „...nr“ und Feldtyp Firmenrabatt ist in der Regel ein Rechenfeld Kundennr ist ein wichtiges Feld. Es sollte stimmig sein. ? sieht gut aus !

Unterstützung von Software-Projekten Die Zahl 17 kommt häufig vor, hier muss es eine „systematische“ Ursache geben ? Felder sind nicht gepflegt kritisch! da es sich um einen Schlüssel- kandidaten handelt kritisch! weil doppelte Kundennummern ? OK

Was wird geprüft

Bring up on stage two customers to tell the audience about their experiences. Manpower Associates is a $14.9B global company with 27,000 employees in the temporary staffing business. Manpower runs a combined PeopleSoft Enterprise and JD Edwards EnterpriseOne shop. These experts in human resources use Enterprise HCM for their own staffing and EnterpriseOne Payroll and Service Billing for handling the large volumes of US-based temporary staff. Manpower is very happy with Oracle’s support since purchasing PeopleSoft and is looking forward to a long relationship with Oracle. Spokesperson will be Jay Schaudies, Vice President, Global eCommerce. Welch Foods is the food processing and marketing arm of National Grape Cooperative Association. Organized in 1945, National Grape is a grower-owned agricultural cooperative with 1,461 members. The company, headquartered in Concord, Massachusetts, operates six plants located in Michigan, New York, Pennsylvania and Washington. The company was running a mix of legacy, home grown, and manual systems that failed to provide senior management with accurate and timely cost and production information. Welch’s required a centralized manufacturing and financial information system to improve management decision making. The solution had to be hot-pluggable with existing technologies, for example, Welch’s Plumtree portal. Welch Foods chose Oracle over SAP for this business-critical application. The key to the customer’s business problem was their ability to manage costs. The company’s costs are driven by fruit solid content in each of their products, and they use a specialized technique called BRIX for measuring and calculating the cost of materials. Welch’s compared SAP and Oracle SAP’s software was too rigid and, therefore, unable to include the BRIX calculation in their manufacturing solution. Only Oracle’s OPM could bind this custom cost method into the Quality Management Process. Technology customer yet to be determined. Current possibilities include eBay and FTD Florists.

Metadaten metadaten http://aschlauc-pc.de.oracle.com:7780/pls/htmldb owb