/Folie 1Holger Frietsch Historisierung von Zuordnungsänderungen für Dimensionen in relationalen ORACLE8-Data Warehouse- Datenbanken Holger Frietsch PROMATIS AG
/Folie 2Holger Frietsch Agenda Worum geht es? Was ist das Problem? Lösung: Slowly Changing Dimensions Auswertungen Zusammenfassung
/Folie 3Holger Frietsch Worum geht es? Hierarchien für Drill-Analysen A B 815 Abteilung Kostenstelle Mitarbeiter
/Folie 4Holger Frietsch Worum geht es? Beispiele für Hierarchien Kostenstellen / Organigramm Vertriebsregionen Kundengruppen Produktgruppen Geografische Hierarchie Hierarchien strukturieren den (Stamm-) Datenbestand Hierarchien sind zentraler Bestandteil eines Data Warehouse
/Folie 5Holger Frietsch Star Schema Modell Zeitbasis Zeit_id Bezeichnung Quartal Jahr Prod_id Produkte Bezeichnung Handelsmarke Größe Zeit_id Prod_id Markt_id Anzahl Preis Rabatt MA_id Name Gruppe Abteilung Mitarbeiter Verkäufe
/Folie 6Holger Frietsch Worum geht es? Speicherung in Dimensionstabelle
/Folie 7Holger Frietsch Was ist das Problem ? A B 815 Zuordnungs- änderung X
/Folie 8Holger Frietsch Was ist das Problem ? Auf Datensatzebene Quelle (4711, Meier, B, 815, ) Schnittstelle: (MA-Nr., Name, Kostenstelle, Abtlg., Änd.datum)
/Folie 9Holger Frietsch Slowly Changing Dimensions (nach Ralph Kimball) Typ 1: Überschreiben Typ 2: Historisierung durch Versionierung Künstliche Schlüssel, evtl. Versionsnummern Keine Einschränkung auf Zeit notwendig automatische Partitionierung der Vergangenheit Typ 3: Historisierung durch neues Attribut nur Original und aktueller Wert Partitionierung nur via Zeiteinschränkung
/Folie 10Holger Frietsch Problem: Historische Zuordnung für Auswertungen Aktuelle Zuordnung für Vergleichbarkeit Typkritik: Typ 1: nur aktuell Typ 2: nur historisiert Typ 3: nur zwei Zustände Slowly Changing Dimensions
/Folie 11Holger Frietsch Lösung: SCD Typ Künstlicher Primärschlüssel Auszeichnen des Attributs für Produktionsschlüssel Festlegen der zu historisierenden Attribute Versionierung bei Zuordnungsänderung Gültigkeitszeitraum jeweils Zusatzattribut „Aktuelle Zuordnung“
/Folie 12Holger Frietsch Tabellenstruktur
/Folie 13Holger Frietsch Vorgehen Schnittstelle S: S = { s / s = (MA_NUMMER, NAME, GRUPPE, ABTLG, AENDDATUM) } Dimension D: D = { d / d = (MA_ID, MA_NUMMER, NAME, GRUPPE, GRUPPE_AKT, ABTEILUNG, GUELTIG_SEIT, GUELTIG_BIS) }
/Folie 14Holger Frietsch
/Folie 15Holger Frietsch
/Folie 16Holger Frietsch
/Folie 17Holger Frietsch Auswertungen Zwei Auswertepfade: aktuelle Zuordnung historische Zuordnung Erhöhte Komplexität auf Metaebene Erhöhte Anzahl von Auswertungen Eindeutige Auswertungen
/Folie 18Holger Frietsch Zusammenfassung Anforderungen der Anwender nicht immer eindeutig Sowohl historische als auch aktuelle Zuordnung notwendig Auswerteperformance wichtig Programmierung standardisierbar
/Folie 19Holger Frietsch Vielen Dank Holger Frietsch Leiter Competence Center Business Intelligence PROMATIS AG, Karlsbad Mail: PROMATIS AG: