Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe 2005 Anfragen an multidimensonale.

Ähnliche Präsentationen


Präsentation zum Thema: "L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe 2005 Anfragen an multidimensonale."—  Präsentation transkript:

1 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe 2005 Anfragen an multidimensonale Daten Alexander Heidrich - BID

2 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten2 Inhaltsübersicht Motivation OLAP-Operationen Umsetzung in Standards –SQL –MDX Anfragetypen und -verarbeitung Fragen? / Diskussion!

3 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten3 Motivation Daten sind im Data Warehouse  Wie kommt man nun an seine Informationen? Theoretische Grundlagen Welche Erweiterungen der vorhandenen (Datenbank-)mittel gibt es? Wie werden sie benutzt?

4 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten4 Inhaltsübersicht Motivation OLAP-Operationen Umsetzung in Standards –SQL –MDX Anfragetypen und -verarbeitung Fragen? / Diskussion!

5 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten5 OLAP-Operationen Online Analytic Processing Werkzeuge und Technologien, mit denen ein zugrundeliegendes DW benutzerfreundlich analysiert und abgefragt werden kann eingesetzt zur Unterstützung von Managemententscheidungen (decision support)

6 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten6 OLAP-Operationen: Ausgangssituation

7 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten7 OLAP-Operationen Roll-Up – Wechsel auf eine übergeordnete Betrachtungsebene Drill-Down – Wechsel auf eine untergeordnete Betrachtungsbene

8 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten8 OLAP-Operationen Drill-Across – Wechseln des betrachteten Fakts unter Beibehaltung der Betrachtungsebene

9 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten9 OLAP-Operationen Slice – Zugriff auf Daten einer extrahierten Schicht

10 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten10 OLAP-Operationen Dice – Zugriff auf Teilwürfel

11 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten11 OLAP-Operationen Pivotierung – Drehen des Würfels durch Vertauschen der Dimensionen

12 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten12 Inhaltsübersicht Motivation OLAP-Operationen Umsetzung in Standards –SQL –MDX Anfragetypen und -verarbeitung Fragen? / Diskussion!

13 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten13 Umsetzung in Standards - SQL SQL-OLAP-Erweiterungen (seit SQL:1999) –(erweiterte) Gruppierungsfunktionalität GROUP BY GROUPINGSETS GROUPING() ROLLUP CUBE –SQL-OLAP-Funktionen Aggregate, Partitioning, Windows, Ranking IBM und Oracle an Standardisierung beteiligt  integriert in DB2 und Oracle (DBMS)

14 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten14 SQL: Beispieldaten

15 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten15 SQL: Aggregate Aggregatfunktionen COUNT(), SUM(), MIN(), MAX(), AVG() Funktionen liefern in dieser Anwendung nur einen einzelnen Wert Verwendung von GROUP BY

16 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten16 SQL: GROUP BY – Beispiel

17 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten17 SQL: GROUPING SETS GROUP BY immer noch umständlich bei der Erzeugung von verschiedenen Gruppierungen (z.B. (Jahr, Land), (Jahr), (Jahr, Land, Verkäufe), etc.) Lösung: GROUPING SETS  Gruppierungskombinationen

18 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten18 SQL: GROUPING SETS – Beispiel

19 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten19 SQL: ROLLUP-Operator Erweiterung der GROUP-BY-Syntax um ROLLUP-Operator erzeugt hierarchisch multidimensionale Gruppierung GROUPING()-Funktion zur Indentifizierung von NULL- Werten

20 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten20 SQL: CUBE-Operator Vorschlag von Microsoft und IBM Erweiterung der GROUP-BY-Syntax um den CUBE- Operator N-Dimensionale Generalisierung der einfachen Aggregatfunktionen

21 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten21 CUBE entsprechend GROUPING SETS( (),(Jahr),(Land),(Kategorie), (Jahr,Land),(Jahr, Kategorie),(Land,Kategorie), (Jahr,Land, Kategorie))

22 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten22 SQL: Cube

23 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten23 SQL: OLAP-Funktionen mit SQL:1999 eingeführt umfassen: –Aggregate –Partionierung –Window (Bildung dynamischer Fenster) –Ranking Kernkonstrukt: Over-Klausel

24 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten24 SQL: Over-Klausel

25 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten25 SQL: Over() – Beispiel Over()  Aggregation über alle Tupel Aggregatbildung, keine weitere Verdichtung

26 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten26 SQL: Over() mit Partionierung - Beispiel Partitionierung ähnlich Gruppierung PARTITON BY

27 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten27 SQL: Over() Bildung dynamischer Fenster OVER(ORDER BY [ ])

28 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten28 SQL: Over() Bildung dynamischer Fenster - Beispiel

29 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten29 SQL: Ranking Bestimmung der Postion eines Tupels in der Ergebnismenge Duplikate erhalten den gleichen Rang RANK() (mit Lücken) DENSE_RANK() (ohne Lücken)

30 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten30 SQL: Ranking - Beispiel

31 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten31 SQL: Umsetzung in DB2 und Oracle Behauptung: DB2 und Oracle hinsichtlich den in SQL:1999 definierten OLAP-Erweiterungen/-funktionen gleich SQL:2003 bringt weitere analytische Funktionen  bislang nur von/in Oracle implementiert

32 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten32 MDX MDX = MultiDimensional eXpressions orientiert sich stark an SQL-Syntax und MDDM Entwicklung/Vorschlag von Microsoft

33 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten33 MDX Dimensions (Select) –max. 64 –on COLUMNS, ROWS, … Cube (From) Slicer (Where) –Auswahl der darzustellenden Werte

34 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten34 MDX: Elemente Measures  Fakten –als Dimension modelliert Dimensions  Dimensionen –Level: Klassifikationsstufe (Jahr) –Member: Klassifikationsknoten (2003) Syntax –{} Sets –[] Einschluß von Strings

35 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten35 MDX: Navigationsfunktionen Navigationsfunktionen –Members: Knoten einer Klassifikationsstufe –Children: Kinderknoten eines Klassifikationsknotens –Parent: Elternknoten eines Klassifikationsknotens SELECT {[Kategorie].MEMBERS}  Autos, Computer SELECT {[ATHLONXP].PARENT}  CPU SELECT {[CPU].CHILDREN}  ATHLON64, ATHLONXP, PENTIUM4

36 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten36 MDX: Beispiele Drill-Down Roll-Up Crossjoin

37 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten37 MDX: Beispiel CROSSJOIN Drill-Down Roll-Up

38 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten38 MDX: weitere Funktionen TOPCOUNT  Ergebnisbereich einer Dimension einschränken FILTER  Einschränkung über beliebige Bedingungen + viele weitere Funktionen  sehr mächtige Sprache mit hoher Komplexität

39 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten39 Inhaltsübersicht Motivation OLAP-Operationen Umsetzung in Standards –SQL –MDX Anfragetypen und -verarbeitung Fragen? / Diskussion!

40 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten40 Anfragetypen

41 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten41 Methoden der Abfrageverarbeitung – Star Join Star Schema als Grundlage –sehr große Faktentabelle –kleine, voneinander unabhängige Dimensionstabellen Verbund zwischen n Dimensionstabellen und der Faktentabelle, Restriktionen über Dimensionstabellen typisches Muster für DW- Anfragen

42 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten42 Star Join: Aufbau SELECT- Klausel –Kenngrößen –Granularitäten FROM- Klausel –Fakten- und Dimensionstabellen WHERE- Klausel –Verbundbedingungen –Restriktionen

43 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten43 Star Join: Beispiel SELECT Geographie.Region, Zeit.Monat, SUM(Verkaeufe) FROM Verkauf, Zeit, Produkte, Geographie WHERE Verkauf.Produkt_ID = Produkt.ProduktID AND Verkauf.Zeit_ID = Zeit.ZeitID AND Verkauf.Geographie_ID = Geographie.GeographieID AND Produkt.Produktkategorie = 'Waschgeräte' AND Geographie.Land = 'Deutschland' AND Zeit.Jahr = 2000

44 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten44 Star Join: Beispiel

45 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe Anfragen an multidimensionale Daten45 Inhaltsübersicht Motivation OLAP-Operationen Umsetzung in Standards –SQL –MDX Anfragetypen und -verarbeitung Fragen? / Diskussion!

46 L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe 2005 Fragen? Diskussion!


Herunterladen ppt "L e h r s t u h l f ü r D a t e n b a n k e n u n d I n f o r m a t i o n s s y s t e m e Blockseminar „Data Warehousing“ im SoSe 2005 Anfragen an multidimensonale."

Ähnliche Präsentationen


Google-Anzeigen