00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Multidimensionale Datenstrukturen - semantische und logische Modellierung Teilvortrag: logische Modellierung.

Slides:



Advertisements
Ähnliche Präsentationen
Daten im Data-Warehouse
Advertisements

Data Cubes PG Wissensmangement Seminarphase Hanna Köpcke Lehrstuhl für Künstliche Intelligenz Universität Dortmund.
Datenbanken Einführung.
spezielle Nutzersichten formale Ebene (deskriptive Regeln)
Datenmodellierung Externe Phase Informationsstruktur
Kombinatorische Topologie in der 3d Geomodellierung
Kapitel 3: Das Relationenmodell
FH-Hof Effizienz - Grundlagen Richard Göbel. FH-Hof Inhalt Einführung Aufwand für Anfragen ohne Indexierung Indexstrukturen für Anfragen an eine Tabelle.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/9 Data Mining Ist die Wissensgewinnung aus Datensammlungen (Knowledge Discovery in Database).
AGXIS – Ein Konzept für eine generische Schnittstellenbeschreibung Dr.-Ing. Ulrich Hussels, RISA GmbH 07. Juni 2005 Workshop Umweltdatenbanken 2005.
Datenbankentwurf mit Hilfe des ER-Modells entwickeln
Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme
OLAP. © T. Kudraß, HTWK Leipzig Warum? Daten einer Firma verfügbar machen für Entscheidungsprozesse – Umsetzung schwierig neue Konzepte notwendig zur.
Access 2000 Datenbanken.
Datenbanken Einführung Merkmale dateiorientierte Datenverwaltung
Was ist eine Datenbank? ermöglicht die Eingabe von Daten
Datenmodellierung - Aufbau einer Datenbank -
Datenbankentwurfsprozess
Aufgabe Aufgabe: Einflussfaktoren: ?
Daten sammeln aus Verschiedenen Datenbanken Dokumenten Dateien
FH-Hof Analyse des R-Baums - Teil 1 Richard Göbel.
... und alles was dazugehört
Übung 9 Aufgabe 2. Susi S. möchte zukünftig innerhalb der Kostenrechnung Verkaufsanalysen durchführen können. Als wichtige Kennzahl soll zukünftig der.
Eine Einführung in OLAP (Online Analytical Processing)
Datenbank-entwicklungsprozess
Flexible Datenstrukturen
Erstellen einer Webseitenstatistik mithilfe eines OLAP-Servers
Erstellen einer Webseitenstatistik mithilfe eines OLAP-Servers
Datenbank.
Problemstellung Heterogene DV-Strukturen Mangelnde Kapazität in der EDV-Abteilung Historische Daten nicht verfügbar Analysen belasten die vorhandene Infrastruktur.
Überblick über die Datenbankproblematik
Semantisches Datenmodell Entity-Relationship-Modell Normalformen
Vorlesung #2 Datenbankentwurf
WS 2007/08 Datenbanksysteme Mi 17:00 – 18:30 R Vorlesung #10 Physische Datenorganisation.
SS 2009 – IBB4C Datenmanagement Fr 15:15 – 16:45 R Vorlesung #2 Datenbankentwurf.
SS 2010 – IBB4C Datenmanagement Fr 15:15 – 16:45 R Vorlesung #2 Datenbankentwurf.
WS 2011/12 Datenbanksysteme Mi 15:15 – 16:45 R Vorlesung #9 Physische Datenorganisation.
Vorlesung #4 Überführung des ER-Modells in das relationale Modell
WS 2011/12 Datenbanksysteme Fr 15:15 – 16:45 R Vorlesung #8 Anfragebearbeitung.
SS 2004 Datenbanken 4W Mi 13:30 – 15:00 G 2.30 Vorlesung #3 ER Modellierung.
WS 2012/13 Datenbanksysteme Fr 15:15 – 16:45 R Vorlesung #9 Anfragebearbeitung.
WS 2007/08 Datenbanksysteme Mi 17:00 – 18:30 R Vorlesung #9 Anfragebearbeitung (Teil 1)
Allgemeines zu Datenbanken
Freiwillige Feuerwehr der Stadt Perg
Vorlesung #10 Physische Datenorganisation
STRUKTUR EINES DATA WAREHOUSE / OLAP - SYSTEMS
Datenbanksysteme für Hörer anderer Fachrichtungen
prof. dr. dieter steinmannfachhochschule trier © prof. dr. dieter steinmann Folie 1 Klausurschwerpunkte Hilfe.
WS 2013/14 Datenbanksysteme Do 17:00 – 18:30 R Vorlesung #9 Anfragebearbeitung.
Transparente Information als Grundlage für ein erfolgreiches Controlling Claus Anton Finze, Projektleiter, DaWaVision.
Software Engineering Grundlagen
WS 2004/2005 Datenbanken II - 5W Mi 17:00 – 18:30 G 3.18 Vorlesung #3 Anfragebearbeitung (Teil 1)
SS 2014 – IBB4C Datenmanagement Do 17:00 – 18:30 R Vorlesung #2 Datenbankentwurf.
Software Engineering Strukturierte Analyse
Einführung Dateisystem <-> Datenbanksystem
Abbildung UML-Schema  Rel. Schema (1)
WS 2004/2005 Datenbanken II - 5W Mi 17:00 – 18:30 G 3.18 Vorlesung #10 RDBMS Erweiterungen.
Nachtrag Abgrenzung OLAP / OLTP
SS 2014 – IBB4B Datenmanagement Do 17:00 – 18:30 R Vorlesung #4 Überführung des ER-Modells in das relationale Modell.
XML – Grundlagen und Anwendungen Teil 4: Modellierung von Datenmodellen mit XML-Schema Prof. Dr. Michael Löwe, FHDW Hannover.
Seminar Data Warehousing - SS 2005
Was ist eine Datenbank „MS Access“
Komponenten und Phasen des Data Warehousing
SS 2015 – IBB4C Datenmanagement Fr 17:00 – 18:30 R Vorlesung #2 Datenbankentwurf.
Zusammenfassung. Ebenen der Modellierung Geoobjekte und ihre Modellierung II Ebenen der Modellierung Konzeptionelle Modellierung –Entity-Relationship.
Fakultät Bauingenieurwesen Institut für Bauinformatik bS Multimodelle Modellierungs-Methode XSD mit Vererbung Sebastian Fuchs
/Folie 1Holger Frietsch Historisierung von Zuordnungsänderungen für Dimensionen in relationalen ORACLE8-Data Warehouse- Datenbanken Holger Frietsch.
DOAG SID Data Warehouse
Nachtrag Abgrenzung OLAP / OLTP
ER-Modell und Relationales Schema
 Präsentation transkript:

00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Multidimensionale Datenstrukturen - semantische und logische Modellierung Teilvortrag: logische Modellierung Matthias Ansorg FH Gießen-Friedberg Seminarvortrag

00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Inhalt Einführung Vergleichende Darstellung der logischen Modelle Schlussgedanken

00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Einführung :: Inhalt Einführung Einordnung logischer Modelle Definitionen zu multidim. Datenstrukturen

00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Einführung :: Einordnung logischer Modelle (1) Datenabstraktion bei OLTP und Data Warehouse Sichten konzeptionelle Ebene logische Ebene physische Ebene

00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Einführung :: Einordnung logischer Modelle (2) Aufgabe logischer Modellierung: Abbildung des konzeptionellen Schemas für das Ziel-DBVS Berücksichtigung des Datenmodells des Ziel-DBVS Verlustfreie Abbildung der Semantik Besonderheiten bei multidim. Modellen optimiert für Endbenutzer optimiert auf effiziente OLAP-Abfragen

00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Dimension: Eine Analysesicht auf Daten; Element des Kontextes von Kennzahlen. Dimensionsposition: Basisgranular einer Dimension, »Blatt« in der Dimensionshierarchie. Kennzahl: Quantitative Größe im Dimensionskontext. Eine oder mehrere Kennzahlen bilden den Inhalt einer Würfelzelle. Fakt: Der Inhalt einer Würfelzelle zusammen mit ihrem Kontext (den Dimensionspositionen, die diese Würfelzelle identifizieren) Datenwürfel: Eine multidimensionale Matrix, aufgespannt von beliebig vielen Dimensionen. Eine Zelle für jede Kombination von Dimensionspositionen. Hierarchie: Die Struktur einer Dimension. Sie definiert die möglichen Aggregationen. Einführung :: Definitionen zu multidim. Datenstrukturen

00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Vergleichende Darstellung :: Inhalt Vergleichende Darstellung Überblick Kriterienkatalog Einzelne Modelle Flat Schema Star Schema Snowflake Schema Constellation Schema und Galaxy Schema Vergleichende Zusammenfassung der Ergebnisse

00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Vergleichende Darstellung :: Überblick (1) Multidimensionalität im relationalen Datenmodell Grundlage aller logischen Modelle Dimension analog Attribut: Attribute einer Dimension spannen einen multidimensionalen Raum auf Kennzahl analog Attribut: Attribut als Information, die mit einem Punkt im multidimensionalen Raum assoziiert ist.

00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Vergleichende Darstellung :: Überblick (2) Unterschiede: Normalisierungsgrad Aggregationen? künstliche Primärschlüssel? Anzahl Datenwürfel Wiederverwendung von Dimensionen

00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Vergleichende Darstellung :: Kriterienkatalog (1) Verständlichkeit für Endbenutzer »de facto«-Anforderung Unterschied zum Entwurf operativer Datenbanken Effizienz typischer Abfragen On-Line Analytical Processing Abbildung für reichhaltige Semantik Dimensionen Hierarchien Kennzahlen Aggregationen, Aggregationsverhalten

00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Vergleichende Darstellung :: Kriterienkatalog (2) Orientierung am Zieldatenbanksystem Beschreibungselemente sollen kompatibel mit dessen Datenmodell sein Wartbarkeit Werkzeugunterstützung

00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Vergleichende Darstellung :: Einzelne Modelle :: Flat Schema eine einzige Tabelle (»flat«) Analogie zum Relationenmodell: Dimensionen und Kennzahlen als Attribute vollständige Denormalisierung (»alle Joins vorberechnet«) minimale Zahl an Fakttabellen Probleme fehlerhafte Aggregationen möglich hohe Elementkomplexität

00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Vergleichende Darstellung :: Einzelne Modelle :: Star Schema (1)

00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Vergleichende Darstellung :: Einzelne Modelle :: Star Schema (2)

00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Vergleichende Darstellung :: Einzelne Modelle :: Star Schema (3) das »beliebteste denormalisierte Schema« Star Joins nicht mehr vorberechnet Dimensionstabellen und Fakttabellen verständlicher durch diese Konzepttrennung fehlende Semantik Dimensionshierarchien nur implizit Fakttabellenhierarchien nicht modelliert

00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Vergleichende Darstellung :: Einzelne Modelle :: Snowflake Schema (1) ein Star Schema mit expliziten Dimensionshierarchien durch normalisierte Dimensionstabellen zusätzliche Joins (deshalb tw. abgelehnt) besser verständlich durch explizite Modellierung Parallelhierarchien möglich

00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Vergleichende Darstellung :: Einzelne Modelle :: Snowflake Schema (2)

00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Vergleichende Darstellung :: Einzelne Modelle :: Constellation Schema und Galaxy Schema (1)

00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Vergleichende Darstellung :: Einzelne Modelle :: Constellation Schema und Galaxy Schema (2) Möglichkeiten, einzelne Schemata zu konsolidieren ein einzelnes Schema pro Datenwürfel Schematypen der einzelnen Schemata beliebig gemeinsame Dimensionen werden einmal angelegt und gemeinsam genutzt Fakttabellenhierarchien modellierbar Unterschiede Constellation Schema modelliert Fakttabellenhierarchien Galaxy Schema ist allgemeiner: Fakttabellenbeziehungen nicht zwingend

00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Vergleichende Darstellung :: Einzelne Modelle :: Constellation Schema und Galaxy Schema (3)

00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Vergleichende Darstellung :: Vergleichende Zusammenfassung der Ergebnisse

00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Kritische Schlussbemerkung :: Inhalt Kritische Schlussbemerkung zum Einsatz der logischen Modelle Wartungsproblematik im Data Warehouse Wartungsfreiheit durch Data Marts mit Cache- Struktur?

00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Kritische Schlussbemerkung :: Wartungsproblematik im Data Warehouse Wartung am logischen Schema ist notwendig:... wenn sich die Datenstrukturen der Quellschichten ändern.... wenn sich die aktuellen Analyseanforderungen der Benutzer ändern. logischer Entwurf manuell, ebenso die Schema-Evolution keine Lösung: Verzicht auf multidimensionale Datenstrukturen auf logischer Ebene das allumfassende logische Schema

00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Kritische Schlussbemerkung :: Wartungsfreiheit durch Data Marts mit Cache-Struktur? Ausgangsarchitektur multidim. logische Schemata nur in Data Marts Cache-Paradigma optimierter Zwischenspeicher (OLAP-Analysen, Endbenutzer-Tauglichkeit) Transparenz (nur redundante Daten und Datenstrukturen) mögliche multidimensionale Sichten definiert durch Metadaten im Data Warehouse Wartung durch Administratoren der OLTP-Datenbanken benutzerdefinierte Würfelstruktur (per GUI) manuelle Schema-Evolution unnötig