Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen Online Transaction Processing Betriebswirtschaftliche Standard- Software (SAP.

Slides:



Advertisements
Ähnliche Präsentationen
Einführung "Datenbanksysteme"
Advertisements

ER-Datenmodell und Abfragen in SQL
Projekt: Datenbankentwurf
Data Warehouses und Data Mining
Prof. Dr. Hans-Jürgen Scheruhn
MySQL.
Moderne Betriebliche Anwendungen von Datenbanksystemen
Was ist J2EE Die Vorteile von J2EE J2EE Modell Die Komponente von J2EE
Systemüberblick Beispiele: Microsoft Access Oracle Ingres Informix
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/9 Data Mining Ist die Wissensgewinnung aus Datensammlungen (Knowledge Discovery in Database).
Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme
OLAP. © T. Kudraß, HTWK Leipzig Warum? Daten einer Firma verfügbar machen für Entscheidungsprozesse – Umsetzung schwierig neue Konzepte notwendig zur.
Prof. Dr. T. Kudraß1 Datenbanken zur Entscheidungsunterstützung - Data Warehousing.
Text-Retrieval mit Oracle Vortrag von Andreas Mück & David Diestel.
Der letzte Schliff für Abfragen Übersicht über die Aggregatfunktionen.
Beispielrelation Buchbestellungen H = Menge der bedeutenden Ziele = {a, d} Schwelle T = 4 Stichprobe S = {a, b, a, a, a, a} mit s = |S| = 6 N = Anzahl.
Daten sammeln aus Verschiedenen Datenbanken Dokumenten Dateien
... und alles was dazugehört
Moderne Betriebliche Anwendungen von Datenbanksystemen
© DVS System Software GmbH & Co. KG
Data Warehouse mit Visual FoxPro
Eine Einführung in OLAP (Online Analytical Processing)
DATA WAREHOUSE Oracle Data Warehouse Mit Big Data neue Horizonte für das Data Warehouse ermöglichen Alfred Schlaucher, Detlef Schroeder DATA WAREHOUSE.
Problemstellung Heterogene DV-Strukturen Mangelnde Kapazität in der EDV-Abteilung Historische Daten nicht verfügbar Analysen belasten die vorhandene Infrastruktur.
Data Warehouse: ETL-Praktikum
Datenbanksysteme für hörer anderer Fachrichtungen
Speichern und Lesen von Daten im Data Warehouse
Einführung in Datenbankmodellierung und SQL
Betriebliche Anwendung von Datenbanksystemen: Data Warehouse
PL/SQL - Kurze Einführung April 2003Übung Data Warehousing: PL/SQL 2 PL/SQL.. ist eine Oracle-eigene, prozedurale Programmiersprache Sämtliche.
Das Information Warehouse Die Stärken eines zentralen dispositiven Information-Warehouse als informative Kernkomponente in einer heterogenen operativen.
Transparente Information als Grundlage für ein erfolgreiches Controlling Claus Anton Finze, Projektleiter, DaWaVision.
Structured Query Language
Vorlesung #5 SQL (Teil 2).
WS 2004/2005 Datenbanken II - 5W Mi 17:00 – 18:30 G 3.18 Vorlesung #10 RDBMS Erweiterungen.
Nachtrag Abgrenzung OLAP / OLTP
Anfragen an multidimensonale Daten
Datenbank für Skriptenverkauf
Überblick Einführung in SAP Business One
Prof. K. Gremminger Folie 1 Vorlesung Datenbanksysteme SS 2002 Marktanteile RDBS Deutschland ,9% 9,5% 4,4% 4,7% 23,8% 7,7% Quelle: Dataquest Oracle.
Moderne Betriebliche Anwendungen von Datenbanksystemen Online Transaction Processing Betriebswirtschaftliche Standard- Software (SAP R/3) Data Warehouse-Anwendungen.
By Thorsten Zisler 1 SQL Datenbank Anbindung an den Supervisor.
» Mobile Gateway Enterprise Edition Einzigartige Freiheit und innovative Arbeitserleichterung für den Mittelstand… Bewerbung für den Innovationspreis.
Dr. Klaus Ruhlig Technology & Product Consulting Sun Microsystems, München Skalierbare Rechnerarchitekturen für ein DWH: Eine vergleichende Analyse.
DB2 UDB im z/VSE Heinz Peter Maassen – Lattwein GmbH COURSE Tagung Bad Hersfeld 2008.
IS: Datenbanken, © Till Hänisch 2000 Einführung Worüber reden wir hier eigentlich ?
Microsoft Azure Die Cloud-Plattform für moderne Unternehmen ModernBiz 1 Kleine und mittlere Unternehmen (KMU) wünschen sich die Möglichkeit und Flexibilität,
DOAG SID Data Warehouse
Abfragen Wiederholung Manuel Friedrich Schiller-Gymnasium Hof.
Multidimensionale Datenbanken
Vorlesung #4 Relationales Kalkül und SQL (Teil 1)
Nachtrag Abgrenzung OLAP / OLTP
Data Warehousing für TPC-D Daten
Sortierte Datenbankabfragen
Wirtschaftsinformatik
Sichten.
Beispiele zur Datenänderung
Methoden der Datengewinnung
Mehr Möglichkeiten mit der SQL-Version
Einführung "Datenbanksysteme"
Studiengang Informatik FHDW
Moderne Betriebliche Anwendungen von Datenbanksystemen
von Eileen, Zoé und Anita
Abfragestrategien in verteilten Systemen
DHL Versandintegration bei Gambio
Nutzung und Modellierung von Datenbanken
Aggregations in Power BI
(Structured Query Language)
 Präsentation transkript:

Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen Online Transaction Processing Betriebswirtschaftliche Standard- Software (SAP R/3) Data Warehouse-Anwendungen Data Mining (Folien von A. Kemper zum Buch 'Datenbanksysteme')

OLTP: Online Transaction Processing  Beispiele  Flugbuchungssystem  Bestellungen in einem Handelsunternehmen  Charakterisierung  Hoher Parallelitätsgrad  Viele (Tausende pro Sekunde) kurze Transaktionen  TAs bearbeiten nur ein kleines Datenvolumen  „mission-critical“ für das Unternehmen  Hohe Verfügbarkeit muss gewährleistet sein  Normalisierte Relationen (möglichst wenig Update-Kosten)  Nur wenige Indexe (wegen Fortschreibungskosten)

SAP R/3: Enterprise Resource Modelling (ERP-System) Relationales DBMS als Backend-Server (Oracle, Informix, DB2, MS SQL-Server, Adabas) LAN WAN (Internet)

Sehr schnelles LAN (z.B. FDDI) ein Datenbank- Server mehrere Applikations- Server zur Skalierung „langsame“ Netzverbindung (WAN, Internet, Telefon,...) sehr viele (Tausende) Clients Dreistufige Client/Server-Architektur (3 Tier, SAP R/3)

Data Warehouse-Anwendungen: OLAP~Online Analytical Processing  Wie hat sich die Auslastung der Transatlantikflüge über die letzten zwei Jahre entwickelt? oder  Wie haben sich besondere offensive Marketingstrategien für bestimmte Produktlinien auf die Verkaufszahlen ausgewirkt?

Sammlung und periodische Auffrischung der Data Warehouse-Daten Data Warehouse OLTP-Datenbanken und andere Datenquellen OLAP-Anfragen Decision Support Data Mining ETL Extract - Transform - Load

Das Stern-Schema

Stern-Schema bei Data Warehouse- Anwendungen  Eine sehr große Faktentabelle  Alle Verkäufe der letzten drei Jahre  Alle Telefonate des letzten Jahres  Alle Flugreservierungen der letzten fünf Jahre  normalisiert  Mehrere Dimensionstabellen  Zeit  Filialen  Kunden  Produkt  Oft nicht normalisiert

Das Stern-Schema: Handelsunternehmen Verkäufe Zeit Verkäufer Produkte Kunden Filialen

Das Stern-Schema: Krankenversicherung Behandlungen Zeit Krankheiten ÄrztePatienten Krankenhäuser

Stern-Schema Passau25-Jul-00 VerkäuferKundeAnzahlProduktFilialeVerkDatum Verkäufe... BayernDPassau...BezirkLandFilialenKennung Filialen... 43Kemper wieAltNameKundenNr Kunden ElektronikHandyman825...wieAltManagerFachgebietNameVerkäuferNr Verkäufer Faktentabelle (SEHR groß) Dimensionstabellen (relativ klein)

Stern-Schema (cont‘d)... WeihnachtenDienstag Dec-01 Hochsommer Saison Dienstag Wochentag Jul-00 KWQuartalJahrMonatTagDatum Zeit SiemensTelekomMobiltelekomHandy1347..HerstellerProdukthauptgruppeProduktgruppeProdukttypProduktNr Produkte

Nicht-normalisierte Dimensionstabellen: effizientere Anfrageauswertung... WeihnachtenDienstag Dec-01 Hochsommer Saison Dienstag Wochentag Jul-00 KWQuartalJahrMonatTagDatum Zeit SiemensTelekomMobiltelekomHandy1347..HerstellerProdukthauptgruppeProduktgruppeProdukttypProduktNr Produkte Datum  Monat  Quartal ProduktNr  Produkttyp  Produktgruppe  Produkthauptgruppe

Normalisierung führt zum Schneeflocken-Schema Verkäufe Zeit Verkäufer Produkte Kunden Filialen Quartale KWs Produkttypen Produktgruppen Produkthaupt- gruppen

Anfragen im Sternschema select sum(v.Anzahl), p.Hersteller from Verkäufe v, Filialen f, Produkte p, Zeit z, Kunden k where z.Saison = 'Weihnachten' and z.Jahr = 2001 and k.wieAlt < 30 and p.Produkttyp = 'Handy' and f.Bezirk = 'Bayern' and v.VerkDatum = z.Datum and v.Produkt = p.ProduktNr and v.Filiale = f.FilialenKennung and v.Kunde = k.KundenNr group by p.Hersteller; Einschränkung der Dimensionen Join-Prädikate

Algebra-Ausdruck Verkäufe ...(Filialen) ...(Zeit) ...(Kunden) ...(Produkte) A A A A

Ultimative Verdichtung select sum(Anzahl) from Verkäufe v, Produkte p where v.Produkt = p.ProduktNr and p.Produkttyp = 'Handy';

Flexible Auswertungsmethoden: slice and dice

Materialisierung von Aggregaten insert into Handy2DCube ( select p.Hersteller, z.Jahr, sum(v.Anzahl) from Verkäufe v, Produkte p, Zeit z where v.Produkt = p.ProduktNr and p.Produkttyp = 'Handy' and v.VerkDatum = z.Datum group by z.Jahr, p.Hersteller ) union ( select p.Hersteller, to_number(null), sum(v.Anzahl) from Verkäufe v, Produkte p where v.Produkt = p.ProduktNr and p.Produkttyp = 'Handy' group by p.Hersteller ) union ( select null, z.Jahr, sum(v.Anzahl) from Verkäufe v, Produkte p, Zeit z where v.Produkt = p.ProduktNr and p.Produkttyp = 'Handy' and v.VerkDatum = z.Datum group by z.Jahr ) union ( select null, to_number(null), sum(v.Anzahl) from Verkäufe v, Produkte p where v.Produkt = p.ProduktNr and p.Produkttyp = 'Handy' );

Relationale Struktur der Datenwürfel

Würfeldarstellung

Der cube-Operator select p.Hersteller, z.Jahr, f.Land, sum(v.Anzahl) from Verkäufe v, Produkte p, Zeit z, Filialen f where v.Produkt = p.ProduktNr and p.Produkttyp = 'Handy' and v.VerkDatum = z.Datum and v.Filiale = f.Filialenkennung group by cube (z.Jahr, p.Hersteller, f.Land);

Wiederverwendung von Teil-Aggregaten insert into VerkäufeProduktFilialeJahr ( select v.Produkt, v.Filiale, z.Jahr, sum(v.Anzahl) from Verkäufe v, Zeit z where v.VerkDatum = z.Datum group by v.Produkt, v.Filiale, z.Jahr ); select v.Produkt, v.Filiale, sum(v.Anzahl) from Verkäufe v group by v.Produkt, v.Filiale

Wiederverwendung von Teil-Aggregaten select v.Produkt, v.Filiale, sum(v.Anzahl) from VerkäufeProduktFilialeJahr v group by v.Produkt, v.Filiale select v.Produkt, z.Jahr, sum(v.Anzahl) from Verkäufe v, Zeit z where v.VerkDatum = z.Datum group by v.Produkt, z.Jahr

Die Materialisierungs-Hierarchie  Teilaggregate T sind für eine Aggregation A wiederverwendbar wenn es einen gerichteten Pfad von T nach A gibt  Also T   A  Man nennt diese Materialisierungshierarchie auch einen Verband (Engl. Lattice)

Die Zeit-Hierarchie

Weitere Decision-Support Anfrage- Typen  Top N-Anfragen  Ich will nur die N besten Treffer erhalten und nicht alle 5 Millionen  Muss bei der Anfrageoptimierung berücksichtigt werden  Online Aggregation  Man berechnet das Ergebnis approximativ  Je länger die Anfrage läuft, desto genauer wird das Ergebnis

Top N-Anfragen Select A.* From Angestellte A, Abteilungen abt Where A.Abteilung = abt.AbteilungsNr and abt.Ort = Passau Order by A.Gehalt Stop after 20

Online-Aggregation Select abt.Ort, avg(A.Gehalt) From Angestellte A, Abteilungen abt Where A.Abteilung = abt.AbteilungsNr Group by abt.Ort