Daten im Data-Warehouse

Slides:



Advertisements
Ähnliche Präsentationen
Prof. Dr. Dr. h.c. mult. August-Wilhelm Scheer
Advertisements

2. Data-Warehouse-Architektur
Datenbanken Einführung.
Problemstellung und Lösungsansätze
3/27/2017 3:09 PM © 2005 Microsoft Corporation. All rights reserved.
Unterstützen Klinikinformationssysteme Forschung und Lehre ?
1-1 Schlank und schnell zum Datawarehouse Marc Bastien Oracle Deutschland GmbH BTW Leipzig,
SuperX campusweites Informationssystem Vortrag im Rahmen des Workshop
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/9 Data Mining Ist die Wissensgewinnung aus Datensammlungen (Knowledge Discovery in Database).
Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.
Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme
Entscheidungsunterstützende Systeme (Data Warehouse)
Abgrenzung, Einordnung und Anwendungen Sebastian Hentschel
Datenbanken Einführung Merkmale dateiorientierte Datenverwaltung
Informationssysteme SS Informationssysteme Grundvorlesung Informatik Sommersemester 2004 Universität des Saarlandes, Saarbrücken Dr. Ralf Schenkel.
Der Datenqualität auf der Spur Data Profiling mit Oracle Warehouse Builder – Analysen rund um die Cheers GmbH Alfred Schlaucher.
Manpower Associates is a $14
Data Documentation Initiative (DDI)
Daten sammeln aus Verschiedenen Datenbanken Dokumenten Dateien
Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 24: Ausblicke.
Technische oder personenorientierte Lösungen?
Entwicklung eines Data Warehouse © by Sistema GeoDAT, S.L.
Entwurf und Realisierung einer digitalen Bibliothek zur Verwaltung von Notenhandschriften Dipl.-Ing. Temenushka Ignatova Datenbank- und Informationssysteme,
Qualitätskontrolle von Datenintegrations-prozessen
© DVS System Software GmbH & Co. KG
Entwicklung eines Data Warehouse 2007 © by Sistema GeoDAT, S.L.
EAI und Web Services Gerhard Wagner
7th German CDISC User Group Basel, 11. März 2010 Willkommen zum Define.xml Workshop.
Informations-veranstaltung LAG JAW
Erstellen einer Webseitenstatistik mithilfe eines OLAP-Servers
Erstellen einer Webseitenstatistik mithilfe eines OLAP-Servers
Problemstellung Heterogene DV-Strukturen Mangelnde Kapazität in der EDV-Abteilung Historische Daten nicht verfügbar Analysen belasten die vorhandene Infrastruktur.
Volumenorientierte Modellierung als Grundlage einer vernetzt- kooperativen Planung im konstruktiven Ingenieurbau Antragsteller: Prof. E. Rank, Prof. H.-J.
7. Andere Datenquellen verwenden1 Direkter Zugriff auf Fremddaten (importieren) Fremde Datenquelle Word 2002 Filter beim Importieren der Daten Fremdes.
Data und Web Mining KFK Semantic Web: Knowledge Management
Organisationsänderungen -Geschichtliche Entwicklung
Datenbanken und Datenmodellierung
Eidgenössisches Departement des Innern EDI Bundesamt für Statistik BFS Eidgenössisches Finanzdepartement EFD Bundesamt für Informatik und Telekommunikation.
Data Warehouse: ETL-Praktikum
Skalierbare Reporting-Systeme zwischen Excel™ und Data Warehouse
Einrichtung eines Data-Warehouse Servers
Ein Vortrag von Elisa Beyer und Melanie Erker
00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Multidimensionale Datenstrukturen - semantische und logische Modellierung Teilvortrag: logische Modellierung.
Betriebliche Anwendung von Datenbanksystemen: Data Warehouse
Xi © HvK, fleXinfo Hellmut v.Koerber Ackerstrasse CH 5070 Frick Tel/Box/Fax:
Analytisches CRM Phonnet Gruppe 1 (Loher, Meier, Rehhorn, Piasini)
Mehr Zeit für den Kunden und wirtschaftlicher Arbeiten mit BIB-Control
Analytisches CRM Phonnet Gruppe 1 (Loher, Meier, Rehhorn, Piasini)
Das Information Warehouse Die Stärken eines zentralen dispositiven Information-Warehouse als informative Kernkomponente in einer heterogenen operativen.
Transparente Information als Grundlage für ein erfolgreiches Controlling Claus Anton Finze, Projektleiter, DaWaVision.
cubido business solutions gmbh Haidfeldstrasse 33 A-4060 Leonding Rainer Stropek SQL Server.
Bibliographie der (historischen) Landkartensammlung der Fachbereichsbibliothek für Geographie. Themenvorschlag Projektgruppe 3 Medienerschließung Projektbetreuung:
WS 2004/2005 Datenbanken II - 5W Mi 17:00 – 18:30 G 3.18 Vorlesung #10 RDBMS Erweiterungen.
Nachtrag Abgrenzung OLAP / OLTP
Citavi im Prozess der wissenschaftlichen Arbeit
Architektur von Data Warehouse Systemen
Thema 1 Data WareHouse Volker Jahns.
DATAframe ® Transparenz in Ihrem Unternehmen Referent: XXXXXXX Datum:
Komponenten und Phasen des Data Warehousing
Archivierungskonzepte in DMS und ERPS (SAP) Archivierungskonzepte in DMS und ERPS (SAP)
AGU IT 2006, Seite 1 Produktionsauftragsverwaltung Produkte für WinCC Herstellvorschrift und Produktionsaufträge Lizenzpreis pro Anwendung 3850,-€Einrichtung.
Alfred Schlaucher, Data Warehouse Architect, Oracle Oracle Data Warehouse.
+ disy Informationssysteme ++ Stephanienstraße D Karlsruhe Spatial Intelligence mit disy Cadenza und Oracle Spatial am Beispiel.
Sprachumfang von SQL Vier Kategorien DDL (Data Definition Language)
Nachtrag Abgrenzung OLAP / OLTP
Die Prozess-Ebenen-Pyramide Definition und Darstellungsformen
Bewerbungsgespräch Herr Niemeyer
Business Intelligence Data Warehouse
Datenbanken Von Amed und Alicia.
 Präsentation transkript:

Daten im Data-Warehouse Vorgelegt von : Beytül Yamac, Hilal-Merve Sahin, Jorjet Uysal Mein heutiges Thema ist: Daten im Data-Warehouse

Gliederung Was ist Data Warehouse Aufbau eines Data Warehouse ETL- Prozesse Anforderung und Arten der Daten Fazit

Definition Data Warehouse unternehmensweites Konzept entscheidungsrelevante Daten strukturiert, bereinigt und verdichtet historische Daten Ein Data Warehouse kann als unternehmensweites Konzept der Datenhaltung verstanden werden, in dem entscheidungsrelevante Daten aus unterschiedlichen Quellsystemen gespeichert und für analytische Aufgaben der Unternehmensführung bereitgehalten werden. Die Daten liegen dabei in einer strukturierten, bereinigten und verdichteten Form vor. Im Gegensatz zur operativen Datenbasis, bei der Daten i. d. R. nach Abschluss des Vorgangs schwer zugreifbar archiviert oder gelöscht werden, sammelt das Data Warehouse Daten über einen langen Zeitraum (dauerhaft). Die Speicherung der Daten erfolgt dabei relational und/oder multidimensional.

Externe Datenquellen OLAP Data Warehouse Data Mining Operative Extraktion Transformation Laden Data Mining Operative Datenbanken Daten aus operative Datenquellen des Unternehmen und aus externen Quellen (Internet) werden nach Extraktion und Transformation ins Data Warehouse geladen und können mehrdimensional oder/und relational gespeichert werden. Die Daten des DWH liegen in Datenbanken vor, die i.d.R. nicht direkt zu Analysezwecken verwendet werden. Statt dessen werden die benötigten Daten aus dem DWH entnommen, denormalisiert und in Data Marts geladen. Data Marts können als kleine DWHs angesehen werden, die anwendungsbezogene Daten stark verdichtet bereitstellen. Zur Analyse der Daten werden Online Analytical Processing Systeme (OLAP) und Data Mining eingesetzt. Das OLAP Werkzeuge unterstützt mehrdimensionales Datenbanksysteme zum aufdecken von erfolgsrelevanten Informationen. Das Data Mining ist ein Analysewerkzeug, das Zusammenhänge und Auffälligkeiten innerhalb der Daten aufdeckt d.h. sie Sucht nach verborgenen Schätzen (Trends, Muster Zusammengehörigkeit) Die Auswahl der richtigen Extraktions-, und Transaktionswerkzeuge ist der entscheidenste Schritt beim Aufbau eines DWH. Dies ist häufig der aufwendigster Teil des Data Warehousing und macht 80% der entwicklung aus. Hier werden Rohdaten analysieren, selektieren und für die Zusammenführung in das Data Warehouse vorbereitet. Nach erfolgter Zusammenführung werden diese Werkzeuge für umfangreiche Prüfungen und ggf. Korrekturen genutzt. Erschwert wird das Zusammenführen der Daten insbesondere dadurch, dass in einer Daten verarbeitenden Stelle verschiedene Computersysteme und -programme eingesetzt werden, die ganz unterschiedliche Daten strukturen erzeugen. Data Marts

ETL- Prozesse Die Extraktionsphase (E) Die Transformationsphase (T) Die Ladephase (L) Extraktion: Selektion eines Ausschnitts der Daten aus den Quellen und Bereitstellung für Transformation Ist ein rein technisch ausgerichteter Prozess und beinhaltet (Temporäre Selektion, Temporäre Selektion, Dublettenidentifikation ) Transformation: Bei der Transformation der selektierten Rohdaten steht der betriebswirtschaftlich logische Aspekt im Mittelpunkt Daten werden an vorgegebene Schema- und Qualitätsanforderungen angepasst. Alle Daten auf ein einheitliches Format (z.B. [CWM] männlich-weiblich, 0-1,m-w; Daten bereinigen, Logische Integration zusammengehöriger Datenkategorien) Bei der Transformation der selektierten Rohdaten steht der betriebswirtschaftlich logische Aspekt im Mittelpunkt Laden: physisches Einbringen der Daten aus dem Arbeitsbereich in das Data Warehouse (Fortlaufende Aktualisierung bzw. Ergänzung, Übertragungsprotokollierung)

Anforderung an Daten Themenorientiert Integriert Zeitorientiert Beständig Themenorientiert: Das Data Warehouse enthält nicht alle Daten des Unternehmens, sondern nur die entscheidungsunterstützende Daten (z.B. Produkte, Vertrieb oder Kundendaten). Die anwendungsorientierter Daten (z.B. Lagerkontrolle und Produktabsatz) werden nicht berücksichtet. Integration: Die Daten werden bei der Übernahme in das Data Warehouse vereinheitlicht, um so trotz großer Heterogenität der Datenquellen einen konsistenten Datenbestand zu erhalten (ETL). Zeitorientierung: Die Zeitbezogenheit von Daten äußert sich Art und Weise: Speicherung von historischen Daten letzten 5-10 Jahre Datenanalyse über einen Zeitraum hinweg Daten als eine Reihe zeitlicher Schnappschüsse Beständigkeit: Daten, die einmal korrekt in das Data Warehouses geladen werden sind unveränderlich und können nur ergänzt werden. Es wird nur lesend auf die Daten zugegriffen. Dadurch wird die Wiederholbarkeit der Analyseergebnisse gewährleistet.

Warehouse-Manager Metadaten Stark zusammen- gefasste Daten Einfüge- Abfrage- Manager Wenig zusammen- gefasste Daten Detaillierte Daten Datenbanksystem Detaillierte Daten: Dieser Wh- Bereich nimmt alle im Datenbankschema vorhandenen detaillierten Daten auf. Es werden regelmäßig detaillierten Daten hinzugefügt , um die zusammengefassten Daten zu ergänzen. Wenig und stark zusammen gefasste Daten: Dieser Wh –Bereich nimmt alle vordefinierten Wenig und stark zusammen gefassten Daten auf. Der Bereich ist transient ,weil er laufenden Veränderungen unterliegt um auf sich veränderte Abfrageprofile reagieren zu können. Der Zweg der Zusammenfassung liegt in der Beschleunigung der Abfrage. Mit der anfänglichen Zusammenfassung der Daten sind jedoch erhöhte Betriebskosten wird aber ausgeglichen dadurch das die Notwendigkeit wegfällt beim Beantworten der Abfragen ständige zusammenfassende Operationen durchzuführen (z.B. Sortierung Gruppierung). Fortlaufende Aktuaiesierung wenn neu Daten in DW aufgenommen Archiv-/Sicherungsdaten: Dieser Wh –Bereich nimmt die detaillierten und zusammengefassten Daten zum Zweg der Archivierung und Sicherung auf. Auch wenn die zusammengefassten. Daten aus detaillierten Daten erstellt sind kann es erforderlich sein zusammengefasste Daten zu sichern falls diese über die Aufbewahrungszeit der detaillierten Daten hinaus erhalten bleiben sollen. Metadaten: Als Metadaten oder Metainformationen bezeichnet man allgemein Daten, die Informationen über andere Daten enthalten. Bei den beschriebenen Daten handelt es sich oft um größere Datensammlungen (Dokumente) wie Bücher, Datenbanken oder Dateien. Metadaten beschreiben den Dateninhalt des DAta Warehouse, was sich darin befindet , woher es ursprünglich stammt und was mit ihm hinsichtlich Reinigung Integration und Zusammenfassung unternommen wurde. Sie dient der Auflösung semantischer Unklarheiten während der Datenbereinigung und während der Ergebnisinterpretation. Warehouse-Manager Archiv-/ Sicherungsdaten

Fazit bereinigte und zusammengefasste Daten schnell wertvolle Informationen Entscheidungen unterstützen Datenqualität Dadurch, das entscheidungsrelevante Daten aus unterschiedlichen Quellsystemen in einer bereinigten und zusammengefassten Form gespeichert und zu Analyse für die Unternehmensführung bereitgehalten werden können z.B. Entscheidungsträger in Unternehmen schnell wertvolle Informationen erhalten, um Planungs- und Entscheidungsprozesse wirkungsvoll zu unterstützen. Die Daten des DWH helfen Unternehmen komplexere Fragestellungen zu bewältigen. Die Aus der Analyse gewonnenen Daten können wieder ins DWH einfließen was zur folge hat, das die Datenqualität steigt.