Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/9 Data Mining Ist die Wissensgewinnung aus Datensammlungen (Knowledge Discovery in Database).

Ähnliche Präsentationen


Präsentation zum Thema: "Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/9 Data Mining Ist die Wissensgewinnung aus Datensammlungen (Knowledge Discovery in Database)."—  Präsentation transkript:

1 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/9 Data Mining Ist die Wissensgewinnung aus Datensammlungen (Knowledge Discovery in Database). Hier wird in vorhandenen Datensammlungen nach nützlichen Regelmäßigkeiten gesucht. Dabei braucht zunächst nicht bekannt sein, welche Eigenschaften oder Attribute der Datensätze wichtig sind. Das sollen die Data Mining Verfahren herausfinden. Allgemein lässt sich das so definieren: Knowledge Discovery in Database (oder Data Mining) beschreiben automatisierte Verfahren, mit denen Regelmäßigkeiten in Mengen von Datensätzen gefunden und in eine für Nutzende verständliche Form gebracht werden.

2 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg2/9 Kennzeichnend für das Data Warehouse ist eine spezielle Strukturierung der Daten zur Unterstützung mehrdimensionaler Auswertungen. Große Bedeutung haben dabei die sogenannten Stern-Schemata gefunden, deren Einsatz sich auch zur Web-Zugriffsanalyse eignet. Dabei ist die Masse der auszuwertenden Daten im Rahmen von Faktentabellen gespeichert. Die zur Auswertung benötigten beschreibenden Eigenschaften der Fakten sind durch Dimensionstabellen repräsentiert; die Verbindung zwischen den Tabellen erfolgt durch Fremdschlüssel der Faktentabelle, die sich auf jeweils eine Dimension beziehen.

3 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg3/9 Grobarchitektur für Data Warehouse und OLAP Externe Datenquellen Operationale Datenquellen Metadaten Extrahieren Data Marts Data Warehouse Analyse Werkzeug OLAP Server

4 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg4/9 Anforderungen an OLAP Der Autor Pendse fasst Anforderungen an OLAP unter der Bezeichnung FASMI (Fast Analysis of Shared Multidimensional Information) zusammen. Fast Die Zugriffszeit muss im Sekundenbereich liegen, um interaktives Arbeiten zu ermöglichen. Analysis Das System muss analytische und statistische Funktionalität anbieten. Die Benutzerschnittstelle muss Ad-hoc Anfragen ohne Programmieraufwand erlauben.

5 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg5/9 Shared Das System erlaubt Mehrnutzerbetrieb. Allgemein sollten die DBMS Funktionalitäten der Transaktionssynchronisation realisiert sein. Auch wenn die Anwendungen in der Regel nur lesend zugreifen, ist die Transaktionssynchronisation in den Phasen der Aktualisierung notwendig. Multidimensional Unterstützung des multidimensionalen Datenmodells (hypercube) Information Ziel der OLAP Analyse ist die Gewinnung von Informationen aus Rohdaten.

6 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg6/9 OLAP Unter der Bezeichnung OLAP (On-line Analytical Processing) werden Systeme zusammengefasst, mit denen Datenbankinhalte grafisch dargestellt werden können. Mit OLAP Systemen lassen sich Auswirkungen von Änderungen bestimmter Parameter analysieren. Durch solche Visualisierungswerkzeuge können Entscheidungen unterstützen. Marktführend bei OLAP sind Hyperion Solutions (25%) und Oracle (21%).

7 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg7/9 Nach E.F. Codd sollten OLAP Systeme folgende Merkmale erfüllen: Mehrdimensionale konzeptionelle Sicht auf Daten Transparenz und Integration in die operativen Systeme Zugänglichkeit unterschiedlicher Databasen über eine logische Gesamtsicht stabile, volumenabhängige Antwortzeiten Client- Server Architektur Mehrbenutzerunterstützung flexibles Berichtwesen intuitive Datenmanipulation unbeschränkte dimensionsübergreifende Operationen

8 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg8/9 Für OLAP sind einige Architekturvarianten entwickelt worden, die mit einem vorangestellten Buchstaben identifiziert werden. MOLAP (multidimensionales OLAP) Charakteristisch ist eine eigene Datenhaltung in Form eines Datenwürfels. Dient zur Speicherung von Matrizen. Problemfall ist ein dünn besetzter Würfel. ROLAP (relationales OLAP) Speicherung erfolgt in Relationen. Die Speicherung der Dimensionsinformation erfolgt in relationaler Form, also in Stern- oder Schneeflocken Schemas. HOLAP (hybrides OLAP) Sind Systeme, die die Speicherung als ROLAP und MOLAP unterstützen.

9 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg9/9 Waren Waren ID Produktgruppe MWSt-Satz Kunde KundenNr KundenAdr Stadt Fakten DatumsID FilialenID WarenID KundenNr Anzahl Gesamtpreis Rabatt Datum DatumsID Tag MonatID Filialen FilialenID Filiale OrtID AnzMitarbeiter Monate MonatID Monat JahrID AnzTage Jahre JahrID AnzTage Staaten StaatID Staat Landessprache Orte OrtID Ort Bundesland Fläche StaatID


Herunterladen ppt "Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/9 Data Mining Ist die Wissensgewinnung aus Datensammlungen (Knowledge Discovery in Database)."

Ähnliche Präsentationen


Google-Anzeigen