Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Architektur und Verwendung

Ähnliche Präsentationen


Präsentation zum Thema: "Architektur und Verwendung"—  Präsentation transkript:

1 Architektur und Verwendung
Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung

2 OLTP und OLAP im Vergleich Data Warehouse-Komponenten OLAP-Würfel
Einführung OLTP und OLAP im Vergleich Data Warehouse-Komponenten OLAP-Würfel

3 OLTP und OLAP im Vergleich
Mithilfe der analytischen Onlineverarbeitung (Online Analytical Processing, OLAP) können Sie auf aggregierte und organisierte Daten aus Geschäftsdatenquellen, z. B. Data Warehouses, in einer multidimensionalen Struktur, die als Cube bezeichnet wird, zugreifen. Microsoft SQL Server 2005 Analysis Services (SSAS) stellt Tools und Features für OLAP zur Verfügung, mit deren Hilfe Sie Cubes und andere unterstützende Objekte entwerfen, bereitstellen und verwalten können.

4 OLTP und OLAP im Vergleich
OnLine Transaction Processing Merkmale Verarbeitet Echtzeittransaktionen eines Unternehmens Enthält für Einträge und Bearbeitungen optimierte Datenstrukturen Stellt eingeschränkte Entscheidungsfindungsfunktionen bereit Beispiele Anwendungen zum Nachverfolgen von Aufträgen Kundendienstanwendungen Point-of-Sales-Anwendungen OLAP OnLine Analytical Processing Merkmale Es stellt Daten für Geschäftsanalysevorgänge bereit Es integriert Daten aus heterogenen Quellsystemen Es kombiniert überprüfte Quelldaten Es organisiert Daten in themenspezifischen Gruppen, die sich nicht ständig ändern Es speichert Daten in physischen Strukturen, die für das Verteilen und Abfragen von Daten optimiert sind Beispiele Matrix-/Pivot-Untersuchungen Erweiterte Wissensgenerierung

5 OLTP und OLAP im Vergleich
Allgemeine Kennzeichen Optimiertes Schema für schnelle Benutzerabfragen Stabiles Berechnungs-modul für numerische Analysen Vorausberechnete Aggregate, Beziehungs-management Konzeptionelles, intuitives Datenmodell Multidimensionale Sicht von Daten Drilldown und Drillup Sichten von Daten mit Hilfe des Pivotprinzips Einsatzmöglichkeiten EIS-Systeme Leistungswerte Ausnahmeberichts-erstellung Verkaufs- und Marketinganwendungen Bestellungs- und Rechnungsanwendungen Produktanalysen Kundenanalysen Zeitreihen-Trendanalysen

6 OLTP und OLAP im Vergleich
OLAP-Dimension Relationale Dimension REGION West East STATE REGION CA West OR West MA East NY East REGION West CA OR East MA NY

7 OLTP und OLAP im Vergleich
USA ist die übergeordnete Ebene von North West und South West North West und South West sind untergeordnete Ebenen von USA USA North West Oregon Washington South West California North West und California sind nachfolgende Elemente von USA North West und USA sind vorausgehende Elemente von Washington North West und South West sind gleichgeordnete Elemente Oregon und California sind Elemente mit übergeordneten Ebenen, die gleichgeordnete Elemente sind Alle sind Elemente ein und derselben Dimension

8 Data Warehouse-Komponenten
Datenzugriff Benutzer- zugriff auf Daten Daten- quellen Datamarts Dateneingabe Staging- bereich

9 Data Warehouse-Komponenten
Relationale Datamarts OLAP-Cubes Datenspeicherung Relationale Datenstruktur Multidimensionale Datenstrukturen Dateninhalt Detaillierte und zusam- mengefasste Daten Zusammengefasste Daten Datenquellen Relationale und nicht relationale Quellen Relationale und nicht relationale Quellen Datenabruf Gute Abfrageleistung beim Extrahieren von Daten Sehr gute Abfrageleistung beim Extrahieren von Daten

10 OLAP-Würfel: Struktur
Atlanta Chicago „Markets“-Dimension Denver Grapes Cherries „Products“-Dimension Detroit Melons Apples Q1 Q2 Q3 Q4 „Time“-Dimension

11 OLAP-Würfel: Abfragen
Sales Fact Atlanta Chicago „Markets“-Dimension Denver Grapes Cherries Dallas Melons „Products“- Dimension Apples Q1 Q2 Q3 Q4 „Time“-Dimension

12 OLAP-Würfel: Schneiden
Atlanta Chicago „Markets“-Dimension Denver Grapes Cherries Detroit Melons „Products“-Dimension Apples Q1 Q2 Q3 Q4 „Time“-Dimension

13 OLAP-Würfel: Visualisierung

14 OLAP-Würfel: Visualisierung

15 Fragen...

16 Server-/Client-Architektur Berichte/Auswertung
OLAP und SQL Server 2005 Übersicht Server-/Client-Architektur Berichte/Auswertung

17 Übersicht Microsoft SQL Server 2005 Analysis Services (SSAS) verwendet sowohl Server- als auch Clientkomponenten zum Bereitstellen von OLAP-Funktionen (Online Analytical Processing) und von Data Mining-Funktionen für Business Intelligence-Anwendungen: Die Serverkomponente von Analysis Services ist als Microsoft Windows-Dienst implementiert. SQL Server 2005 Analysis Services unterstützt mehrere Instanzen auf demselben Computer, wobei jede Instanz von Analysis Services als eigene Instanz des Windows-Dienstes implementiert ist. Clients kommunizieren mit Analysis Services mithilfe des öffentlichen Standards für XMLA (XML for Analysis). Hierbei handelt es sich um ein SOAP-basiertes Protokoll für die Ausgabe von Befehlen und den Empfang von Antworten in Form eines Webdienstes. Clientobjektmodelle werden ebenfalls über XMLA bereitgestellt. Auf diese Modelle kann sowohl ein verwalteter Anbieter (ADOMD.NET) als auch ein eigener OLE DB-Anbieter zugreifen. Abfragebefehle können mithilfe der folgenden Abfragesprachen ausgegeben werden: SQL; MDX (Multidimensional Expressions), eine Abfragesprache nach Industriestandard für Analysen; oder DMX (Data Mining Extensions), eine am Data Mining orientierte Abfragesprache nach Industriestandard. Zum Verwalten von Analysis Services-Datenbankobjekten kann außerdem ASSL (Analysis Services Scripting Language) verwendet werden.

18 Serverarchitektur Die Serverkomponente von Microsoft SQL Server 2005 Analysis Services (SSAS) ist die Anwendung msmdsrv.exe, die normalerweise als Windows-Dienst ausgeführt wird. Diese Anwendung besteht aus Sicherheitskomponenten einer XMLA-Überwachungskomponente (XML for Analysis) einer Abfrageverarbeitungs-komponente und zahlreichen internen Komponenten, die die folgenden Funktionen ausführen: Analysieren von Anweisungen, die von Client empfangen werden Verwalten von Metadaten Behandeln von Transaktionen Verarbeiten von Berechnungen Speichern von Dimensions- und Zellendaten Erstellen von Aggregationen Planen von Abfragen Zwischenspeichern von Objekten Verwalten von Serverressourcen The server has a number of formats which can be set up when the Cube is created. One property that can be returned from the CellSet is the Formatted Value property, which returns a rounded string. If you are looking to pass the results to another function, or even to another application, such as Excel, it is better to retrieve the Value property for calculation, and then the Format_String property which can be applied once all of the calculations are finished. We can also define server-side colours and fonts which can be used for exception reporting, for example, a different colour for negative values. These can be incorporated into the application and are a good example of basing the client-side format on the Business–layer rules.

19 Clientarchitektur Microsoft SQL Server 2005 Analysis Services (SSAS) unterstützt eine Thin Client-Architektur. Das Analysis Services-Berechnungsmodul ist vollständig serverbasiert, sodass alle Abfragen auf dem Server aufgelöst werden. Daher ist für jede Abfrage nur ein Roundtrip zwischen dem Client und dem Server erforderlich, was zu skalierbarer Leistung führt, wenn die Komplexität der Abfragen zunimmt. Das native Protokoll für Analysis Services ist XMLA (XML for Analysis). Analysis Services stellt mehrere Datenzugriffsschnittstellen für Clientanwendungen zur Verfügung. Diese Komponenten verwenden jedoch alle XMLA für die Kommunikation mit einer Instanz von Analysis Services. The server has a number of formats which can be set up when the Cube is created. One property that can be returned from the CellSet is the Formatted Value property, which returns a rounded string. If you are looking to pass the results to another function, or even to another application, such as Excel, it is better to retrieve the Value property for calculation, and then the Format_String property which can be applied once all of the calculations are finished. We can also define server-side colours and fonts which can be used for exception reporting, for example, a different colour for negative values. These can be incorporated into the application and are a good example of basing the client-side format on the Business–layer rules.

20 Clientarchitektur Zusammen mit Analysis Services werden mehrere unterschiedliche Anbieter zur Verfügung gestellt, um unterschiedliche Programmiersprachen zu unterstützen. Ein Anbieter kommuniziert mit einem Server mit Analysis Services, indem XMLA in SOAP-Paketen über TCP/IP oder durch Internetinformationsdienste (Internet Information Services, IIS) über HTTP gesendet und empfangen wird. Eine HTTP-Verbindung verwendet ein von IIS instanziiertes COM-Objekt, das als Datapump bezeichnet wird und als Datenleitung für Analysis Services-Daten fungiert. The server has a number of formats which can be set up when the Cube is created. One property that can be returned from the CellSet is the Formatted Value property, which returns a rounded string. If you are looking to pass the results to another function, or even to another application, such as Excel, it is better to retrieve the Value property for calculation, and then the Format_String property which can be applied once all of the calculations are finished. We can also define server-side colours and fonts which can be used for exception reporting, for example, a different colour for negative values. These can be incorporated into the application and are a good example of basing the client-side format on the Business–layer rules.

21 Clientarchitektur Win32-Clientanwendungen können mithilfe von
OLE DB für OLAP-Schnittstellen Microsoft ActiveX Data Objects-Objektmodell (ADO) für COM-Automatisierungssprachen (Component Object Model) wie Microsoft Visual Basic Verbindungen zu einem Server mit Analysis Services herstellen. Mit .NET-Sprachen codierte Anwendungen können mithilfe von ADOMD.NET eine Verbindung zu einem Server mit Analysis Services herstellen. Programmier-sprache Datenzugriffs-schnittstelle C++ OLE DB für OLAP (OLE DB for OLAP) Visual Basic 6 ADO MD .NET-Sprachen ADOMD.NET Alle Sprachen mit SOAP-Unterstützung XMLA (XML for Analysis) The server has a number of formats which can be set up when the Cube is created. One property that can be returned from the CellSet is the Formatted Value property, which returns a rounded string. If you are looking to pass the results to another function, or even to another application, such as Excel, it is better to retrieve the Value property for calculation, and then the Format_String property which can be applied once all of the calculations are finished. We can also define server-side colours and fonts which can be used for exception reporting, for example, a different colour for negative values. These can be incorporated into the application and are a good example of basing the client-side format on the Business–layer rules.

22 Clientarchitektur Analysis Services verfügt über eine Webarchitektur mit einer vollständig skalierbaren mittleren Ebene, die sowohl in kleineren als auch in großen Organisationen bereitgestellt werden kann. Analysis Services stellt umfassende Unterstützung auf mittlerer Ebene für Webdienste zur Verfügung. ASP-Anwendungen werden von OLE DB für OLAP und ADO MD unterstützt, ASP.NET-Anwendungen werden von ADOMD.NET unterstützt. Die mittlere Ebene ist für viele gleichzeitige Benutzer skalierbar. The server has a number of formats which can be set up when the Cube is created. One property that can be returned from the CellSet is the Formatted Value property, which returns a rounded string. If you are looking to pass the results to another function, or even to another application, such as Excel, it is better to retrieve the Value property for calculation, and then the Format_String property which can be applied once all of the calculations are finished. We can also define server-side colours and fonts which can be used for exception reporting, for example, a different colour for negative values. These can be incorporated into the application and are a good example of basing the client-side format on the Business–layer rules.

23 Clientarchitektur Lokale Cubes und lokale Miningmodelle ermöglichen Analysen auf einer Clientarbeitsstation, wenn deren Verbindung zum Netzwerk getrennt ist. Das lokale Cubemodul (Msmdlocal.dll) unterstützt lokale Cubes und lokale Miningmodelle auf Clientcomputern. Das lokale Cubemodul ist ein In-Process-COM-Server. Eine Clientanwendung ruft den OLE DB-Anbieter für OLAP auf, der das lokale Cubemodul zum Erstellen und Abfragen von lokalen Cubes lädt. The server has a number of formats which can be set up when the Cube is created. One property that can be returned from the CellSet is the Formatted Value property, which returns a rounded string. If you are looking to pass the results to another function, or even to another application, such as Excel, it is better to retrieve the Value property for calculation, and then the Format_String property which can be applied once all of the calculations are finished. We can also define server-side colours and fonts which can be used for exception reporting, for example, a different colour for negative values. These can be incorporated into the application and are a good example of basing the client-side format on the Business–layer rules.

24 Clientarchitektur Sowohl lokale Cubes als auch lokale Data Mining-Modelle werden in multidimensionalen Cubedateien (CUB) auf einem Clientcomputer gespeichert. Eine CUB-Datei enthält mindestens einen lokalen Cube, kann jedoch mehrere Cubes enthalten. Abfragen an die lokalen Cubes werden vom lokalen Cubemodul verarbeitet und benötigen keine Verbindung zu einer Analysis Services-Instanz. Ein lokaler Cube kann entweder auf einem vorhandenen, in Analysis Services gespeicherten Cube basieren oder auf einer relationalen OLE DB-Datenbank. Wenn ein lokaler Cube aus einer relationalen Datenquelle erstellt wird, ist dessen Struktur jener von Cubes in Analysis Services sehr ähnlich. Wenn ein lokaler Cube aus einer OLAP-Datenquelle erstellt wird, ist der lokale Cube an den Quellcube gebunden. Ein lokaler Cube kann auch ohne eine Ausgangsdatenquelle erstellt werden. The server has a number of formats which can be set up when the Cube is created. One property that can be returned from the CellSet is the Formatted Value property, which returns a rounded string. If you are looking to pass the results to another function, or even to another application, such as Excel, it is better to retrieve the Value property for calculation, and then the Format_String property which can be applied once all of the calculations are finished. We can also define server-side colours and fonts which can be used for exception reporting, for example, a different colour for negative values. These can be incorporated into the application and are a good example of basing the client-side format on the Business–layer rules.

25 Clientarchitektur Das lokale Cubemodul kann auch lokale Data Mining-Modelle erstellen, die in lokalen Cubes verarbeitet wurden. Ein lokales Data Mining-Modell basiert auf einem lokalen Cube und wird in derselben CUB-Datei gespeichert, die auch den lokalen Cube definiert. Lokale Miningmodelle können auch ohne eine Verbindung zu einer Analysis Services-Instanz verwendet werden. The server has a number of formats which can be set up when the Cube is created. One property that can be returned from the CellSet is the Formatted Value property, which returns a rounded string. If you are looking to pass the results to another function, or even to another application, such as Excel, it is better to retrieve the Value property for calculation, and then the Format_String property which can be applied once all of the calculations are finished. We can also define server-side colours and fonts which can be used for exception reporting, for example, a different colour for negative values. These can be incorporated into the application and are a good example of basing the client-side format on the Business–layer rules.

26 Berichte Reporting Tool-Optionen Excel Pivot-Tabellen und Pivot-Charts
Office Web Components (OWC) Reporting Services Report Builder Strukturierte Berichte (relational) Reporting Services, Report Builder Strukturierte Gruppierungen (OLAP) Excel Pivot-Tabellen-Berichte und Diagramme Office Web PivotTable Reports und Diagramme Excel Add-In Accelerator Strukturierte Attribute (Data Mining) Data Mining-Auswertungs-/Anzeigewerkzeuge

27 Berichte: Excel PivotTables und PivotCharts
Excel ist bekannt und oft schon vorhanden Unterstützt AS 2005 Arbeitet mit relationalen und OLAP-Daten GetPivotData fügt Flexibilität hinzu As an intrinsic part of Excel, PivotTabels and PivotCharts are relatively well-known and can give a good functional display of many kinds of data. There is a special function called GetPivotData which allows us to add some flexibility to the report using code. GETPIVOTDATA(data_field,pivot_table,field1,item1,field2,item2,...) For example, GETPIVOTDATA("Sales",$A$4,"Region","South") would give you the Sales total for the South Region - $A$4 is the location of any cell or range of cells in your Pivot Table. Other than the fairly rigid, structured nature of Pivot Tables, the charting in Excel has not been updated for quite a period of time. Also treating all hierarchies as dimensions could become very confusing for the end user, especially if you have many attributes, which is very likely in Analysis Services 2005.

28 Berichte: Office Web Components (OWC)
In eigene Anwendungen einbettbar Flexibler als Excel Bessere Diagramm-Erzeugung als in Excel Benutzerdefinierte Aggregate Keine Office-Lizenz erforderlich VBA/ActiveX-Unterstützung Von Microsoft in SQL Server Studios selbst eingesetzt The Office Web Component is an ActiveX control similar to the Excel Pivot tables. It is the same component that we use when we browse a cube in BIDS. Although it may not be a great choice for a ‘web’ component, due to it’s thick nature, it is still very useful within an intranet where you can control the web browser deployments and capabilities.

29 Berichte: Excel Add-In Accelerator
Verbesserte Abfragen Freiform-Modus mit asymmetrischen Berichten, mehreren Datenquellen und flexiblen Formeln Verteilung über Arbeitsblatt/Excel-Datei The new Microsoft Excel Add-In for SQL Server Analysis Services provides flexible free-form reports coupled with structured reports. The structured reports are similar in many ways to PivotTable reports, but with some added functionality, most notably the following: Reports automatically support advanced Analysis Services capabilities such as actions, what-if analysis, and Drillthrough. Advanced techniques are available for specifying members from a dimension, including wild card searches and data-driven selection The greatest benefits of the add-in come from free-form reports. Unlike Structured reports, free-form reports do not use structured report segments and a data grid. Rather, individual cell formulas connect each cell to the connection. You can insert Microsoft Excel formulas into the middle of the report and rows and columns can be inserted or individual cells moved freely on the worksheet. Following are some of the greatest benefits of a free-form report: Mixed hierarchies can be arranged in a single report axis, which makes it easy to create asymmetrical reports. A single report can integrate members and values from multiple connections, including cubes from different servers The queries generated by the add-in are optimized so that the performance is similar to that of using a PivotTable report.

30 Berichte: Reporting Services
Tabellen, Matrizen, Diagramme Vordefinierte Struktur Interaktivität möglich Strukturierte Daten: relational, OLAP, hierarchisch URL-Zugriff und einbettungsfähig in eigenen Anwendungen Web Service-Unterstützung Reporting Services is a very powerful tool with some very good built-in features, as listed on the slide. It is very structured and sometimes we do want that structure. Along with all of the features listed on the slide, it is important to note that it is a thin-client tool, accessible by accessing the web page or by calling a web service on the Reporting Server. It is therefore very easy to embed in applications as we shall see shortly.

31 Berichte: Report Builder
Zusatzwerkzeug für die direkte Erstellung von Berichten auf Basis eines Datenmodells für Berichte durch Profi-Benutzer Unterstützt prinzipiell die gleichen Layout-/Abfragefähigkeiten wie Visual Studio für die Standard-Reporting Services Report Builder is the ad hoc query tool for SQL Server 2005 Reporting Services and allows users to build reports using a business model of the underlying database. The multimedia is taken from the MSDNTV episode: Developing a Model for Report Builder and End-user Report Authoring There is a Report Builder webcast containing essentially the same information, available at

32 Fragen...

33 Unified Dimensional Model (UDM) Data Mining Objekte
Konzepte Unified Dimensional Model (UDM) Data Mining Objekte

34 UDM Ein Benutzer, der Informationen direkt aus einer Datenquelle abrufen möchte, wie z. B. aus einer ERP-Datenbank (Enterprise Resource Planning), steht mehreren bedeutenden Herausforderungen gegenüber: Die Inhalte solcher Datenquellen sind häufig schwer verständlich, da sie für Systeme und Entwickler entwickelt wurden, ohne dabei die Anforderungen des Benutzers zu berücksichtigen. Die vom Benutzer benötigten Informationen werden häufig auf mehrere heterogene Datenquellen verteilt. Umso schwieriger wird es für den Benutzer, wenn diese Datenquellen unterschiedlichster Arten sind, die neben relationalen Datenbanken auch Dateien und Webdienste beinhalten. Während viele Datenquellen so ausgerichtet sind, dass sie große Mengen an Transaktionsebenendetails aufnehmen, schließen die zur Unterstützung von Geschäftsentscheidungen durchgeführten Abfragen in vielen Fällen zusammengefasste, aggregierte Informationen ein. Bei sehr großen Datenmengen kann die zum Abrufen solcher zusammengefasster Werte für die interaktive Endbenutzeranalyse erforderliche Zeit ein Hindernis darstellen. Die Geschäftsregeln sind im Allgemeinen nicht in den Datenquellen gekapselt. Die Benutzer müssen daher die Daten selbst interpretieren. The server has a number of formats which can be set up when the Cube is created. One property that can be returned from the CellSet is the Formatted Value property, which returns a rounded string. If you are looking to pass the results to another function, or even to another application, such as Excel, it is better to retrieve the Value property for calculation, and then the Format_String property which can be applied once all of the calculations are finished. We can also define server-side colours and fonts which can be used for exception reporting, for example, a different colour for negative values. These can be incorporated into the application and are a good example of basing the client-side format on the Business–layer rules.

35 UDM Die Rolle eines UDM (Unified Dimensional Model) besteht darin, eine Brücke zwischen dem Benutzer und den Datenquellen bereitzustellen. Ein UDM wird aus mindestens einer physikalischen Datenquelle hergeleitet. Der Benutzer gibt Abfragen für das UDM mithilfe einer Vielzahl von Clienttools wie Microsoft Excel aus. Es ergeben sich Vorteile für den Endbenutzer, auch wenn das UDM nur als minimale Schicht über der Datenquelle erstellt wird: ein einfacheres, verständlicheres Modell der Daten, das Isolieren heterogener Back-End-Datenquellen sowie Leistungsverbesserungen bei Abfragen. Das UDM bietet die folgenden Vorteile: Deutlich verbessertes Benutzermodell. Stellt Abfragen mit hoher Leistung bereit und unterstützt so interaktive Analysen von großen Datenmengen. Erfasst Geschäftsregeln im Modell zur Unterstützung umfangreicherer Analysen. Ermöglicht eine Rückkopplung, bei der Benutzer auf die angezeigten Daten reagieren können. The server has a number of formats which can be set up when the Cube is created. One property that can be returned from the CellSet is the Formatted Value property, which returns a rounded string. If you are looking to pass the results to another function, or even to another application, such as Excel, it is better to retrieve the Value property for calculation, and then the Format_String property which can be applied once all of the calculations are finished. We can also define server-side colours and fonts which can be used for exception reporting, for example, a different colour for negative values. These can be incorporated into the application and are a good example of basing the client-side format on the Business–layer rules.

36 UDM Direkter Zugriff auf die Datenquellen (traditionell)
Zugreifen auf die Datenquellen mithilfe eines UDM The server has a number of formats which can be set up when the Cube is created. One property that can be returned from the CellSet is the Formatted Value property, which returns a rounded string. If you are looking to pass the results to another function, or even to another application, such as Excel, it is better to retrieve the Value property for calculation, and then the Format_String property which can be applied once all of the calculations are finished. We can also define server-side colours and fonts which can be used for exception reporting, for example, a different colour for negative values. These can be incorporated into the application and are a good example of basing the client-side format on the Business–layer rules.

37 UDM Hierarchien Key Performance Indicators (KPIs) Zeitangaben
Übersetzungen Kategorisierung Perspektiven Attributsemantik The server has a number of formats which can be set up when the Cube is created. One property that can be returned from the CellSet is the Formatted Value property, which returns a rounded string. If you are looking to pass the results to another function, or even to another application, such as Excel, it is better to retrieve the Value property for calculation, and then the Format_String property which can be applied once all of the calculations are finished. We can also define server-side colours and fonts which can be used for exception reporting, for example, a different colour for negative values. These can be incorporated into the application and are a good example of basing the client-side format on the Business–layer rules.

38 UDM Erweiterte Analytik
The server has a number of formats which can be set up when the Cube is created. One property that can be returned from the CellSet is the Formatted Value property, which returns a rounded string. If you are looking to pass the results to another function, or even to another application, such as Excel, it is better to retrieve the Value property for calculation, and then the Format_String property which can be applied once all of the calculations are finished. We can also define server-side colours and fonts which can be used for exception reporting, for example, a different colour for negative values. These can be incorporated into the application and are a good example of basing the client-side format on the Business–layer rules.

39 UDM UDM MDX Datenquelle Werkzeug DW Analysis Services XML/A or ODBO
Cache OLAP Browser (2) Browser (1) MDX Berichtswerkzeug (1) One of the main purposes of the UDM is to seamlessly integrate the OLAP data with the relational data that is in the Data Warehouse. In order to access the data, we use MDX to go to Analysis Services. Therefore, to take full advantage of the UDMs ability to integrate relational and OLAP data, we need to use MDX. Berichtswerkzeug (1) BI-Anwendungen

40 Data Mining Data Mining wird oft als "der Prozess des Extrahierens gültiger, authentischer und aussagefähiger Informationen aus großen Datenbanken" beschrieben. Data Mining ist demnach ein Prozess, der Muster und Trends in Daten aufdeckt. Diese Muster und Trends lassen sich zusammenfassen und als Miningmodell definieren. Miningmodelle werden u. a. auf folgende Geschäftsszenarien angewendet: Erstellen von Verkaufsprognosen Durchführen von Direktmarketingaktionen, die auf einen bestimmten Kundenkreis abzielen Ermitteln von Produkten mit Cross-Selling-Potenzial Ermitteln der Reihenfolge, in der Kunden Produkte in den Einkaufswagen legen Die Erstellung eines Miningmodells muss als Teil eines größeren Prozesses verstanden werden, der sich von der Definition der zentralen Problemstellung bis hin zur Implementierung des Modells in einer Arbeitsumgebung erstreckt. Ein Data Mining-Prozess besteht im Wesentlichen aus sechs Schritten: Definieren der Problemstellung Vorbereiten der Daten Durchsuchen von Daten Erstellen von Modellen Durchsuchen und Validieren von Modellen Bereitstellen und Aktualisieren von Modellen The server has a number of formats which can be set up when the Cube is created. One property that can be returned from the CellSet is the Formatted Value property, which returns a rounded string. If you are looking to pass the results to another function, or even to another application, such as Excel, it is better to retrieve the Value property for calculation, and then the Format_String property which can be applied once all of the calculations are finished. We can also define server-side colours and fonts which can be used for exception reporting, for example, a different colour for negative values. These can be incorporated into the application and are a good example of basing the client-side format on the Business–layer rules.

41 Data Mining The server has a number of formats which can be set up when the Cube is created. One property that can be returned from the CellSet is the Formatted Value property, which returns a rounded string. If you are looking to pass the results to another function, or even to another application, such as Excel, it is better to retrieve the Value property for calculation, and then the Format_String property which can be applied once all of the calculations are finished. We can also define server-side colours and fonts which can be used for exception reporting, for example, a different colour for negative values. These can be incorporated into the application and are a good example of basing the client-side format on the Business–layer rules.

42 Data Mining Sobald die Miningmodelle in eine Produktionsumgebung integriert wurden, stehen sie je nach Bedarf für zahlreiche Tasks zur Verfügung. Sie können u. a. folgende Tasks ausführen: Mithilfe der Modelle Vorhersagen erstellen, die für Geschäftsentscheidung herangezogen werden können. SQL Server stellt die DMX-Sprache zur Verfügung, die Sie zum Erstellen von Vorhersageabfragen verwenden können. Darüber hinaus unterstützt Sie der Generator für Vorhersagebabfragen beim Erstellen der Abfragen. Data Mining-Funktionen in eine Anwendung integrieren. Sie können Analysis Management Objects (AMO) hinzufügen oder ein Assembly mit mehreren Objekten einbetten. Mit diesen Objekten kann Ihre Anwendung Miningstrukturen und -modelle erstellen, ändern, verarbeiten und löschen. Alternativ können Sie XMLA-Nachrichten (XML for Analysis) direkt an eine Instanz von Analysis Services senden. Mit Integration Services ein Paket erstellen, in dem mithilfe eines Miningmodells eingehende Daten eigenständig aufgeteilt und mehreren Tabellen zugeordnet werden. Wenn eine Datenbank beispielsweise fortlaufend mit potenziellen Neukunden aktualisiert wird, können Sie ein Miningmodell zusammen mit Integration Services dazu verwenden, die eingehenden Daten zwei verschiedenen Kundengruppen zuzuordnen: Einer Gruppe, deren Kunden wahrscheinlich ein Produkt kaufen, und einer anderen, deren Kunden wahrscheinlich kein Produkt kaufen. Erstellen Sie einen Bericht, mit dem Abfragen direkt für ein vorhandenes Miningmodell ausgeführt werden können. The server has a number of formats which can be set up when the Cube is created. One property that can be returned from the CellSet is the Formatted Value property, which returns a rounded string. If you are looking to pass the results to another function, or even to another application, such as Excel, it is better to retrieve the Value property for calculation, and then the Format_String property which can be applied once all of the calculations are finished. We can also define server-side colours and fonts which can be used for exception reporting, for example, a different colour for negative values. These can be incorporated into the application and are a good example of basing the client-side format on the Business–layer rules.

43 Data Mining Microsoft SQL Server 2005 Analysis Services (SSAS) beinhaltet folgende Algorithmen: Microsoft Decision Trees-Algorithmus Microsoft Clustering-Algorithmus Microsoft Naive Bayes-Algorithmus Microsoft Association-Algorithmus Microsoft Sequence Clustering-Algorithmus Microsoft Time Series-Algorithmus Microsoft Neural Network-Algorithmus (SSAS) Microsoft Logistic Regression-Algorithmus Microsoft Linear Regression-Algorithmus The server has a number of formats which can be set up when the Cube is created. One property that can be returned from the CellSet is the Formatted Value property, which returns a rounded string. If you are looking to pass the results to another function, or even to another application, such as Excel, it is better to retrieve the Value property for calculation, and then the Format_String property which can be applied once all of the calculations are finished. We can also define server-side colours and fonts which can be used for exception reporting, for example, a different colour for negative values. These can be incorporated into the application and are a good example of basing the client-side format on the Business–layer rules.

44 Data Mining Naïve Bayes Decision Trees Clustering Time Series
Sequence Clustering Association Naïve Bayes Neural Net

45 Data Mining: Naïve Bayes
Einfaches und am einfachesten z implementierendes Modell Welches Attribut kann das Attribut am besten vorhersagen? Naïve Bayes is a simple model whose major purpose is to predict the behaviour based on single attributes. It is good as a first start but has several limitations and constraints.

46 Data Mining: Decision Tree
Welcher Attributbaum kann das Ergebnis am besten vorhersagen? Zusammenspiel zwischen Attributen. The Decision Tree algorithm is a more advanced version of Naïve Bayes which displays the relevance of particular attributes to the behaviour or purchasing power of the sample population, however it takes it slightly further by looking at the interplay between attributes. For example, Naïve Bayes may show that age has an importance, but Decision Tree may uncover that age is only important for males.

47 Data Mining: Cluster Welche Untergruppen sind in den Daten enthalten?
Wie verschieden sind die Untergruppen? Finde Muster ohne spezielles Ziel. The Cluster model tries to see how your customers form subgroups and how similar of different the groups are from one another. This is very useful for finding general patterns within the distribution. As an example, if you have four Vice Presidents within your company, you may decide to focus them on the four major groupings within your customer base.

48 Data Mining: Association
Ähnlich Cluster, aber mit Blick auf eine einzige Transaktion. Welche Produkte werden zusammen gekauft (Warenkorbanalyse)? The Association model is similar to the Cluster model but would be used to look for groupings within products for a single transaction. This is known as Market Basket analysis and can be used to determine, for example, whether a customer often buys a particular group of products together.

49 Data Mining: Sequence Cluster
Wie Cluster, aber mit Berücksichtigung einer Abfolge Welches Ereignis wird wahrscheinlich danach eintreten (Klickpfade)? Benötigt ein Attribut, um die Abfolge abzubilden. The Sequence Cluster model is like the Cluster model with the additional factor of sequence. It can be used to determine what is likely to be the next step in a sequence and is suited to Click-Stream analysis, i.e. the routes that customers may take when navigating through an e-commerce site.

50 Data Mining: Time Series
Welche Trends sind vorhanden? Wie interagieren Trends miteinander? Benötigt ein zeitbasiertes Attribut (Vorschau). Time Series is effectively trend analysis. We can view how trends are occurring within the data but also how trends interact with each other. We may see that the performance of one attribute over time has parallel behaviour with another attribute.

51 Data Mining: Neural Net
Erstellt eine mehrschichtige Netzwerk von Neuronen Wie ein Entscheidungsbaum, aber mit dreidimensionaler Knotenstruktur The Neural Net model is similar to the Decision Tree model but operates in three dimensions. It attempts to emulate the behaviour of the brain and looks at the flow of data and relationships though the ‘pipes’ connecting the nodes.

52 Analysis Services-Objekte
Datenquellen: Datenquelle in Analysis Services. Datenquellensichten: ein logisches Datenmodell, das auf mindestens einer Datenquelle in Analysis Services basiert. Cubes: Cubes und Cubeobjekte, einschließlich Measures, Measuregruppen, Dimensionsverwendungbeziehungen, Berechnungen, Key Performance Indicators (KPIs), Aktionen, Übersetzungen, Partitionen und Perspektiven. Dimensionen: Dimensionen und Dimensionsobjekte, einschließlich Attribute, Attributbeziehungen, Hierarchien, Ebenen und Elemente. Miningstrukturen: Miningstrukturen und Miningobjekte, einschließlich Miningmodellen. Rollen: eine Rolle, den Sicherheitsmechanismus, der zum Steuern des Zugriffs auf Objekte in Analysis Services verwendet wird. Assemblys: eine Auflistung von benutzerdefinierten Funktionen, die zum Erweitern der Sprachen MDX und DMX in Analysis Services verwendet werden. The server has a number of formats which can be set up when the Cube is created. One property that can be returned from the CellSet is the Formatted Value property, which returns a rounded string. If you are looking to pass the results to another function, or even to another application, such as Excel, it is better to retrieve the Value property for calculation, and then the Format_String property which can be applied once all of the calculations are finished. We can also define server-side colours and fonts which can be used for exception reporting, for example, a different colour for negative values. These can be incorporated into the application and are a good example of basing the client-side format on the Business–layer rules.

53 Fragen...


Herunterladen ppt "Architektur und Verwendung"

Ähnliche Präsentationen


Google-Anzeigen