Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente Datenanalysen (Predictive Analytics, Unterschiede zu klassischen.

Ähnliche Präsentationen


Präsentation zum Thema: "Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente Datenanalysen (Predictive Analytics, Unterschiede zu klassischen."—  Präsentation transkript:

1

2 Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente Datenanalysen (Predictive Analytics, Unterschiede zu klassischen BI-Lösungen, Enterprise Performance Management) KXEN Life-Demo F & A (Proof-of-Value für IUG-Mitglieder )

3 Legacy data web Data Warehouse RDBMS Data Mart We (take) care about your INFORMATION! Software Engineering (> 15 Jahre) Daten-Management (> 10 Jahre) Intelligente Datenanalysen (> 7 Jahre) (Data Mining) Produkte seit 1998 im deutschsprachigen Raum eingeführt (Deutsche Telekom, AOL Deutschland, ABB, Fraunhofer Institut, Gruner + Jahr...)

4 Gründung im Juli 1998 Gründung im Juli 1998 Firmensitz in San Francisco, R&D in Frankreich Firmensitz in San Francisco, R&D in Frankreich Erfahrenes Management Team Erfahrenes Management Team R. Haddad (CEO), E. Marcade (CTO), M. Bera (CSO), J. Gerault (CFO) Aktiver wissenschaftlicher Beirat Aktiver wissenschaftlicher Beirat Vladimir Vapnik, Gregory Piatetsky-Shapiro, Gilbert Saporta, Yann Le Cun, Bernhard Schölkopf u.a. KXEN Analytic Framework in 3. Version KXEN Analytic Framework in 3. Version 400+ Kunden setzen KXEN produktiv ein 400+ Kunden setzen KXEN produktiv ein Partner: SAP, Cognos, BO, Teradata, SPSS u.a. Partner: SAP, Cognos, BO, Teradata, SPSS u.a. Gründung im Juli 1998 Gründung im Juli 1998 Firmensitz in San Francisco, R&D in Frankreich Firmensitz in San Francisco, R&D in Frankreich Erfahrenes Management Team Erfahrenes Management Team R. Haddad (CEO), E. Marcade (CTO), M. Bera (CSO), J. Gerault (CFO) Aktiver wissenschaftlicher Beirat Aktiver wissenschaftlicher Beirat Vladimir Vapnik, Gregory Piatetsky-Shapiro, Gilbert Saporta, Yann Le Cun, Bernhard Schölkopf u.a. KXEN Analytic Framework in 3. Version KXEN Analytic Framework in 3. Version 400+ Kunden setzen KXEN produktiv ein 400+ Kunden setzen KXEN produktiv ein Partner: SAP, Cognos, BO, Teradata, SPSS u.a. Partner: SAP, Cognos, BO, Teradata, SPSS u.a.

5 Operational Systems Break Even ROI (%) Negative Returns Positive Returns Time (Years) Business Intelligence Predictive Analytics Cumulative ROI Source: Jack Noonan, komplementäre Bereiche eines modernen analytischen Unternehmens

6 UNDERSTAND  Customer Satisfaction  Product Revenue  Cost of Goods Sold  HR Turnover UNDERSTAND  Customer Satisfaction  Product Revenue  Cost of Goods Sold  HR Turnover Business Intelligence OLAP Data Quality Query/Report Data Warehouse Predictive Analytics Recommendations Scoring Data Mining OPTIMIZE ROI Analysis Customer Retention Promotions Demand Planning Quality Improvement OPTIMIZE ROI Analysis Customer Retention Promotions Demand Planning Quality Improvement ENABLE  Customer Interaction  Inventory Control  Supply Chain Mgmt  Quality Measurement  Employee Self Service ENABLE  Customer Interaction  Inventory Control  Supply Chain Mgmt  Quality Measurement  Employee Self Service Operational Systems ERP ERM WEB CRM Source: Jack Noonan, 2002 Ein modernes analytisches Unternehmen entsteht aus 3 komplementären Bereichen

7 Intelligente Datenanalysen (1)

8 Intelligente Datenanalysen (2)

9 Intelligente Datenanalysen (3)

10 Intelligente Datenanalysen (4) Kündiger-Indikatoren (nach Relevanz)

11 Intelligente Datenanalysen (5)

12 Intelligente Datenanalysen (6)

13 Intelligente Datenanalysen (7)

14 Was sind Daten-Analysen? Konzept Technologie Beispiel Manual Data Exploration Manual Data Exploration Data Cubes Kündiger-Historie per Quartal und Region Kündiger-Historie per Quartal und Region OLAP Data Aggregation and Summarization Data Aggregation and Summarization SQL, Spreadsheets SQL, Spreadsheets Kündiger-Historie quartalsweise Kündiger-Historie quartalsweise Query und Reporting Data Prediction Classification, Regression Classification, Regression Kündigungs- Wahrscheinlichkeit für jeden einzelnen Kunden und eine Erklärung “warum” Kündigungs- Wahrscheinlichkeit für jeden einzelnen Kunden und eine Erklärung “warum” Predictive Modeling Automated Data Exploration Automated Data Exploration Clustering, Associations Clustering, Associations Charakteristika von “Kündigern” und “Nicht-Kündigern” Charakteristika von “Kündigern” und “Nicht-Kündigern” Descriptive Modeling

15 Reporting OLAP Statistics Predictive Analytics Predictive Analytics Production Modeling Production Modeling Embedded Modeling Embedded Modeling Exploratory Modeling Exploratory Modeling Cognos, BO, Hyperion KXEN SAS, SPSS u.a. Anzahl Variablen Analytics Klassifikation von Daten-Analysen

16 Marketing Beispiel einer Cross-selling Analyse Transaktionen Q2-> Q Q4 Kunden Informationen Analyze Mitarbeiter APPLY

17 Komplexität ( Guru Faktor) Komplexität ( Guru Faktor) Traditionelle Statistik-/Data Mining Applikationen erfordern sehr hohen Skill-Level Traditionelle Statistik-/Data Mining Applikationen erfordern sehr hohen Skill-Level (Vor-) Auswahl der Kriterien/Variablen ist sehr aufwendig und nicht trivial (Vor-) Auswahl der Kriterien/Variablen ist sehr aufwendig und nicht trivial Zuverlässigkeit der Ergebnisse bzgl. zukünftiger Daten/Vorgänge ist entscheidend Zuverlässigkeit der Ergebnisse bzgl. zukünftiger Daten/Vorgänge ist entscheidend Komplexität ( Guru Faktor) Komplexität ( Guru Faktor) Traditionelle Statistik-/Data Mining Applikationen erfordern sehr hohen Skill-Level Traditionelle Statistik-/Data Mining Applikationen erfordern sehr hohen Skill-Level (Vor-) Auswahl der Kriterien/Variablen ist sehr aufwendig und nicht trivial (Vor-) Auswahl der Kriterien/Variablen ist sehr aufwendig und nicht trivial Zuverlässigkeit der Ergebnisse bzgl. zukünftiger Daten/Vorgänge ist entscheidend Zuverlässigkeit der Ergebnisse bzgl. zukünftiger Daten/Vorgänge ist entscheidend Zeit und Kosten Zeit und Kosten Ergebnisse erzeugen mit traditionellen Verfahren/Tools beansprucht Wochen Ergebnisse erzeugen mit traditionellen Verfahren/Tools beansprucht Wochen Experten verwenden 60-90% ihrer Zeit für die Datenvorbereitung Experten verwenden 60-90% ihrer Zeit für die Datenvorbereitung Web logs (als Datengeneratoren) müssen evaluiert werden - real time Web logs (als Datengeneratoren) müssen evaluiert werden - real time Zeit und Kosten Zeit und Kosten Ergebnisse erzeugen mit traditionellen Verfahren/Tools beansprucht Wochen Ergebnisse erzeugen mit traditionellen Verfahren/Tools beansprucht Wochen Experten verwenden 60-90% ihrer Zeit für die Datenvorbereitung Experten verwenden 60-90% ihrer Zeit für die Datenvorbereitung Web logs (als Datengeneratoren) müssen evaluiert werden - real time Web logs (als Datengeneratoren) müssen evaluiert werden - real time Geschwindigkeit (Umsetzung in Geschäftsprozesse) Geschwindigkeit (Umsetzung in Geschäftsprozesse) In kurzen Zyklen sich verändernde Daten erfordern zeitgerechte Umsetzung In kurzen Zyklen sich verändernde Daten erfordern zeitgerechte Umsetzung Analytische Systeme duplizieren Daten, sind Resourcen-intensiv und schwer integrierbar Analytische Systeme duplizieren Daten, sind Resourcen-intensiv und schwer integrierbar Geschwindigkeit (Umsetzung in Geschäftsprozesse) Geschwindigkeit (Umsetzung in Geschäftsprozesse) In kurzen Zyklen sich verändernde Daten erfordern zeitgerechte Umsetzung In kurzen Zyklen sich verändernde Daten erfordern zeitgerechte Umsetzung Analytische Systeme duplizieren Daten, sind Resourcen-intensiv und schwer integrierbar Analytische Systeme duplizieren Daten, sind Resourcen-intensiv und schwer integrierbar Predictive Analytics für jedermann? Nur wenige Projekte rechtfertigten Einsatz/Kosten von traditionellen Verfahren/Tools Oft wurden (wenige) Modelle umgesetzt und Jahre lang (unverändert) genutzt

18 Traditioneller Data Mining Ansatz 3 Weeks Select Variables Understand Business Question Apply Prepare Data Build Model Test Model Our company builds hundreds of predictive models in the same time we used to build one. KXEN allows us to save millions of dollars with more effective campaigns Financial Industry Customer Our company builds hundreds of predictive models in the same time we used to build one. KXEN allows us to save millions of dollars with more effective campaigns Financial Industry Customer Traditionell KXEN Ansatz 3 Hours Business Question Build Model Understand Apply mit KXEN Was ist neu?

19 Structured Risk Minimization (SRM) Qualität: Wie gut beschreibt ein Modell ihre existierenden Daten? Wie gut beschreibt ein Modell ihre existierenden Daten? Zielerreichung durch Minimierung des Fehlers. Zielerreichung durch Minimierung des Fehlers.Zuverlässigkeit/Robustheit: Wie gut wird ein Modell zukünftige Daten vorhersagen? Wie gut wird ein Modell zukünftige Daten vorhersagen? Zielerreichung durch Minimierung der Unzuverlässigkeit. Zielerreichung durch Minimierung der Unzuverlässigkeit.Qualität: Wie gut beschreibt ein Modell ihre existierenden Daten? Wie gut beschreibt ein Modell ihre existierenden Daten? Zielerreichung durch Minimierung des Fehlers. Zielerreichung durch Minimierung des Fehlers.Zuverlässigkeit/Robustheit: Wie gut wird ein Modell zukünftige Daten vorhersagen? Wie gut wird ein Modell zukünftige Daten vorhersagen? Zielerreichung durch Minimierung der Unzuverlässigkeit. Zielerreichung durch Minimierung der Unzuverlässigkeit. Fehler Risiko Modell-Komplexität Bestes Modell Gesamtrisiko Unzuverlässigkeit

20 SRM = Qualität + Zuverlässigkeit + Geschwindigkeit SRM erspart 3 entscheidende Schritte SRM erspart 3 entscheidende Schritte Nutzung aller verfügbaren Variablen Nutzung aller verfügbaren Variablen Automatisierte Datenvorbereitung Automatisierte Datenvorbereitung Variablen-Decodierung – Nominal, Ordinal, Continuous Variablen-Decodierung – Nominal, Ordinal, Continuous Handling von Fehlwerten Handling von Fehlwerten Erkennen von Ausreisserwerten Erkennen von Ausreisserwerten Zieloptimierte Gruppierung – Sinnvolle Wertebereiche Zieloptimierte Gruppierung – Sinnvolle Wertebereiche Ereignisbezogene Aggregation – Zeit, Wert, Sequenz Ereignisbezogene Aggregation – Zeit, Wert, Sequenz Automatisierter Modell-Test Automatisierter Modell-Test SRM erspart 3 entscheidende Schritte SRM erspart 3 entscheidende Schritte Nutzung aller verfügbaren Variablen Nutzung aller verfügbaren Variablen Automatisierte Datenvorbereitung Automatisierte Datenvorbereitung Variablen-Decodierung – Nominal, Ordinal, Continuous Variablen-Decodierung – Nominal, Ordinal, Continuous Handling von Fehlwerten Handling von Fehlwerten Erkennen von Ausreisserwerten Erkennen von Ausreisserwerten Zieloptimierte Gruppierung – Sinnvolle Wertebereiche Zieloptimierte Gruppierung – Sinnvolle Wertebereiche Ereignisbezogene Aggregation – Zeit, Wert, Sequenz Ereignisbezogene Aggregation – Zeit, Wert, Sequenz Automatisierter Modell-Test Automatisierter Modell-Test Select Variables Prepare Data Build Model Test Model

21 Die analytische Lücke Modeling Data Prediction 5 Statisticians10 Questions OLAP Manual Data Exploration Query & Reporting Data Aggregation and Summarization 10,000’s Business Users 10,000’s Questions

22 KXEN Enterprise Modeling Production Modeling Data Prediction 550 Exploratory Modeling Automatic Data Exploration 100’s Users1,000’s Questions Embedded Modeling Analytics are part of Enterprise Applications 10,000’s Business Users 10,000’s Questions

23 KXEN-Integration ins gesamte Unternehmen Kiosk Web Phone POS Call Center Mail Exploratory Models Exploratory Models Production Models Production Models Outbound Product Recom- mendation Product Recom- mendation Cross-sell Up-sell Campaign Managem. Campaign Managem. Feedback Order Churn Prevention Churn Prevention Fraud Detection Fraud Detection Risk Analysis Risk Analysis Demand Forecast Demand Forecast Channel Optimizat. Channel Optimizat. Inbound Data Warehouse Data Warehouse External Data External Data Offer Lifestyle Life-stage Lifestyle Life-stage Segmen- tation Segmen- tation Lifetime Valuation Lifetime Valuation Customer Touch- Points Example: CRM

24 KXEN Analytic Framework Data Manipulation Data Manipulation Data Preparation Data Preparation Data Modeling Data Modeling Model Deployment Model Deployment Production Data Access Data Access Consistent Coder K2C Consistent Coder K2C Event Log KEL Event Log KEL Sequence Coder KSC Sequence Coder KSC Time Series KTS Time Series KTS Robust Regression K2R Robust Regression K2R Smart Segmenter K2S Smart Segmenter K2S Model Export KMX Model Export KMX ScoringScoring C, JAVA, VB, SAS, HTML, XML … C, JAVA, VB, SAS, HTML, XML … SQL UDF PMML JAVA … SQL UDF PMML JAVA … REPORT Exploration Association Rules KAR Association Rules KAR RDBMS Oracle, Teradata, DB/2, MS, IBM Informix... Text Files csv, txt, tab … Native SAP BW, SAS, SPSS, Excel …

25 LIFE DEMO - American Census Business Case: Business Case: Who in my dB is earning more than $50K and what are the important criteria? Available Information: –UCI University –International Benchmark Dataset: – Records –15 attributes –24% of responders Available Information: –UCI University –International Benchmark Dataset: – Records –15 attributes –24% of responders

26 SearsWal-Mart Bottega Verde AC Nielsen Microsoft Europe ID Analytics Earthlink La Poste PowerGenPfizer Veolia Waters ebayNFOSearsWal-Mart Bottega Verde AC Nielsen Microsoft Europe ID Analytics Earthlink La Poste PowerGenPfizer Veolia Waters ebayNFO Handel u.a. E*Trade Washington Mutual JP Morgan Chase FidelityBarclays Lloyds TSB Société Générale Socredo Bank Austria Disbank Crédit Lyonnais Great Eastern Life InsuranceE*Trade Washington Mutual JP Morgan Chase FidelityBarclays Lloyds TSB Société Générale Socredo Bank Austria Disbank Crédit Lyonnais Great Eastern Life Insurance Finanzwesen AT&T Bell Canada Cingular China Telecom MCI Cox Com. PCS France Telecom OrangeSwisscomBelgacom Vodafone D2 WanadooAT&T Bell Canada Cingular China Telecom MCI Cox Com. PCS France Telecom OrangeSwisscomBelgacom Vodafone D2 Wanadoo Telekommunikation KXEN-Referenzen

27 F & A Proof of Value (PoV) für IUG-Mitglieder Aufgabenstellung definieren Termin vereinbaren PoV durchführen kostenfrei Aufwand: Std. Anruf ( ) oder genügt


Herunterladen ppt "Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente Datenanalysen (Predictive Analytics, Unterschiede zu klassischen."

Ähnliche Präsentationen


Google-Anzeigen