Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research Prof. Dr. Andreas Hilbert

Ähnliche Präsentationen


Präsentation zum Thema: "Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research Prof. Dr. Andreas Hilbert"—  Präsentation transkript:

1 Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research Prof. Dr. Andreas Hilbert hilbert@wiid.wiwi.tu-dresden.de http://wiid.wiwi.tu-dresden.de 01062 Dresden Telefon +49 351 463-32359 Telefax+49 351 463-32736 Rico Ludwig Chris Reiche Patrick Schwabe Ausgewählte Aspekte der BI: Projektseminar Endpräsentation Mat. Nr.: 3111685 Mat. Nr.: 3206958 Mat. Nr.: 3235860

2 Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research Endpräsentation Die Linusbank Allgemeine Marktübersicht Unternehmenssicht Problembeschreibung Projektplan Deskriptive Analyse Kundenwertkonzept Klassifikationsmodell Kampagnenauswertung

3 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 3 Die Linusbank Allgemeine Marktübersicht Höhere Preissensitivität Häufig 2 bis 4 Bankverbindungen Entwicklung kostenloser Girokonten: – 2000: gesamt: 6 % – 2005: gesamt: 10 % - 2 % Onlinekonten – 2010: gesamt 20 % - 19 % Onlinekonten Allgemeine Demografie am Markt: – 21 % jünger als 30 – 15 % älter als 70 Jahre – 19 % zwischen 40 und 49 – Andere Altersgruppen jeweils ca. 15 %

4 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 4 Die Linusbank Unternehmenssicht Mittelgroße Filialbank mit 500.000 Kunden 5 Produkte : Umfangreiches Data Warehouse mit historisierter Datenbasis Sowohl Online- als auch Filialgeschäft

5 Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research Endpräsentation Die Linusbank Problembeschreibung Was der Kunde sagt Was der Kunde will Projektplan Data Understanding Data Preparation Modeling

6 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 6 Problembeschreibung Was der Kunde sagt "Wir wollen den Produktbesitz und die Produktnutzung unserer Bestandskunden intensivieren, um dem Wettbewerbsdruck zu begegnen. Allerdings sind die Kosten unserer jeweils produktbezogenen Cross- und Up-Selling-Kampangen hoch, und zu häufig sollten die Kunden auch nicht angesprochen werden. Deshalb wollen wir mit unseren Kampagnen vorranging die wertvollsten Kunden adressieren. Leider können wir den Erfolg von Kampagnen nur schwer beurteilen. Anhand von Vergangenheitsdaten wissen wir, dass sich unsere Kunden hinsichtlich ihres Produktbesitzes, ihrer Produktnutzung sowie ihrer Reaktion auf Kampagnen zum Teil deutlich unterscheiden.

7 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 7 Problembeschreibung Was der Kunde will Kosten für Kampagnen sehr hoch Kunden nutzen wenige Produkte Keine Erfolgsmessung der Kampagnen Wertvolle Kunden unbekannt Ziele: – Kundenzufriedenheit und Bindung erhöhen – Wertvolle Kunden identifizieren – Kosten reduzieren – Erfolgsmessung für Marketingkampagnen einführen

8 Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research Endpräsentation Die Linusbank Problembeschreibung Projektplan Projektablauf Koordination der Projektarbeit Data Understanding Data Preparation Modeling Kampagnenauswertung

9 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 9 Projektplan Projektablauf Orientierung des Projektablaufes an den Phasen des CRISP-DM Einarbeitung in Bankgeschäft und Daten der Linusbank Festlegen der Teilziele für Projektablauf Erarbeiten von Kennzahlen auf Basis der vorhandenen Daten Evaluation der erstellten Modelle und ableiten von Handlungsempfehlungen

10 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 10 Projektplan Kooperation der Projektarbeit

11 Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research Endpräsentation … Projektplan Data Understanding Übersicht über vorhandene Daten Produktverteilung Produkterträge Kundenanalyse Kundenwertkonzept Data Preparation …

12 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 12 Deskriptive Analyse Übersicht über vorhandene Daten

13 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 13 Deskriptive Analyse Produktverteilung (gesamt) Girokonto hat größten Produktanteil Kredit nur vergleichsweise geringer Anteil Anteil für Riester und Sparen minimal

14 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 14 Deskriptive Analyse Produktverteilung (für Monat Juni)

15 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 15 Deskriptive Analyse Produktverteilung (für Monat Dezember)

16 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 16 Deskriptive Analyse Produktverteilung Deutliche Unterschiede in der Produktverteilung zwischen den Monaten Juni und Dezember erkennbar Zurückzuführen auf wirksame Marketingkampagnen Alle Informationen über erstes Halbjahr im Datensatz für Juni enthalten Juni - Datensatz stellt Basis unserer Annahmen und Berechnungen dar Später: Vergleich und Güteanalyse mit Daten des Dezembers

17 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 17 Deskriptive Analyse Produkterträge Riester und Kredit haben die höchsten Anteile an den Erträgen Zins, Giro und Depot vergleichsweise niedriger Ertragsanteil JahresertragLaufzeitertrag 530 1970 140 290 40 260 25 90 450 570

18 Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research Endpräsentation … Projektplan Data Understanding Übersicht über vorhandene Daten Produktverteilung Produkterträge Kundenanalyse Kundenwertkonzept Data Preparation …

19 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 19 Deskriptive Analyse Kundenanalyse Die absolute Zahl der Kunden, die 1, 2, 3, 4 oder 5 und mehr Produkte besitzen Die relativen Änderungen der Kunden mit einer bestimmten Anzahl an Produkten

20 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 20 Deskriptive Analyse Kundenanalyse Umsatzanalyse nach Monaten sowie Zahl der Kunden, die einen Vertrag abgeschlossen haben und Zahl der abgeschlossenen Verträge.

21 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 21 Deskriptive Analyse Kundenstruktur 1/2

22 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 22 Deskriptive Analyse Kundenstruktur 2/2 Mehr Filial- als Onlinekunden Kaum Unterschiede in der Altersstruktur im Vergleich Online/ Offline

23 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 23 Deskriptive Analyse Kundenwertkonzept Motivation: Banken besitzen nur beschränkte Ressourcen für Aktivitäten der Kundenbindung Ziel ist es Kundensegmente zu identifizieren, die den Einsatz dieser Ressourcen rechtfertigen Ermöglichung einer spezifischen Art der Betreuung von Bestandkunden und potenziellen Neukunden Ausschöpfung von Cross- & Up - Selling Potenzialen Mögliche Verfahren Qualitative Segmentierung ABC - Analysen Kunden - Deckungsbeitragsrechnung Kunden - Scoring - Modelle Kunden - Portfolio - Analyse Customer Lifetime Value

24 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 24 Deskriptive Analyse Kundenwertkonzept Kundenwert lässt sich über viele Faktoren bestimmen: Beziehungsdauer Kreditwürdigkeit Transaktionsvolumen Erwartete Kaufwahrscheinlichkeit für die Zukunft Generierter Umsatz Hohes Einkommen Durch welche Daten lassen sich solche Kunden erkennen? Kreditvolumen Kreditwürdigkeit Einlagen - Netto - Volumen Einlagenvolumen Saldo Girokonto Beziehungsdauer

25 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 25 Deskriptive Analyse Kundenwertkonzept Kunden unterteilen in A, B und C Kunden A Kunden sind wertvoll B Kunden haben keinen besonderen Wert, schädigen die Linusbank aber nicht C Kunden schädigen die Linusbank Einflussreiche Größen Produktnutzung_X --> X ist die Menge an Produkten, welche einen besonders hohen Anteil am Umsatz/Gewinn der Linusbank haben Dauer_X --> Gewichtungsfaktor für die wichtigsten X Produkte der Linusbank Anzahl_X --> Gewichtungsfaktor für die wichtigsten X Produkte der Linusbank Volumen_X --> Gewichtungsfaktor für die wichtigsten X Produkte der Linusbank Kreditwürdigkeit --> Risikominimierung Vermögensausprägung --> viel Vermögen bedeutet viel Kapital für die Linusbank Beziehungsdauer --> Zeichen für Loyalität Cross-Selling_Potenzial_X --> Möglichkeit der Aufwertung des Kunden durch Kampagnen

26 Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research Endpräsentation … Data Understanding Data Preparation Datenbereinigung Kundenwert Preparation … Modeling …

27 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 27 Data Preparation Datenbereinigung Ausschluss von "toten" Kunden, um eine saubere Datenbasis für die Folgemodelle zu erzeugen? – Nur bedingt sinnvoll, da diese Kunden durch die Kampagnen reaktiviert werden! – Denkbarer Nutzen etwa bei Assoziationsanalyse für den Warenkorb, wobei Konten-Tabelle nur Kunden enthält, die mindestens ein Produkt besitzen Modelle arbeiten fehlerhaft, aber der gezielte Ausschluss (klar definierter) wertloser Kunden ist fehlerfrei, sodass das Endmodell eine höhere Güte aufweist Normierung der Datensätze erforderlich, da Daten sowohl metrisch skaliert vorliegen (z. B. Kredithöhe oder Beziehungsdauer) oder nominal bzw. ordinal (z. B. Geschlecht, Familienstand, Kreditwürdigkeit) Verbindung der Datensätze über die Kundennummer möglich (jeder Kunde hat eine eindeutige Kundennummer)

28 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 28 Data Preparation Ausschluss von Datenmaterial Produktnutzung_Giro und Dauer_Giro beinhalten die gleichen Fakten Wenn die Produktnutzung = 0 ist auch die Dauer_Giro = 0 Daraus folgt, dass Dauer_Giro überflüssig ist ebenso bei Zins, Kredit, Riester, Depot, Kreditkarte, Sparkarte, Baufinanzierung Ausschluss von Kreditkarte, Baufinanzierung und Termingeld, Sparkarte laut Aufgabenstellung (keine adäquaten Daten)

29 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 29 Data Preparation Transformierung von Datensätzen Tabelle Konten und Kunden Verknüpfung der beiden Tabellen für jeden Monat mit den Informationen: – Beziehungsdauer – Alter – Vertriebskanal – Produktnutzungsdauer (Giro, Zins, Kredit, Riester, Depot, Sparkarte) Einteilung der Zeiten in Intervalle Nutzungsdauer: 0 Jahre 1-12: 1 Jahr 13-24: 2 Jahre 37-60: 3-5 Jahre ab 61: 6-10 Jahre Alter: bis 17: Minderjährig 18-29 30-39 40-49 50-59 ab 60 Beziehungsdauer: 0-3: Neukunde 3-12: 1 Jahr 13-24: 2 Jahre 25-60: 3-5 Jahre 51-120: 6-10 Jahre ab 121: mehr als 10 Jahre

30 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 30 Datapreparation Kundenwert Für eine erste Analyse genügt ein relativ einfacher Initialkundenwert, der auf Basis des Laufzeitertrags ermittelt wird. In weiteren Schritt kann anhand von den verschiedenen Prognosemodellen ein Score für jeden Kunden erzeugt werden, der in einen präziseren und feiner abgestimmten Kundenwert einfließt. Für die aktuelle Aufgabe genügt der Initialkundenwert. Kunden haben zu einem bestimmten Zeitpunkt ein eine Menge an Produkten mit unterschiedlichem Jahresertrag und Laufzeitertrag erworben Je nach Jahresertrag und Laufzeitertrag erzeugen diese Kunden einen höheren oder niedrigeren Umsatz Kunden werden anhand dieses Umsatzes in verschiedene Werte-Klassen eingeteilt

31 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 31 Datapreparation Kundenwert Hilfsmittel: ABC-Analyse Klassische ABC-Analyse gruppiert Kunden prozentual in Klassen ein, die einen bestimmten Umsatzanteil ausmachen jedoch in SQL extrem komplex zu implementieren Abgewandelter Algorithmus sortiert Kunden absteigend nach Umsatz und ordnet absolute Mengen in die Klassen ein, sodass die ersten 50.000 Kunden mit dem höchsten Umsatz Klasse A darstellen, die nächsten Kunden Klasse B usw. Die Mengen wurden so definiert, dass ca. 20% der Kunden (A und B) 80% des Umsatzes generieren

32 Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research Endpräsentation … Data Understanding Data Preperation Modeling Assoziationsanalyse Clusteranalyse Prognosemodelle …

33 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 33 Teil der Aufgabenstellung: Entwickeln Sie jeweils ein Produktbezogenes Data-Mining-Modell zur Prognose von Cross-Selling-Abschlüssen auf die Produkte Linuskredit, Linusdepot, Linusgiro, Linuszins und Linusriester. Ziel der Analyse Eindruck darüber gewinnen, welche Produkte häufig gemeinsam genutzt werden. Modeling Assoziationsanalyse

34 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 34 Assoziationsanalyse Vorbereitung der Daten für Assoziationsanalyse Benötigter Datensatz: – Konten Enthaltene Daten: – Kundennummer als ID – Produktnutzung (Kredit, Depot, Giro, Zins, Riester) binär 0 oder 1 – Vermögensausprägung (negativ, ausgeglichen, positiv) nominal -1, 0 oder 1 – Alter in 5 Stufen nominal – Kreditwürdigkeit (gut, schlecht, unbekannt) nominal – Beziehungsdauer – Kanal (Online, Filiale) binär

35 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 35 Assoziationsanalyse Der Datenfluss im Diagramm

36 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 36 Assoziationsanalyse Die Filtereinstellungen, um nicht zu berücksichtigende Produkte auszuschließen Weitere Einstellungen

37 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 37 Assoziationsanalyse Ergebnis Das Ergebnis der Analyse mit dem ermittelten Warenkorb. Hier zu sehen sind nur die Regeln, die auf der rechten Seite genau ein Ergebnis erzeugen.

38 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 38 Assoziationsanalyse Ergebnis II Überblick über alle erzeugten Regeln

39 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 39 Assoziationsanalyse Fazit Häufig zusammen gekauft werden Zins, Depot und Riester in allen möglichen Kombinationen. Macht Sinn, da alle drei Produkte im Kern Sparprodukte darstellen. Starken Lift erzeugen Riester-Produkte, die sowohl für Zins, als auch Zins Kombination mit Giro oder Depot häufig nachgefragt werden. Diese Produkte werden jedoch vergleichsweise selten verkauft. Handlungsmöglichkeiten: Kunden, die bereits ein oder mehrere Produkte besitzen, könnten entsprechend interessiert sein an den ermittelten Kombinationen. So bietet es sich an, Besitzer von Zins, die noch über kein Depot verfügen, ein Produktangebot vorzubereiten bzw. Depot-Besitzern auch Linuszins anzubieten.

40 Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research Endpräsentation … Data Understanding Data Preperation Modeling Assoziationsanalyse Clusteranalyse Prognosemodelle …

41 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 41 Modeling Clusteranalyse Teil der Aufgabenstellung: Entwickeln Sie jeweils ein Produktbezogenes Data-Mining-Modell zur Prognose von Cross-Selling-Abschlüssen auf die Produkte Linuskredit, Linusdepot, Linusgiro, Linuszins und Linusriester. Ziel der Analyse Eindruck über die Kundenstruktur gewinnen. Gibt es typische Nutzergruppen, die ähnliche Eigenschaften aufweisen?

42 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 42 Clusteranalyse Benötigter Datensatz: Kunden_binary200812 Enthaltene Daten: – Kundennummer als ID – Produktnutzung (Kredit, Depot, Giro, Zins, Riester) binär 0 oder 1 – Vermögensausprägung (negativ, ausgeglichen, positiv) nominal -1, 0 oder 1 – Alter in 5 Stufen nominal – Kreditwürdigkeit (gut, schlecht, unbekannt) nominal – Beziehungsdauer – Kanal (Online, Filiale) binär

43 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 43 Clusteranalyse Nachdem der Clusternode keine zufriedenstellenden Ergebnisse hervorbrachte, kam der SOM-/Kohonen-Node zum Einsatz. Vorgehen: Sampling-Node mit Simple-Random (12345) als Starteinstellung und 4x6 Clustern. Anschließend Beobachtung des Distance-Plots auf eine gleichmäßige Verteilung der Cluster und Prüfung der Clusterhäufigkeit in den Statistics. Schrittweise Reduzierung der Clusterzahl brachte bei 2x3 Clustern das erste gute Ergebnis, bei dem die Cluster gut verteilt waren und keine Häufung mehr auftrat. Als wichtige Variablen zeigt sich stets die Beziehungsdauer, die Vermögensausprägung, Giro, Depot, Zins, Kredit.

44 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 44 Clusteranalyse Der Datenfluss im Diagramm

45 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 45 Clusteranalyse Ergebnis der Clusteranalyse

46 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 46 Clusteranalyse Das Ergebnis der Analyse mit dem ermittelten Distanzgraphen.

47 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 47 Clusteranalyse Das Alter wurde nicht in die Cluster-Unterscheidung einbezogen.

48 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 48 Clusteranalyse Die Verteilung der Produkte auf die verschiedenen Cluster

49 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 49 Clusteranalyse Während Vermögensausprägung durchaus einen Einfluss hat, ist die Kreditwürdigkeit in allen Clustern gleich verteilt.

50 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 50 Clusteranalyse Fazit Es zeigen sich drei auffällige Cluster-Gruppierungen: So gibt es stets ein Cluster Kreditkunden, das einen erheblichen Anteil an Kreditkunden beinhaltet, die eine stark negative Vermögensausprägung aufweisen und eine mittlere Beziehungsdauer ab 3 Jahren erreichen. Die zweite Gruppe sind die Sparkunden mit positiver Vermögensausprägung, langer Bindungsdauer teils über 10 Jahre und allen drei Spar-Produkten Zins, Depot und Giro. Die dritte Gruppe umfasst die verbleibenden Cluster mit vorrangig ausgeglichenem Vermögen und häufig einem Girokonto oder Depot. Handlungsmöglichkeiten: Es lässt sich erkennen, dass im Cluster der Sparkunden die klassischen Sparprodukte häufig nachgefragt werden. Ein Ansatz wäre, Kunden zu finden, die ebenfalls vermögend sind, aber noch nicht alle Produkte besitzen. Zusätzlich ist eine Aktion denkbar, bei der Kunden, die alle Produkte besitzen, aber nur geringe Einlagen aufweisen, zusätzliches Geld überweisen, weil sie mit hoher Wahrscheinlichkeit noch woanders über Konten mit Spareinlagen verfügen.

51 Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research Endpräsentation … Modeling Assoziationsanalyse Clusteranalyse Prognosemodelle Standardprognosemodelle Giro Kredit Riester Zins Depot Scores Fazit

52 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 52 Modeling Prognosemodelle Teil der Aufgabenstellung: Entwickeln Sie jeweils ein produktbezogenes Data-Mining-Modell zur Prognose von Cross-Selling-Abschlüssen auf die Produkte linuskredit, linusdepot, linusgiro, linuszins und linusriester. Ziel der Modelle Klassifikation von Kunden, um Wahrscheinlichkeiten für Produktabschlüssen zu prognostizieren.

53 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 53 Modeling Vorbereitung der Daten für die Prognosemodelle Benötigte Datensätze: – Kundendaten_200806 – Kundendaten_200812 Transformationen: – Alter (nominal 5 Klassen) – Vermögensausprägung (ordinal -1 0 und 1) – Produktnutzung (binär für jedes Produkt) – Beziehungsdauer (nominal 5 Klassen) Kundenwert (Initialwert): – Klasse (nominal A bis E) – Umsatz (metrisch) Ausgangsdaten: – Kundennummer (id) – Alter (nominal 5 Klassen) – Kanal (binär) – Kreditwürdigkeit (nominal 3 Klassen) – Vermögensausprägung (ordinal -1 0 und 1) – Giro (binär) – Kredit (binär) – Riester (binär) – Zins (binär) – Depot (binär) – Beziehungsdauer (nominal 5 Klassen) – Klasse (nominal 5 Klassen) – Umsatz (interval 115-4365)

54 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 54 Erstellung von Standardprognosemodellen Vorgehen: – Aufgrund der Daten in Kundendaten_200806 Modelle entwicklen, welche Prognosen für Produktabschlüsse erstellen – Prognosen werden mit den tatsächlichen Daten aus Kundendaten_200812 verglichen und anhand der Misclassification Rate und dem Fehler zweiter Art bewertet – Um ein möglichst optimale Prognosemodelle zu erhalten werden zunächst drei Standardmodelle erstellt und davon das geeignetste weiter optimiert – Bevorzugt wird nach Möglichkeit der Entscheidungsbaum, da er viele positive Eigenschaften wie Verständlichkeit und hohe Performance besitzt – Ausschluss von Kundendaten, welche durch Kampagnen angesprochen wurden, um die Ergebnisse nicht zu verfälschen

55 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 55 Erstellung von Standardprognosemodellen Anlegen zwei parraleler Datenstränge für je Trainings bzw. Validierungsdaten aus Kundendaten_200806 und Testdaten aus Kundendaten_200812

56 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 56 Erstellung von Standardprognosemodellen Einstellungen "Umsatz" aus Datensatz ausschiessen, da indirekt im Kundenwert enthalten: "Anlegen von fünf Pfaden (mit je zwei Datenstängen) für jedes Produkt, Jeweiliges Produkt als Target definieren:

57 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 57 Erstellung von Standardprognosemodellen Einstellungen Künstliches Angleichen der Verteilung in den Target Variablen, um neutralen Trainigsdatensatz zu erhalten:

58 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 58 Erstellung von Standardprognosemodellen Einstellungen Datenstränge für Trainig, Validierung und Test aufteilen: Standardmodelle des Künstlichen Neuronalen Netzes, der Regresion und des Entscheidugnsbaums erstellen:

59 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 59 Erstellung von Standardprognosemodellen Vergleich Standartmodelle im Assesment-Node vergleichen: Besonders geeignetes Modell auswählen, welches weiter zu optimieren ist:

60 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 60 Optimierungen Wichtigstes Bewertungskriterium ist die Missclasifiation Rate im Testdatensatz und der Prozentuale Fehler zweiter Art Wenn alle Standartmodelle auf ähnlichen Niveau sind wird der Entscheidungsbaum versucht zu optimieren Wenn sich größere Abweichungen ergeben werden zusätzlich zum Entscheidungsbaum auch andere Modelle optimiert Optimierung Entscheidungsbaum: Absenkung es Signigikanzlevels im Chi-Quadrat Test, Absenkung der minimalen Beobachtungen je Blattkonten, Erhöhung der benötigten Beobachtungen für jede Split-Suche

61 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 61 Optimierungen Einstellungen Optimierungen Künstliches Neuronales Netz: Modelauswahl Kriterium auf Misclassification Rate ändern, Versteckte Neuronen erhöhen, direkte Verbindungen zulassen

62 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 62 Optimierungen Einstellungen Optimierungen Regression: Methode auf Backward ändern, Validation Misclassification als Kriterium wählen

63 Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research Endpräsentation … Modeling Assoziationsanalyse Clusteranalyse Prognosemodelle Standardprognosemodelle Giro Kredit Riester Zins Depot Scores Fazit

64 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 64 Prognosemodelle Giro Die Misclassifikation Rates im Testdatensatz stellen sich wie folgt zusammen: Neuronal Network: 0.0586713728 -Optimiert: 0.0597251027 -Verschlechterung um 0,1% Tree: 0.1738551315 -Optimiert: 0.1620013139 -Verbesserung um 1,2% Regression: 0.2132549094 Neuronales Netz ist bestes Modell, konnte aber nicht weiter optimiert werden. Entscheidungbaum konnte auch mit optimierungen nicht entsprechend verbessert werden Neuronales Netz wird als Prognosemodell für Grio genommen

65 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 65 Prognosemodelle Giro Fehler zweiter Art von 4,7%

66 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 66 Prognosemodelle Kredit Die Misclassifikation Rates im Testdatensatz stellen sich wie folgt zusammen: Neuronal Network: 0.0032127169 Tree: 0.0019142331 -Optimiert: 0.0014273017 -Verbesserung um 0,05% Regression: 0.003813008 Alle Modelle liegen nah beieinander auf sehr hohem Nivau Der Entscheidungsbaum konnte somit auch nicht mehr nennenswert optimiert werden. Optimierter Entscheidungsbaum wird als Prognosemodell für Kredit genommen

67 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 67 Prognosemodelle Kredit Sehr geringer Fehler zweiter Art von nur 0,8%

68 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 68 Prognosemodelle Kredit Entscheidungsregeln im optimierten Entscheidungsbaum

69 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 69 Prognosemodelle Riester Die Misclassifikation Rates im Testdatensatz stellen sich wie folgt zusammen: Neuronal Network: 0.2605778768 -Optimiert: 0.2564376715 -Verbesserung von 0,4% Tree: 0.3665022092 -Optimiert: 0.2368728181 -Verbesserung um 12,9% Regression: 0.2132549094 Entscheidungsbaum mit Abstand am schlechtesten Optimierungen bei anderen Modellen versprach kein Erfolg Optimierung bei Entscheidungsbaum verbessern Ergebnis signifikant, sodass Ergbnis vergleichbar wird mit den der anderen Modelle. optimierter Entscheidungsbaum wird als Prognosemodell für Riester genommen

70 Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research Endpräsentation … Modeling Assoziationsanalyse Clusteranalyse Prognosemodelle Standardprognosemodelle Giro Kredit Riester Zins Depot Scores Fazit

71 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 71 Prognosemodelle Riester extrem hoher Fehler zweiter Art von 47%

72 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 72 Prognosemodelle Riester Entscheidungsregeln im optimierten Entscheidungsbaum

73 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 73 Prognosemodelle Zins Die Misclassifikation Rates im Testdatensatz stellen sich wie folgt zusammen: Neuronal Network: 0.1646240451 Tree: 0.1215602417 -Optimiert: 0.1165543805 -Verbesserung um 0,5% Regression: 0.1986989398 Entscheidungsbaum ist per se schon sehr gut, konnte aber nicht signifikant optimiert werden. Optimierter Entscheidungsbaum wird als Prognosemodell für Zins genommen

74 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 74 Prognosemodelle Zins extrem hoher Fehler zweiter Art von 44%

75 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 75 Prognosemodelle Zins Entscheidungsregeln im optimierten Entscheidungsbaum

76 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 76 Prognosemodelle Depot Die Misclassifikation Rates im Testdatensatz stellen sich wie folgt zusammen: Neuronal Network: 0.0889100723 -Optimiert: 0.0765976632 -Verschlechterung von 1.2% Tree: 0.0921871981 -Optimiert: 0.0380347551 -Verbesserung von 5,4% Regression: 0.1226526169 Der Entscheidungsbaum ist ein guter Ausgangspunkt für das Modell und liefert optimiert, die besten Ergebnisse. optimierter Entscheidungsbaum wird als Prognosemodell für Depot genommen

77 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 77 Prognosemodelle Depot 6,9% Fehler zweiter Art

78 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 78 Prognosemodelle Depot Entscheidungsregeln im optimierten Entscheidungsbaum

79 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 79 Prognosemodelle Scores Extraktion der Scores: – Entscheidungsregeln der Modelle werden extrahiert und über einen SAS-Code in Prognosewahrscheinlichkeiten für Kunden zu dem jeweiligen Produkt gespeichert. – Aus dem Prognosewahrscheinlichketen und dem alten Kundenwert wird anschließend der neue Kundenwert berechnet

80 Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research Endpräsentation … Modeling Assoziationsanalyse Clusteranalyse Prognosemodelle Standardprognosemodelle Giro Kredit Riester Zins Depot Scores Kampangen - Management Fazit

81 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 81 Kampagnen - Management Grundsätzliche Arbeitsweise: Vergleich der durchschnittlichen Monatsumsätze für das beworbene Produkt und die gesamte Abschlussmenge Kundenbasis Wirkgruppe (nahm an Kampagne teil) und Kontrollgruppe (nahm nicht an Kampagne teil) Datenbasis: Kampagnen-Tabelle (Kundennummer, Name, Wirkgruppe, Abschluss) Konten-Tabelle (Kundennummer, Abschluss, Produkt) Produkt-Tabelle (Name, Laufzeitertrag)

82 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 82 Für eine Bewertung der Kampagne wird nun untersucht, ob die angeschriebenen Kunden im Verhältnis einen höheren Umsatz erzeugt haben als die Kunden, die nicht angeschrieben wurden (also die Kontrollgruppe). Dazu kann einmal der Gesamtumsatz betrachtet werden, zur besseren Deckungsbeitragsbewertung ist jedoch die Betrachtung des Umsatzes besser, der ausschließlich mit dem beworbenen Produkt erzielt wurde.

83 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 83 Kreditmailing - Vergleich Ermitteln der Anzahl der angeschriebenen Kunden für die Kampagne: Alle Kunden in Wirkgruppe=1 mit Kampagnename = Kreditmailing sind die Wirkgruppe (32.680 Kunden) Alle Kunden in Wirkgruppe=0 mit Kampagnename = Kreditmailing sind die Kontrollgruppe (3.610 Kunden) Für die Bewertung des Prognosemodells wurde ein Modell für Kredit auf Basis der Kundendaten mit Stand 200805 prognostiziert, wobei für dsa Training alle Kunden gefiltert wurden, die an Kampagnen teilgenommen haben. Die ermittelten Kunden mit einer Kreditkaufwahrscheinlichkeit werden anschließend nach Wahrscheinlichkeit gescored. Für eine Bewertung anhand der gemachten Kampagne wurden nur die Kunden angeschrieben, die sowohl in der Kampagne Kreditmailing aufgeführt waren als auch vom eigenen Prognosemodell als "Kaufkunden" bewertet wurden. Daraus ergibt sich eine Wirkgruppe mit 32183 Kunden. Die Kontrollgruppe bleibt gleich.

84 TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 84


Herunterladen ppt "Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research Prof. Dr. Andreas Hilbert"

Ähnliche Präsentationen


Google-Anzeigen