Allgemeine Marktübersicht Problembeschreibung Projektplan

Allgemeine Marktübersicht Problembeschreibung Projektplan
Die Linusbank Allgemeine Marktübersicht Unternehmenssicht Problembeschreibung Projektplan Deskriptive Analyse Kundenwertkonzept Klassifikationsmodell Kampagnenauswertung

Die Linusbank Allgemeine Marktübersicht
höhere Preissensitivität Häufig 2 bis 4 Bankverbindungen Entwicklung kostenloser Girokonten: 2000: gesamt: 6 % 2005: gesamt: 10 % - 2 % Onlinekonten 2010: gesamt 20 % - 19 % Onlinekonten Allgemeine Demografie am Markt: 21 % jünger als 30 15 % älter als 70 Jahre 19 % zwischen 40 und 49 andere Altersgruppen jeweils ca. 15 %

Die Linusbank Unternehmenssicht
mittelgroße Filialbank mit Kunden 5 Produkte : umfangreiches Data Warehouse mit historisierter Datenbasis sowohl Online- als auch Filialgeschäft

Die Linusbank Problembeschreibung Was der Kunde sagt Projektplan
Was der Kunde will Projektplan Data Understanding Data Preparation Modeling

Problembeschreibung Was der Kunde sagt
"Wir wollen den Produktbesitz und die Produktnutzung unserer Bestandskunden intensivieren, um dem Wettbewerbsdruck zu begegnen. Allerdings sind die Kosten unserer jeweils produktbezogenen Cross- und Up-Selling-Kampangen hoch, und zu häufig sollten die Kunden auch nicht angesprochen werden. Deshalb wollen wir mit unseren Kampagnen vorranging die wertvollsten Kunden adressieren. Leider können wir den Erfolg von Kampagnen nur schwer beurteilen. Anhand von Vergangenheitsdaten wissen wir, dass sich unsere Kunden hinsichtlich ihres Produktbesitzes, ihrer Produktnutzung sowie ihrer Reaktion auf Kampagnen zum Teil deutlich unterscheiden.“

Problembeschreibung Was der Kunde will
Kosten für Kampagnen sehr hoch Kunden nutzen wenige Produkte Keine Erfolgsmessung der Kampagnen Wertvolle Kunden unbekannt Ziele: Kundenzufriedenheit und Bindung erhöhen Wertvolle Kunden identifizieren Kosten reduzieren Erfolgsmessung für Marketingkampagnen einführen

Die Linusbank Problembeschreibung Projektplan Data Understanding
Projektablauf Koordination der Projektarbeit Data Understanding Data Preparation Modeling Kampagnenauswertung

Projektplan Projektablauf
Orientierung des Projektablaufes an den Phasen des CRISP-DM Einarbeitung in Bankgeschäft und Daten der Linusbank Festlegen der Teilziele für Projektablauf Erarbeiten von Kennzahlen auf Basis der vorhandenen Daten Evaluation der erstellten Modelle und ableiten von Handlungsempfehlungen

Projektplan Kooperation der Projektarbeit

… Projektplan Data Understanding Data Preparation
Übersicht über vorhandene Daten Produktverteilung Produkterträge Kundenanalyse Kundenwertkonzept Data Preparation

Deskriptive Analyse Übersicht über vorhandene Daten

Deskriptive Analyse Produktverteilung (gesamt)
Girokonto hat größten Produktanteil Kredit nur vergleichsweise geringer Anteil Anteil für Riester und Spaern minimal

Deskriptive Analyse Produktverteilung (für Monat Juni)

Deskriptive Analyse Produktverteilung (für Monat Dezember)

Deskriptive Analyse Produktverteilung
Deutliche Unterschiede in der Produktverteilung zwischen den Monaten Juni und Dezember erkennbar Zurückzuführen auf wirksame Marketingkampagnen Alle Informationen über erstes Halbjahr im Datensatz für Juni enthalten Juni - Datensatz stellt Basis unserer Annahmen und Berechnungen dar Später: Vergleich und Güteanalyse mit Daten des Dezembers

Deskriptive Analyse Produkterträge
Riester und Kredit haben die höchsten Anteile an den Erträgen Zins, Giro und Depot vergleichsweise niedriger Ertragsanteil Jahresertrag Laufzeitertrag 530 1970 140 290 40 260 25 90 450 570

… Projektplan Data Understanding Data Preparation
Übersicht über vorhandene Daten Produktverteilung Produkterträge Kundenanalyse Kundenwertkonzept Data Preparation

Deskriptive Analyse Kundenanalyse
Die absolute Zahl der Kunden, die 1, 2, 3, 4 oder 5 und mehr Produkte besitzen Die relativen Änderungen der Kunden mit einer bestimmten Anzahl an Produkten

Deskriptive Analyse Kundenanalyse
Umsatzanalyse nach Monaten sowie Zahl der Kunden, die einen Vertrag abgeschlossen haben und Zahl der abgeschlossenen Verträge.

Deskriptive Analyse Kundenstruktur 1/2

Deskriptive Analyse Kundenstruktur 2/2
Mehr Filial- als Onlinekunden Kaum Unterschiede in der Altersstruktur im Vergleich Online/ Offline

Deskriptive Analyse Kundenwertkonzept
Motivation: Banken besitzen nur beschränkte Ressourcen für Aktivitäten der Kundenbindung Ziel ist es Kundensegmente zu identifizieren, die den Einsatz dieser Ressourcen rechtfertigen Ermöglichung einer spezifischen Art der Betreuung von Bestandkunden und potenziellen Neukunden Ausschöpfung von Cross- & Up - Selling Potenzialen Mögliche Verfahren Qualitative Segmentierung ABC - Analysen Kunden - Deckungsbeitragsrechnung Kunden - Scoring - Modelle Kunden - Portfolio - Analyse Customer Lifetime Value

Kundenwert lässt sich über viele Faktoren bestimmen: Beziehungsdauer Kreditwürdigkeit Transaktionsvolumen erwartete Kaufwahrscheinlichkeit für die Zukunft generierter Umsatz Hohes Einkommen Durch welche Daten lassen sich solche Kunden erkennen? Kreditvolumen (VOLUMEN_KREDIT) Einalgen - Netto - Volumen Einlagenvolumen Saldo Girokonto

Kunden unterteilen in A, B und C Kunden A Kunden sind wertvoll B Kunden haben keinen besonderen Wert, schädigen die Linusbank aber nicht C Kunden schädigen die Linusbank Einflussreiche Größen Produktnutzung_X --> X ist die Menge an Produkten, welche einen besonders hohen Anteil am Umsatz/Gewinn der Linusbank haben Dauer_X --> Gewichtungsfaktor für die wichtigsten X Produkte der Linusbank Anzahl_X --> Gewichtungsfaktor für die wichtigsten X Produkte der Linusbank Volumen_X --> Gewichtungsfaktor für die wichtigsten X Produkte der Linusbank Kreditwürdigkeit --> Risikominimierung Vermögensausprägung --> viel Vermögen bedeutet viel Kapital für die Linusbank Beziehungsdauer --> Zeichen für Loyalität Cross-Selling_Potenzial_X --> Möglichkeit der Aufwertung des Kunden durch Kampagnen

… Data Understanding Data Preparation Datenbereinigung Modeling
Kundenwert Preparation Modeling

Data Preparation Datenbereinigung
Ausschluss von "toten" Kunden, um eine saubere Datenbasis für die Folgemodelle zu erzeugen? Nur bedingt sinnvoll, da diese Kunden durch die Kampagnen reaktiviert werden! Denkbarer Nutzen etwa bei Assoziationsanalyse für den Warenkorb, wobei Konten-Tabelle nur Kunden enthält, die mindestens ein Produkt besitzen Modelle arbeiten fehlerhaft, aber der gezielte Ausschluss (klar definierter) wertloser Kunden ist fehlerfrei, sodass das Endmodell eine höhere Güte aufweist Normierung der Datensätze erforderlich, da Daten sowohl metrisch skaliert vorliegen (z. B. Kredithöhe oder Beziehungsdauer) oder nominal bzw. ordinal (z. B. Geschlecht, Familienstand, Kreditwürdigkeit) Verbindung der Datensätze über die Kundennummer möglich (jeder Kunde hat eine eindeutige Kundennummer)

Data Preparation Ausschluss von Datenmaterial
Produktnutzung_Giro und Dauer_Giro beinhalten die gleichen Fakten: Wenn die Produktnutzung = 0 ist auch die Dauer_Giro = 0 Daraus folgt, dass Dauer_Giro überflüssig ist ebenso bei Giro, Zins, Kredit, Riester, Depot, Kreditkarte, Sparkarte, Baufinanzierung Ausschluss von Kreditkarte, Baufinanzierung und Termingeld, Sparkarte laut Aufgabenstellung (keine adäquaten Daten)

Data Preparation Transformierung von Datensätzen
Tabelle Konten und Kunden Verknüpfung der beiden Tabellen für jeden Monat mit den Informationen: Beziehungsdauer Alter Vertriebskanal Produktnutzungsdauer (Giro, Zins, Kredit, Riester, Depot, Sparkarte) Einteilung der Zeiten in Intervalle Nutzungsdauer: 0 Jahre 1-12: 1 Jahr 13-24: 2 Jahre 37-60: 3-5 Jahre ab 61: 6-10 Jahre Alter: bis 17: Minderjährig ab 60 Beziehungsdauer: 0-3: Neukunde 3-12: 1 Jahr 13-24: 2 Jahre 25-60: 3-5 Jahre : 6-10 Jahre ab 121: mehr als 10 Jahre

Data Preparation Transformierung in Intervalle mittels SQL
proc sql; /* - Transformation der Intervall-Daten Alter, Beziehungsdauer in diskrete nominale Intervalle - Speicherung von Produkt-Nutzung - Filterung von Minderjaehrigen Kunden */ drop table altranbi.kunden_binary200812; create table altranbi.kunden_binary as select d.kundennummer ,case when d.alter < 18 then ' minderjaehrig ' when d.alter >= 18 and d.alter < 30 then ' ' when d.alter >= 30 and d.alter < 40 then ' ' when d.alter >= 40 and d.alter < 50 then ' ' when d.alter >= 50 and d.alter < 60 then ' ' else ' ab 60' end as Alter ,d.vertriebskanal as Kanal ,d.kreditwuerdigkeit ,case vermoegensauspraegung when '2 -50 bis -25 Tsd.' then -1 when '3 -25 bis -10 Tsd.' then -1 when '4 -10 bis -5 Tsd.' then -1 when '5 -5 bis -2,5 Tsd.' then -1 when '6 2,5 bis -1 Tsd.' then 0 when '7 -1 bis 0,25 Tsd.' then 0 when '9 0 Volumen' then 0 when 'A 0 bis 0,25 Tsd.' then 0 when 'B 0,25 bis 1 Tsd.' then 0 when 'C 1 bis 2,5 Tsd.' then 0 when 'D 2,5 bis 5 Tsd.' then 0 when 'E 5 bis 10 Tsd.' then 1 when 'F 10 bis 25 Tsd.' then 1 when 'G 25 bis 50 Tsd.' then 1 when 'H ab 50 Tsd.' then 1 else 0 end AS vermoegensauspraegung ,case d.produktnutzung_giro when 'G' then 1 else 0 end as Giro ,case d.produktnutzung_kredit when 'K' then 1 else 0 end as Kredit ,case d.produktnutzung_riester when 'R' then 1 else 0 end as Riester ,case d.produktnutzung_zins when 'T' then 1 else 0 end as Zins ,case d.produktnutzung_depot when 'D' then 1 else 0 end as Depot ,case when d.beziehungsdauer <= 3 then ' Neukunde ' when d.beziehungsdauer >= 4 and d.beziehungsdauer < 12 then ' 1 ' when d.beziehungsdauer >= 13 and d.beziehungsdauer < 24 then ' 2 ' when d.beziehungsdauer >= 25 and d.beziehungsdauer < 60 then ' 3-5 ' when d.beziehungsdauer >= 61 and d.beziehungsdauer < 120 then ' 6-10 ' else ' Mehr als 10 Jahre' end as Beziehungsdauer from altranbi.kundendaten_ d where d.alter >= 18; run;

Datapreparation Kundenwert
Für eine erste Analyse genügt ein relativ einfacher Kundenwert, der auf Basis des generierten Umsatzes ermittelt wird. In weiteren Schritt kann anhand von Prognosemodellen ein Score für jeden Kunden erzeugt werden, der in einen präziseren und feiner abgestimmten Kundenwert einfließt. Für die aktuelle Aufgabe genügt jedoch der einfache Kundenwert in Umsatzklassen. Kunden haben zu einem bestimmten Zeitpunkt ein eine Menge an Produkten mit unterschiedlichem Jahresertrag und Laufzeitertrag erworben Je nach Jahresertrag und Laufzeitertrag erzeugen diese Kunden einen höheren oder niedrigeren Umsatz Kunden werden anhand dieses Umsatzes in verschiedene Werte-Klassen eingeteilt

Datapreparation Kundenwert
Hilfsmittel: ABC-Analyse Klassische ABC-Analyse gruppiert Kunden prozentual in Klassen ein, die einen bestimmten Umsatzanteil ausmachen jedoch in SQL extrem komplex zu implementieren Abgewandelter Algorithmus sortiert Kunden absteigend nach Umsatz und ordnet absolute Mengen in die Klassen ein, sodass die ersten Kunden mit dem höchsten Umsatz Klasse A darstellen, die nächsten Kunden Klasse B usw. Daten auswählen, anhand wir den Wert berechnen können (in Datensatz schauen) Modell aufbauend auf den Parametern erstellen

Data Preparation Kundenwertgenerierung mittels SQL
proc sql; /* Berechne die Umsaetze fuer die Kunden im Monat Dezember */ DROP TABLE altranbi.kundenwert_200812; CREATE table altranbi.kundenwert_ AS SELECT sum(p.laufzeitertrag) + sum(p.jahresertrag) AS Umsatz , k.kundennummer , Gesamtumsatz , Gesamtkunden , Avg_Umsatz_je_Kunde , a.Abschluss FROM altranbi.produkte p JOIN altranbi.konten k ON lower(k.produkt) = lower(p.name) CROSS JOIN ( SELECT sum(laufzeitertrag+jahresertrag) AS Gesamtumsatz , count(DISTINCT kundennummer) AS Gesamtkunden , sum(laufzeitertrag+jahresertrag) / count(DISTINCT kundennummer) AS Avg_Umsatz_je_Kunde , Abschluss FROM altranbi.produkte p JOIN altranbi.konten k ON lower(k.produkt) = lower(p.name) WHERE Abschluss = GROUP BY k.Abschluss ) a GROUP BY k.kundennummer; reset outobs=10000; /* Ordne den Kundendaten die passenden Umsaetze zu */ /* A KUNDEN */ DROP TABLE altranbi.a_kunden; CREATE TABLE altranbi.a_kunden AS SELECT kundennummer, Umsatz FROM altranbi.kundenwert_ k ORDER BY Umsatz DESC; /* B KUNDEN */ reset outobs=30000; DROP TABLE altranbi.b_kunden; CREATE TABLE altranbi.b_kunden AS SELECT kundennummer, Umsatz FROM altranbi.kundenwert_ k WHERE kundennummer NOT IN (SELECT kundennummer FROM altranbi.a_kunden) ORDER BY Umsatz DESC; /* C KUNDEN */ reset outobs=50000; DROP TABLE altranbi.c_kunden; CREATE TABLE altranbi.c_kunden AS SELECT kundennummer, Umsatz FROM altranbi.kundenwert_ k WHERE kundennummer NOT IN (SELECT kundennummer FROM altranbi.a_kunden) AND kundennummer NOT IN (SELECT kundennummer FROM altranbi.b_kunden) ORDER BY Umsatz DESC;

/* D KUNDEN */ reset outobs=100000; DROP TABLE altranbi.d_kunden; CREATE TABLE altranbi.d_kunden AS SELECT kundennummer, Umsatz FROM altranbi.kundenwert_ k WHERE kundennummer NOT IN (SELECT kundennummer FROM altranbi.a_kunden) AND kundennummer NOT IN (SELECT kundennummer FROM altranbi.b_kunden) AND kundennummer NOT IN (SELECT kundennummer FROM altranbi.c_kunden) ORDER BY Umsatz DESC; /* E KUNDEN */ reset outobs=; DROP TABLE altranbi.e_kunden; CREATE TABLE altranbi.e_kunden AS SELECT kundennummer, Umsatz FROM altranbi.kundenwert_ k WHERE kundennummer NOT IN (SELECT kundennummer FROM altranbi.a_kunden) AND kundennummer NOT IN (SELECT kundennummer FROM altranbi.b_kunden) AND kundennummer NOT IN (SELECT kundennummer FROM altranbi.c_kunden) AND kundennummer NOT IN (SELECT kundennummer FROM altranbi.d_kunden) ORDER BY Umsatz DESC; /* Enthaelt alle Kunden mit Werteklasse, Umsatz und Kundennummer */ DROP TABLE altranbi.kundenwert; CREATE TABLE altranbi.kundenwert AS SELECT "A" AS Klasse, kundennummer, Umsatz FROM altranbi.a_kunden; INSERT INTO altranbi.kundenwert SELECT "B" AS Klasse, kundennummer, Umsatz FROM altranbi.b_kunden; INSERT INTO altranbi.kundenwert SELECT "C" AS Klasse, kundennummer, Umsatz FROM altranbi.c_kunden; INSERT INTO altranbi.kundenwert SELECT "D" AS Klasse, kundennummer, Umsatz FROM altranbi.d_kunden; INSERT INTO altranbi.kundenwert SELECT "E" AS Klasse, kundennummer, Umsatz FROM altranbi.e_kunden; reset outobs=;

/* Ordne den Kundendaten die passenden Umsaetze zu */ DROP TABLE altranbi.kundenwert12; CREATE TABLE altranbi.kundenwert12 AS SELECT * FROM altranbi.kunden_binary k JOIN altranbi.kundenwert w ON w.kundennummer = k.kundennummer ORDER BY RANUNI(1234); /* Aufraeumen */ DROP TABLE altranbi.a_kunden; DROP TABLE altranbi.b_kunden; DROP TABLE altranbi.c_kunden; DROP TABLE altranbi.d_kunden; DROP TABLE altranbi.e_kunden; DROP TABLE altranbi.kundenwert_200812; SELECT a.Klasse, sum(a.Umsatz) AS SummeUmsatz, count(a.kundennummer) AS SummeKunden, sum(a.Umsatz) / UmsatzGesamt AS AnteilUmsatz, count(a.kundennummer) / KundenGesamt AS AnteilKunden, KundenGesamt, UmsatzGesamt FROM altranbi.kundenwert12 a CROSS JOIN (select sum(umsatz) AS UmsatzGesamt, count(kundennummer) AS KundenGesamt from altranbi.kundenwert12) b GROUP BY a.klasse; run;

Zukünftiger Kundenwert
Wahrscheinlichkeit für Abschluss? > Assoziazionsanalyse > Cross / Upselling > möglicher zusätzlicher Kundenwert >

Data Understanding Data Preperation Modeling Assoziationsanalyse …
Clusteranalyse Prognosemodelle

Modeling Assoziationsanalyse
Teil der Aufgabenstellung: Entwickeln Sie jeweils ein Produktbezogenes Data-Mining-Modell zur Prognose von Cross-Selling-Abschlüssen auf die Produkte Linuskredit, Linusdepot, Linusgiro, Linuszins und Linusriester. Ziel der Analyse Eindruck darüber gewinnen, welche Produkte häufig gemeinsam genutzt werden.

Modeling Vorbereitung der Daten für Assoziationsanalyse
Benötigter Datensatz: Konten Enthaltene Daten: Kundennummer als ID Produktnutzung (Kredit, Depot, Giro, Zins, Riester) binär 0 oder 1 Vermögensausprägung (negativ, ausgeglichen, positiv) nominal -1, 0 oder 1 Alter in 5 Stufen nominal Kreditwürdigkeit (gut, schlecht, unbekannt) nominal Beziehungsdauer Kanal (Online, Filiale) binär

Modeling Der Datenfluss im Diagramm

Modeling Filtereinstellung

Modeling Einstellungen im Detail

Modeling Ergebnis Das Ergebnis der Analyse mit dem ermittelten Warenkorb. Hier zu sehen sind nur die Regeln, die auf der rechten Seite genau ein Ergebnis erzeugen.

Modeling Ergebnis II

Modeling Fazit Häufig zusammen gekauft werden Zins, Depot und Riester in allen möglichen Kombinationen. Das macht auch Sinn, da alle drei Produkte im Kern Sparprodukte darstellen. Einen starken Lift erzeugen Riester-Produkte, die sowohl für Zins, als auch Zins in Kombination mit Giro oder Depot häufig nachgefragt werden. Diese Produkte werden jedoch vergleichsweise selten verkauft. Handlungsmöglichkeiten: Kunden, die bereits ein oder mehrere Produkte besitzen, könnten entsprechend interessiert sein an den ermittelten Kombinationen. So bietet es sich an, Besitzer von Zins, die noch über kein Depot verfügen, ein Produktangebot vorzubereiten bzw. Depot-Besitzern auch Linuszins anzubieten.

Modeling Clusteranalyse
Teil der Aufgabenstellung: Entwickeln Sie jeweils ein Produktbezogenes Data-Mining-Modell zur Prognose von Cross-Selling-Abschlüssen auf die Produkte Linuskredit, Linusdepot, Linusgiro, Linuszins und Linusriester. Ziel der Analyse Eindruck über die Kundenstruktur gewinnen. Gibt es typische Nutzergruppen, die ähnliche Eigenschaften aufweisen?

Benötigter Datensatz: Kunden_binary200812 Enthaltene Daten: Kundennummer als ID Produktnutzung (Kredit, Depot, Giro, Zins, Riester) binär 0 oder 1 Vermögensausprägung (negativ, ausgeglichen, positiv) nominal -1, 0 oder 1 Alter in 5 Stufen nominal Kreditwürdigkeit (gut, schlecht, unbekannt) nominal Beziehungsdauer Kanal (Online, Filiale) binär

Nachdem der Clusternode keine zufriedenstellenden Ergebnisse hervorbrachte, kam der SOM-/Kohonen-Node zum Einsatz. Vorgehen: Sampling-Node mit Simple-Random (12345) als Starteinstellung und 4x6 Clustern. Anschließend Beobachtung des Distance-Plots auf eine gleichmäßige Verteilung der Cluster und Prüfung der Clusterhäufigkeit in den Statistics. Schrittweise Reduzierung der Clusterzahl brachte bei 2x3 Clustern das erste gute Ergebnis, bei dem die Cluster gut verteilt waren und keine Häufung mehr auftrat. Als wichtige Variablen zeigt sich stets die Beziehungsdauer, die Vermögensausprägung, Giro, Depot, Zins, Kredit.

Modeling Der Datenfluss im Diagramm

Modeling Ergebnis der Analyse mit dem ermittelten Distanzgraphen

Modeling Der Überblick über alle erzeugten Ergebnisse.

Modeling Das Alter wurde nicht in die Cluster-Unterscheidung einbezogen.

Modeling Die Verteilung der Produkte auf die verschiedenen Cluster

Modeling Kreditwürdigkeit und Vermögensausprägung
Während Vermögensausprägung durchaus einen Einfluss hat, ist die Kreditwürdigkeit in allen Clustern gleich verteilt.

Modeling Fazit Es zeigen sich drei auffällige Cluster-Gruppierungen. So gibt es stets ein Cluster Kreditkunden, das einen erheblichen Anteil an Kreditkunden beinhaltet, die eine stark negative Vermögensausprägung aufweisen und eine mittlere Beziehungsdauer ab 3 Jahren erreichen. Die zweite Gruppe sind die Sparkunden mit positiver Vermögensausprägung, langer Bindungsdauer teils über 10 Jahre und allen drei Spar-Produkten Zins, Depot und Giro. Die dritte Gruppe umfasst die verbleibenden Cluster mit vorrangig ausgeglichenem Vermögen und häufig einem Girokonto oder Depot. Handlungsmöglichkeiten: Es lässt sich erkennen, dass im Cluster der Sparkunden die klassischen Sparprodukte häufig nachgefragt werden. Ein Ansatz wäre, Kunden zu finden, die ebenfalls vermögend sind, aber noch nicht alle Produkte besitzen. Zusätzlich ist eine Aktion denkbar, bei der Kunden, die alle Produkte besitzen, aber nur geringe Einlagen aufweisen, zusätzliches Geld überweisen, weil sie mit hoher Wahrscheinlichkeit noch woanders über Konten mit Spareinlagen verfügen.

Modeling Prognosemodelle
Teil der Aufgabenstellung: Entwickeln Sie jeweils ein produktbezogenes Data-Mining-Modell zur Prognose von Cross-Selling-Abschlüssen auf die Produkte linuskredit, linusdepot, linusgiro, linuszins und linusriester. Ziel der Modelle Klassifikation von neuen Kunden, um Wahrscheinlichkeiten für Produktabschlüssen zu prognostizieren. Ist auch eine Hilfestellung um Cross-Selling-Potenzial von bereits bestehenden Kunden zu ermitteln.

Modeling Vorbereitung der Daten für die Prognosemodelle
Benötigte Datensätze: kunden_binary200806 kunden_binary (Clustering) kundenwert_200806 kundenwert_ (Kundenwert) Enthaltende Daten: Kundennummer (id) Alter (nominal 5 Klassen) Kanal (binär) Kreditwürdigkeit (nominal 3 Klassen) Vermögensausprägung (ordinal -1 0 und 1) Giro (binär) Kredit (binär) Riester (binär) Zins (binär) Depot (binär) Beziehungsdauer (nominal 5 Klassen) Klasse (nominal 5 Klassen) Umsatz (interval )

Modeling Manipulation der Daten und Erstellung von Standartprognosemodellen
Über SAS Code die benötigten Datensätze erzeugen Über "Input-Data-Source-Node" jeweils die komplette Kundenwert Tabelle von 06 und 12 laden (Model Role der Kundennumemr als ID deklarieren)

Für jedes Prognosemodell je 2 "Data Set Attributes Nodes" erstellen und die für die für das jeweilige Modell interresannte Varibale als Target definieren. Pro Modell ist ein Data Set Attributes Node mit dem Kundenwert 06 bzw 12 verbunden. Weiterhin wird die Variabale Umsatz ausgeschlossen, da sie indirekt durch den Kundenwert repräsentiert wird.

Im Strang von Kundenwert 06 wird ein Sampling Node eingeführt, um bei der Targetvaribalen ein ausgeglichenes Verhälltnis der Ausprägungungen zu erhalten. Weiterhin ist darauf, zu achten, dass 100% der Daten für das Sampling genutzt werden.

Anschliessend wird in beiden Strängen ein Data Partition Node eingeführt. Im Stang vom Kundenwert 06 werden 70% als Training und 30 % als Validation definiert. Im Strang Kundenwert 12 werden 100% als Test definiert.

Nun werden für jedes Prognosemodell jeweils ein Regression Node, ein Tree Node und ein Neuronal Network Node erstellt. Diese sind mit den Data Partition Nodes aus den 2 Strängen zu verbinden. Wichtig ist, dass der Input der Daten für Training und Validation aus dem Strang Kundenwert 06 und der Input der Daten für den Test aus dem Strang Kundenwert 12 kommt. Im Model Manager werden Die Checkboxen Train, Validation und Test aktiviert, sowie Entire data set bei dem Score Data Set. Abschliessend werden alle 3 Modelle für jedes Prognosemodell in einem Assesment Node zusammengefasst.

Modeling Zwischenergebnis

Modeling Zwischenergebnis
Für jedes Produkt ist nun eine Vorkonfigurierte Strucktur vorhanden. Diese beinhalten Trainings und Validierungsdaten vom Monat Juni, als noch keine Kampagne begonnen hat und Testdaten aus dem Monat Dezember, als die Kampagnen schon abgeschlossen waren. Durch das Aufbereiten der Test und Validierungsdaten können Modelle mit hoher Güte erstellt werden und durch die getrennte Betrachtung der Trainingsdaten auch mit der Realität verglichen werden. Zur Orientierung stehen vorerst die Standartversionen der drei Grundmodelle zur Verfügung, welche im Assessment Node verglichen werden können. Anhand der Vergleichswerte können Rückschlüsse gezogen werden, welches Modell ein guter Ausgangspunkt für Optimierungen ist. Durch die zusätzlichen Aktivierungen im Modelmanger ist es ausserdem Möglich gezielt auf den Fehler zweiter Art bei den jeweiligen Modellen einzugehen und ihn zu minimieren.

Clusteranalyse Prognosemodelle Giro Kredit Riester Zins Depot

Prognosemodelle Giro Die Misclassifikation Rates im Testdatensatz stellen sich wie folgt zusammen: Neuronal Network: Tree: Regression: Auf dem ersten Blick ist das Neuronale Netz klar besser als die beiden Alternativen. Beim Versuch dieses Netz weiter zu optimieren wurden jedoch nu rminimale Erfolge erzielt (auf ). Durch des gringe Optimierungspotenzial wurde der Entscheigungsbaum wieder interresant. Mit dem Entscheidugsbaum konnten signifikant bessere Ergebnisse erzielt werden, welche nun Vergleichbar sind mit denen des Neuronalen Netzes ( ). Ein großer Kritikpunkt ist jedoch der Fehler zweiter Art. Dieser liegt bei 32,11%.

Prognosemodelle Giro II
Zur Optimierung des Neuronalen Netzes wurde als Selectionskriterium dei Misclassificaions Rate gewählt und die Zahl der verstecken Neuronen auf 20 erhöht. Weiterhin wurden direkte Verbindungen der Neuronen untereinander gestattet, um die Komplexität zu steigern.

Prognosemodelle Giro III
Zur Optimierung des Entscheidungsbaums wurde das Signifikanzlevel auf 0,5% herabgesetzt. Des Weiteren wurden die Anzahl der minimalen Anzahl an Objekten im Blättern auf 1 reduziert und die Anzahl der Beobachtungen vor einem Splitt auf 5000 erhöht.

Prognosemodelle Giro IV

Prognosemodelle Fazit
Die Test Misclassifikation Rate beläuft sich auf nun auf Der Fehler zeiter Art beträgt nur 32,11%. Das Model ist somit nicht besonders geeignet, um den Absatz von Giro zu optimieren, da viele potenzielle Kunden als nicht interessiert eingeordnet werden. Handlungsmöglichkeiten: Den Umsatz wieder als Variable einschliessen. Damit lassen sich nahezu perfekte Modelle erstellen, allerdings mit der Gefahr einzelne Informationen überzubewerten und das Problem des Overfitting zu provozieren. Das Modell muss in einer Kosten-Nutzen Rechnung zeigen, ob es trotzdem lukrativ sein kann auf ca. 1/3 der potenziell interresierten Kunden verzichten zu können.

Prognosemodelle Kredit
Die Misclassifikation Rates im Testdatensatz stellen sich wie folgt zusammen: Neuronal Network: Tree: Regression: Alle Modelle liegen hier sehr nah bei einander und das auf hohen Niveau. Aus vielfachgenannten Gründen wird der Entscheidungsbaum bevorzugt. Dieser soll nun noch optimiert werden.

Prognosemodelle Kredit II
Durch reduktion des Signifikanzlevels auf 5% und Absenkung der minimalen Objekten pro Baltt bei gleichzeitiger Erhöhung der Beobachtungen für jeden Split konnte der bereits sehr gute Baum nochmals verbessert werden.

Prognosemodelle Kredit III

Prognosemodelle Fazit
Die Misclassifikationrate der Testdaten konnte auf verbessert werden bei einem Fehler zweiter Art von nur 2,5%. Damit liefert das Modell einen sehr guten Ansatz zur Prognose von Krediten. Handlungsmöglichkeiten: Im Zusammenhang mit der Kreditwürdigkeit lassen sich nicht nur genaue sondern auch relativ sichere Prognosen machen zur vergabe von Krediten.

Prognosemodelle Riester
Die Misclassifikation Rates im Testdatensatz stellen sich wie folgt zusammen: Neuronal Network: Tree: Regression: Rest kommt noch...

Prognosemodelle Zins Die Misclassifikation Rates im Testdatensatz stellen sich wie folgt zusammen: Neuronal Network: Tree: Regression:

Prognosemodelle Depot
Die Misclassifikation Rates im Testdatensatz stellen sich wie folgt zusammen: Neuronal Network: Tree: Regression:

Allgemeine Marktübersicht Problembeschreibung Projektplan

Ähnliche Präsentationen

Präsentation zum Thema: "Allgemeine Marktübersicht Problembeschreibung Projektplan"— Präsentation transkript:

Ähnliche Präsentationen

Über Projekt

Feedback

Anmelden

Anmeldung über soziales Netzwerk:

Allgemeine Marktübersicht Problembeschreibung Projektplan

Ähnliche Präsentationen

Präsentation zum Thema: "Allgemeine Marktübersicht Problembeschreibung Projektplan"— Präsentation transkript:

Ähnliche Präsentationen

Über Projekt

Feedback