Kampagnen-Management Fazit

Slides:



Advertisements
Ähnliche Präsentationen
Algorithmen und Datenstrukturen
Advertisements

Anzahl der ausgefüllten und eingesandten Fragebögen: 211
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil3.
LS 2 / Informatik Datenstrukturen, Algorithmen und Programmierung 2 (DAP2)
Umfrage zum Thema Taschengeld
Projekt zur Evaluation, Reaktivierung vorhandener Kenntnisse und Festigung des Arbeitens mit Größen im Mathematikunterricht mit Schülern der 7. Klassen.
Telefonnummer.
Modelle und Methoden der Linearen und Nichtlinearen Optimierung (Ausgewählte Methoden und Fallstudien) U N I V E R S I T Ä T H A M B U R G November 2011.
Modelle und Methoden der Linearen und Nichtlinearen Optimierung (Ausgewählte Methoden und Fallstudien) U N I V E R S I T Ä T H A M B U R G November 2011.
1 JIM-Studie 2010 Jugend, Information, (Multi-)Media Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.
= = = = 47 = 47 = 48 = =
Statistiken und Tabellen
Rechneraufbau & Rechnerstrukturen, Folie 2.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 2.
Internet facts 2006-I Graphiken zu dem Berichtsband AGOF e.V. September 2006.
Internet facts 2009-IV Grafiken zu dem Berichtsband AGOF e.V. März 2010.
Internet facts 2006-III Graphiken zum Berichtsband AGOF e.V. März 2007.
Internet facts 2008-II Graphiken zu dem Berichtsband AGOF e.V. September 2008.
Internet facts 2006-II Graphiken zu dem Berichtsband AGOF e.V. November 2006.
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil2.
Differentielles Paar UIN rds gm UIN
Prof. Dr. Bernhard Wasmayr
Studienverlauf im Ausländerstudium
Datenstrukturen, Algorithmen und Programmierung 2 (DAP2)
Classification of Credit Applicants Using Data Mining. Thema.
Kennlinie Lichtregelung in JavaNNS Version 1.1
Prof. Dr. Bernhard Wasmayr VWL 2. Semester
AWA 2007 Natur und Umwelt Natürlich Leben
Rechneraufbau & Rechnerstrukturen, Folie 12.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 12.
Prof. Dr. Günter Gerhardinger Soziale Arbeit mit Einzelnen und Familien Übersicht über die Lehrveranstaltung Grundlegende Bestimmungsfaktoren der Praxis.
20:00.
So kannst du beide schnell berechnen.
Zusatzfolien zu B-Bäumen
Allgemeine Marktübersicht Problembeschreibung Projektplan
Eine Einführung in die CD-ROM
GBI Genios Wiso wiso bietet Ihnen das umfassendste Angebot deutsch- und englischsprachiger Literatur für die Wirtschafts- und Sozialwissenschaften. Wir.
Dokumentation der Umfrage
Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research Prof. Dr. Andreas Hilbert
Where Europe does business Lück, JDZB | Seite © GfW NRW 252 a.
Kinder- und Jugenddorf Klinge Qualitätsentwicklung Januar 2005 Auswertung der Fragebögen für die Fachkräfte in den Jugendämtern.
Wir üben die Malsätzchen
Aufgabenzettel V Statistik I
Syntaxanalyse Bottom-Up und LR(0)
STATISIK LV Nr.: 0028 SS Mai 2005.
Addieren und Subtrahieren von Dezimalzahlen
IK Ökonomische Entscheidungen und Märkte
Der Ablauf eines Clear Rex Klärzyklus
PROCAM Score Alter (Jahre)
Ertragsteuern, 5. Auflage Christiana Djanani, Gernot Brähler, Christian Lösel, Andreas Krenzin © UVK Verlagsgesellschaft mbH, Konstanz und München 2012.
Geometrische Aufgaben
Vorlesung Mai 2000 Konstruktion des Voronoi-Diagramms II
Symmetrische Blockchiffren DES – der Data Encryption Standard
Szenisches Lernen Wie Theaterelemente den Unterricht bereichern
Allgemeine Marktübersicht Problembeschreibung Projektplan
Zahlentheorie und Zahlenspiele Hartmut Menzer, Ingo Althöfer ISBN: © 2014 Oldenbourg Wissenschaftsverlag GmbH Abbildungsübersicht / List.
MINDREADER Ein magisch - interaktives Erlebnis mit ENZO PAOLO
Bevölkerungsentwicklung und –struktur der Stadt Bozen
1 (C)2006, Hermann Knoll, HTW Chur, FHO Quadratische Reste Definitionen: Quadratischer Rest Quadratwurzel Anwendungen.
Allgemeine Marktübersicht Problembeschreibung Projektplan
Marktübersicht Die Linusbank Problembeschreibung Projektplan
Folie Beispiel für eine Einzelauswertung der Gemeindedaten (fiktive Daten)
Unternehmensbewertung Thomas Hering ISBN: © 2014 Oldenbourg Wissenschaftsverlag GmbH Abbildungsübersicht / List of Figures Tabellenübersicht.
Forschungsprojekt Statistik 2013 „Jugend zählt“ – Folie 1 Statistik 2013 „Jugend zählt“: Daten zur Arbeit mit Kindern und Jugendlichen.
Tutorium Statistik II Übung IV Philipp Schäpers Mi – 11.45
AGOF facts & figures: Branchenpotenziale im Internet Q2 2014: Parfum & Kosmetik Basis: internet facts / mobile facts 2014-I.
Folie Einzelauswertung der Gemeindedaten
Datum:17. Dezember 2014 Thema:IFRS Update zum Jahresende – die Neuerungen im Überblick Referent:Eberhard Grötzner, EMA ® Anlass:12. Arbeitskreis Internationale.
Einführung in die Volkswirtschaftslehre, Mikroökonomie und Wettbewerbspolitik Lothar Wildmann ISBN: © 2014 Oldenbourg Wissenschaftsverlag.
Sehen, Hören, Schmecken: wenn uns unsere Sinne täuschen
1 Medienpädagogischer Forschungsverbund Südwest KIM-Studie 2014 Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.
Monatsbericht Ausgleichsenergiemarkt Gas – November
 Präsentation transkript:

Kampagnen-Management Fazit Die Linusbank Allgemeine Marktübersicht Unternehmenssicht Problembeschreibung Projektplan Data Understanding Data Preparation Modeling Kampagnen-Management Fazit

Die Linusbank Allgemeine Marktübersicht Höhere Preissensitivität Häufig 2 bis 4 Bankverbindungen Entwicklung kostenloser Girokonten: 2000: gesamt: 6 % 2005: gesamt: 10 % - 2 % Onlinekonten 2010: gesamt: 20 % - 19 % Onlinekonten Allgemeine Demografie am Markt: 21 % jünger als 30 15 % älter als 70 Jahre 19 % zwischen 40 und 49 Andere Altersgruppen jeweils ca. 15 %

Die Linusbank Unternehmenssicht Mittelgroße Filialbank mit 500.000 Kunden 5 Produkte: Umfangreiches Data Warehouse mit historisierter Datenbasis Sowohl Online- als auch Filialgeschäft Abbildung 1.1: Produktübersicht

Die Linusbank Problembeschreibung Was der Kunde sagt Projektplan Was der Kunde will Projektplan Data Understanding Data Preparation Modeling …

Problembeschreibung Was der Kunde sagt „Wir wollen den Produktbesitz und die Produktnutzung unserer Bestandskunden intensivieren, um dem Wettbewerbsdruck zu begegnen. Allerdings sind die Kosten unserer jeweils produktbezogenen Cross- und Up-Selling-Kampangen hoch, und zu häufig sollten die Kunden auch nicht angesprochen werden. Deshalb wollen wir mit unseren Kampagnen vorranging die wertvollsten Kunden adressieren. Leider können wir den Erfolg von Kampagnen nur schwer beurteilen. Anhand von Vergangenheitsdaten wissen wir, dass sich unsere Kunden hinsichtlich ihres Produktbesitzes, ihrer Produktnutzung sowie ihrer Reaktion auf Kampagnen zum Teil deutlich unterscheiden.“

Problembeschreibung Was der Kunde will Kosten für Kampagnen sehr hoch Kunden nutzen wenige Produkte Keine Erfolgsmessung der Kampagnen Wertvolle Kunden unbekannt Ziele: Kundenzufriedenheit und Bindung erhöhen Wertvolle Kunden identifizieren Kosten reduzieren Erfolgsmessung für Marketingkampagnen einführen

Die Linusbank Problembeschreibung Projektplan Data Understanding Projektablauf Koordination der Projektarbeit Data Understanding Data Preparation Modeling Kampagnenauswertung …

Projektplan Projektablauf Orientierung des Projektablaufes an den Phasen des CRISP-DM Einarbeitung in Bankgeschäft und Daten der Linusbank Festlegen der Teilziele für Projektablauf Erarbeiten von Kennzahlen auf Basis der vorhandenen Daten Evaluation der erstellten Modelle und ableiten von Handlungsempfehlungen Abbildung 3.1: Projektplan

Projektplan Kooperation der Projektarbeit Abbildung 3.2: http://altranprojektseminar.wikispaces.com

… Projektplan Data Understanding Data Preparation Übersicht über vorhandene Daten Produktverteilung Produkterträge Kundenanalyse Kundenwertkonzept Data Preparation

Deskriptive Analyse Übersicht über vorhandene Daten Abbildung 4.1: Datenübersicht

Deskriptive Analyse Produktverteilung (Gesamt) Girokonto hat größten Produktanteil Kredit nur vergleichsweise geringer Anteil Anteil für Riester und Sparen minimal Abbildung 4.2: Produktverteilung gesamt

Deskriptive Analyse Produktverteilung (im Monat Juni) Abbildung 4.3: Anzhal Produktverteilung Juni

Deskriptive Analyse Produktverteilung (im Monat Dezember) Abbildung 4.4: Anzahl Produktverteilung Dezember

Deskriptive Analyse Produktverteilung Deutliche Unterschiede in der Produktverteilung zwischen den Monaten Juni und Dezember erkennbar Zurückzuführen auf wirksame Marketingkampagnen Alle Informationen über erstes Halbjahr im Datensatz für Juni enthalten Juni-Datensatz stellt Basis unserer Annahmen und Berechnungen dar Später: Vergleich und Güteanalyse mit Daten des Dezembers

Deskriptive Analyse Produkterträge Riester und Kredit haben die höchsten Anteile an den Erträgen Zins, Giro und Depot vergleichsweise niedriger Ertragsanteil Produkt Jahresertrag Laufzeitertrag Riester 530 € 1970 € Zins 140 € 290 € Giro 40 € 260 € Depot 25 € 90 € Kredit 450 € 570 € Abbildung 4.5: Produkterträge

Deskriptive Analyse Kundenanalyse 1/4 Die absolute Zahl der Kunden, die 1, 2, 3, 4 oder 5 und mehr Produkte besitzen Die relativen Änderungen der Kunden mit einer bestimmten Anzahl an Produkten

Deskriptive Analyse Kundenanalyse 2/4 Umsatzanalyse nach Monaten sowie Zahl der Kunden, die einen Vertrag abgeschlossen haben und Zahl der abgeschlossenen Verträge.

Deskriptive Analyse Kundenanalyse 3/4 Abbildung 4.6: Kreditvolumen Übersicht über das Volumen von Kreditkunden abhängig von der Kreditwürdigkeit

Deskriptive Analyse Kundenanalyse 4/4 Mehr Filial- als Onlinekunden Kaum Unterschiede in der Altersstruktur im Vergleich Online/ Offline Abbildung 4.7: Vertriebskanal Abbildung 4.8: Demographie

Deskriptive Analyse Kundenwertkonzept 1/3 Motivation: Banken besitzen nur beschränkte Ressourcen für Aktivitäten der Kundenbindung Ziel ist es Kundensegmente zu identifizieren, die den Einsatz dieser Ressourcen rechtfertigen Ermöglichung einer spezifischen Art der Betreuung von Bestandkunden und potenziellen Neukunden Ausschöpfung von Cross- & Up-Selling-Potenzialen Mögliche Verfahren Qualitative Segmentierung ABC-Analysen Kundendeckungsbeitragsrechnung Kunden-Scoring-Modelle Kunden-Portfolio-Analyse Customer-Lifetime-Value Abbildung 4.9: ABC Analyse Quelle: http://www.mapone.de/images/abcanalyse.jpg

Deskriptive Analyse Kundenwertkonzept 2/3 Kundenwert lässt sich über viele Faktoren bestimmen: Beziehungsdauer Kreditwürdigkeit Transaktionsvolumen Erwartete Kaufwahrscheinlichkeit für die Zukunft Generierter Umsatz Hohes Einkommen Durch welche Daten lassen sich solche Kunden erkennen? Kreditvolumen Einlagen-Netto-Volumen Einlagenvolumen Saldo Girokonto

Deskriptive Analyse Kundenwertkonzept 3/3 Versuchsansatz: Kunden unterteilen in A, B und C Kunden A Kunden sind wertvoll B Kunden haben keinen besonderen Wert, schädigen die Linusbank aber nicht C Kunden schädigen die Linusbank Mögliche einflussreiche Größen für Kundenwertbestimmung: Produktnutzung  X ist die Menge an Produkten, welche einen besonders hohen Anteil am Umsatz/Gewinn der Linusbank haben Dauer  Gewichtungsfaktor für die wichtigsten Produkte der Linusbank Anzahl  Gewichtungsfaktor für die wichtigsten Produkte der Linusbank Volumen  Gewichtungsfaktor für die wichtigsten Produkte der Linusbank Kreditwürdigkeit  Risikominimierung Vermögensausprägung  viel Vermögen bedeutet viel Kapital für die Linusbank Beziehungsdauer  Zeichen für Loyalität Cross-Selling_Potenzial  Möglichkeit der Aufwertung des Kunden durch Kampagnen

… Data Understanding Data Preparation Datenbereinigung Modeling Ausschluss von Datenmaterial Transformierung von Datensätzen Kundenwert Vorgehen zur Kundenwertbestimmung Hilfsmittel: ABC-Analyse Modeling

Data Preparation Datenbereinigung Ausschluss von „toten“ Kunden, um eine saubere Datenbasis für die Folgemodelle zu erzeugen? Nur bedingt sinnvoll, da diese Kunden durch die Kampagnen reaktiviert werden können Denkbarer Nutzen etwa bei Assoziationsanalyse für den Warenkorb, wobei Konten-Tabelle nur Kunden enthält, die mindestens ein Produkt besitzen Modelle arbeiten fehlerhaft, aber der gezielte Ausschluss (klar definierter) wertloser Kunden ist fehlerfrei, sodass das Endmodell eine höhere Güte aufweisen müsste Normierung der Datensätze erforderlich, da Daten sowohl metrisch skaliert vorliegen (z. B. Kredithöhe oder Beziehungsdauer) oder nominal bzw. ordinal (z. B. Geschlecht, Familienstand, Kreditwürdigkeit) Verbindung der Datensätze über die Kundennummer möglich (jeder Kunde hat eine eindeutige Kundennummer)

Data Preparation Ausschluss von Datenmaterial Produktnutzung_Giro und Dauer_Giro beinhalten die gleichen Fakten Wenn die Produktnutzung = 0 ist auch die Dauer_Giro = 0 Daraus folgt, dass Dauer_Giro überflüssig ist Ebenso bei Zins, Kredit, Riester, Depot Ausschluss von Kreditkarte, Baufinanzierung und Termingeld, Sparkarte laut Aufgabenstellung (keine adäquaten Daten)

Data Preparation Transformierung von Datensätzen Tabelle Konten und Kunden Verknüpfung der beiden Tabellen für jeden Monat mit den Informationen: Beziehungsdauer Alter Vertriebskanal Produktnutzungsdauer (Giro, Zins, Kredit, Riester, Depot) Nutzen der Produkte wurde binär kodiert Kunde nutzt Produkt  1 Kunde nutzt Produkt nicht  0 Alter: bis 17: Minderjährig  wird ausgeschlossen 18-29 30-39 40-49 50-59 ab 60 Beziehungsdauer: 0-3: Neukunde 3-12: 1 Jahr 13-24: 2 Jahre 25-60: 3-5 Jahre 51-120: 6-10 Jahre ab 121: mehr als 10 Jahre

Data Preparation Kundenwert 1/3 Für eine erste Analyse genügt ein relativ einfacher Initialkundenwert, der auf Basis des Laufzeitertrags ermittelt wird. In weiteren Schritt kann anhand von den verschiedenen Prognosemodellen ein Score für jeden Kunden erzeugt werden, der in einen präziseren und feiner abgestimmten Kundenwert einfließt Für die aktuelle Aufgabe genügt der Initialkundenwert Kunden haben zu einem bestimmten Zeitpunkt ein eine Menge an Produkten mit unterschiedlichem Ertrag erworben Je nach Ertrag erzeugen diese Kunden einen höheren oder niedrigeren Umsatz Kunden werden anhand dieses Umsatzes in verschiedene Werte-Klassen eingeteilt

Data Preparation Kundenwert 2/3 Ermittlung des Kundenwertes abhängig von der Zielstellung, wobei Ziele nicht klar voneinander trennbar sind: Erhöhung der Kundenbindung? Steigerung der Produktdurchdringung je Kunde? Steigerung des durchschnittlichen Umsatzes? Verbesserung der Kundenzufriedenheit? In diesem Fall: Steigerung der Produktdurchdringung Erhöhen des Umsatzes z. B. durch Cross Selling

Data Preparation Kundenwert 3/3 Dazu: Ermittlung passender Kennzahlen notwendig Möglich sind: Einlagenvolumen Kreditwürdigkeit Produktumsatz Beziehungsdauer ABER: Modell soll möglichst einfach gestaltet werden, dass so viele Eigenschaften wie notwendig und so wenige wie möglich verwendet werden. Dafür bieten sich der Produktumsatz (Laufzeiterträge) und das erwartete Cross-Selling-Potential an (ermittelt anhand der Prognosemodelle)

Data Preparation Vorgehen zur Kundenwertbestimmung 1/2 Zweistufiges Vorgehen: Schritt 1: Initialkundenwert besteht lediglich aus Produktumsatz, da Potential noch nicht bekannt ist Dieser Kundenwert fließt in Prognose-Modell ein Schritt 2: tatsächlicher Kundenwert erzeugt durch neuen Kundenwert aus Ergebnis des Prognose-Modells von Schritt 1 Berechnung anhand der Scores für die einzelnen Kaufwahrscheinlichkeiten der Produkte

Data Preparation Vorgehen zur Kundenwertbestimmung 2/2 Berechnung Initialkundenwert: Summe der Laufzeiterträge der Kunden und Einteilung in Klassen A bis E Berechnung des tatsächlichen Kundenwertes: Summe der Einzelscores für die Kaufwahrscheinlichkeiten für die 5 Produkte (maximal erreichbarer Wert: 5 Punkte) Beinhaltet durch Berücksichtigung des Initialkundenwertes bereits die jeweiligen Umsätze erneute Einteilung der Kunden in Klassen A bis E anhand der Höhe des Gesamtscores.

Data Preparation Hilfsmittel: ABC-Analyse Klassische ABC-Analyse gruppiert Kunden prozentual in Klassen ein, die einen bestimmten Umsatzanteil ausmachen Jedoch in SQL extrem komplex zu implementieren Abgewandelter Algorithmus sortiert Kunden absteigend nach Umsatz und ordnet absolute Mengen in die Klassen ein, sodass die ersten 50.000 Kunden mit dem höchsten Umsatz Klasse A darstellen, die nächsten Kunden Klasse B usw. Die Mengen wurden so definiert, dass ca. 20 % der Kunden (A und B) 80 % des Umsatzes generieren A: 0 - 50.000 B: 50.000 – 100.000 C: 100.000 – 150.000 D: 150.000 – 200.000 E Über 200.000

Kampagnen-Management … Data Understanding Data Preperation Modeling Assoziationsanalyse Clusteranalyse Prognosemodelle Kampagnen-Management Fazit

Modeling Assoziationsanalyse Teil der Aufgabenstellung: Entwickeln Sie jeweils ein Produktbezogenes Data-Mining-Modell zur Prognose von Cross-Selling-Abschlüssen auf die Produkte Linuskredit, Linusdepot, Linusgiro, Linuszins und Linusriester. Ziel der Analyse Eindruck darüber gewinnen, welche Produkte häufig gemeinsam genutzt werden.

Assoziationsanalyse Vorbereitung der Daten für Assoziationsanalyse Benötigter Datensatz: Konten Enthaltene Daten: Kundennummer als ID Produktnutzung (Kredit, Depot, Giro, Zins, Riester) binär 0 oder 1 Vermögensausprägung (negativ, ausgeglichen, positiv) nominal -1, 0 oder 1 Alter (in 5 Stufen) nominal Kreditwürdigkeit (gut, schlecht, unbekannt) nominal Beziehungsdauer (5 Stufen) nominal Kanal (Online, Filiale) binär

Assoziationsanalyse Einstellungen Der Datenfluss im Diagramm: Abbildung 6.1: Datenfluss Reduzieren der Werte, da Transaktionen wie Kredit oder Riester im verhältnis zur Gesamtzahl der Transaktionen relativ selten auftreten. Sie sollen aber trotzdem in der Analyse erscheinen Abbildung 6.2: Einstellung General Die Filtereinstellungen, um nicht zu berücksichtigende Produkte auszuschließen: Abbildung 6.3: Einstellung Class Variable

Assoziationsanalyse Ergebnis 1/2 Das Ergebnis der Analyse mit dem ermittelten Warenkorb. Hier zu sehen sind nur die Regeln, die auf der rechten Seite genau ein Ergebnis erzeugen Abbildung 6.4: Regel-Table

Assoziationsanalyse Ergebnis 2/2 Überblick über alle erzeugten Regeln: Abbildung 6.5: Regel-Table 2

Assoziationsanalyse Fazit Häufig zusammen gekauft werden Zins, Depot und Riester in allen möglichen Kombinationen Macht Sinn, da alle drei Produkte im Kern Sparprodukte darstellen Starken Lift erzeugen Riester-Produkte, die sowohl für Zins, als auch Zins Kombination mit Giro oder Depot häufig nachgefragt werden Diese Produkte werden jedoch vergleichsweise selten verkauft Handlungsmöglichkeiten: Kunden, die bereits ein oder mehrere Produkte besitzen, könnten entsprechend interessiert sein an den ermittelten Kombinationen. So bietet es sich an, Besitzer von Zins, die noch über kein Depot verfügen, ein Produktangebot vorzubereiten bzw. Depot-Besitzern auch Linuszins anzubieten.

Modeling Clusteranalyse Teil der Aufgabenstellung: Entwickeln Sie jeweils ein Produktbezogenes Data-Mining-Modell zur Prognose von Cross-Selling-Abschlüssen auf die Produkte Linuskredit, Linusdepot, Linusgiro, Linuszins und Linusriester. Ziel der Analyse Eindruck über die Kundenstruktur gewinnen. Gibt es typische Nutzergruppen, die ähnliche Eigenschaften aufweisen?

Clusteranalyse Vorbereitung der Daten für Clusteranalyse Benötigter Datensatz: Kunden_binary200812 Enthaltene Daten: Kundennummer als ID Produktnutzung (Kredit, Depot, Giro, Zins, Riester) binär 0 oder 1 Vermögensausprägung (negativ, ausgeglichen, positiv) nominal -1, 0 oder 1 Alter (in 5 Stufen) nominal Kreditwürdigkeit (gut, schlecht, unbekannt) nominal Beziehungsdauer (5 Stufen) nominal Kanal (Online, Filiale) binär

Clusteranalyse Vorgehen Nachdem der Clusternode keine zufriedenstellenden Ergebnisse hervorbrachte, kam der SOM/Kohonen-Node zum Einsatz Vorgehen: Sampling-Node mit Simple-Random (12345) als Starteinstellung und 4x6 Clustern Anschließend Beobachtung des Distance-Plots auf eine gleichmäßige Verteilung der Cluster und Prüfung der Clusterhäufigkeit in den Statistics Schrittweise Reduzierung der Clusterzahl brachte bei 2x3 Clustern das erste gute Ergebnis, bei dem die Cluster gut verteilt waren und keine Häufung mehr auftrat. Als wichtige Variablen zeigt sich stets die Beziehungsdauer, die Vermögensausprägung, Giro, Depot, Zins, Kredit. Abbildung 6.6: Datenfluss

Clusteranalyse Ergebnis 1/5 Abbildung 6.7: Übersicht Cluster

Clusteranalyse Ergebnis 2/5 Abbildung 6.8: Distanzgraph ermittelten Distanzgraphen deutlich getrennt

Clusteranalyse Ergebnis 3/5 Abbildung 6.9: Altersverteilung Das Alter wurde nicht in die Cluster-Unterscheidung einbezogen

Clusteranalyse Ergebnis 4/5 Abbildung 6.10: Produktverteilung Schwerpunkt der Produkte auf verschiedene Klassen

Clusteranalyse Ergebnis 5/5 Abbildung 6.11: Verteilung von Kreditwürdigkeit und Vermögensausprägung Während Vermögensausprägung durchaus einen Einfluss hat, ist die Kreditwürdigkeit in allen Clustern gleich verteilt

Clusteranalyse Fazit Es zeigen sich zwei auffällige Cluster-Gruppierungen: So gibt es stets ein Cluster Kreditkunden, das einen erheblichen Anteil an Kreditkunden beinhaltet, die eine stark negative Vermögensausprägung aufweisen und eine mittlere Beziehungsdauer ab 3 Jahren erreichen Die zweite Gruppe sind die Sparkunden mit positiver Vermögensausprägung, langer Bindungsdauer teils über 10 Jahre und allen drei Spar-Produkten Zins, Depot und Giro Die dritte Gruppe umfasst die verbleibenden Cluster mit vorrangig ausgeglichenem Vermögen und häufig einem Girokonto oder Depot Handlungsmöglichkeiten: Es lässt sich erkennen, dass im Cluster der Sparkunden die klassischen Sparprodukte häufig nachgefragt werden. Ein Ansatz wäre, Kunden zu finden, die ebenfalls vermögend sind, aber noch nicht alle Produkte besitzen. Zusätzlich ist eine Aktion denkbar, bei der Kunden, die alle Produkte besitzen, aber nur geringe Einlagen aufweisen, zusätzliches Geld überweisen, weil sie mit hoher Wahrscheinlichkeit noch woanders über Konten mit Spareinlagen verfügen.

Kampagnen-Management … Modeling Assoziationsanalyse Clusteranalyse Prognosemodelle Standardprognosemodelle Giro Kredit Riester Zins Depot Kampagnen-Management

Modeling Prognosemodelle Teil der Aufgabenstellung: Entwickeln Sie jeweils ein produktbezogenes Data-Mining-Modell zur Prognose von Cross-Selling-Abschlüssen auf die Produkte linuskredit, linusdepot, linusgiro, linuszins und linusriester. Ziel der Modelle Klassifikation von Kunden, um Wahrscheinlichkeiten für Produktabschlüssen zu prognostizieren.

Modeling Vorbereitung der Daten für die Prognosemodelle Benötigte Datensätze: Kundendaten_200806 Kundendaten_200812 Transformationen: Alter (nominal 5 Klassen) Vermögensausprägung (ordinal -1 0 und 1) Produktnutzung (binär für jedes Produkt) Beziehungsdauer (nominal 5 Klassen) Kundenwert (Initialwert): Klasse (nominal A bis E) Umsatz (metrisch) Ausgangsdaten: Kundennummer (id) Alter (nominal 5 Klassen) Kanal (binär) Kreditwürdigkeit (nominal 3 Klassen) Vermögensausprägung (ordinal -1 0 und 1) Giro (binär) Kredit (binär) Riester (binär) Zins (binär) Depot (binär) Beziehungsdauer (nominal 5 Klassen) Klasse (nominal 5 Klassen) Umsatz (interval 115-4365)

Erstellung von Standardprognosemodellen Vorgehen 1/2 Aufgrund der Daten in Kundendaten_200806 Modelle entwickeln, welche Prognosen für Produktabschlüsse erstellen Prognosen werden mit den tatsächlichen Daten aus Kundendaten_200812 verglichen und anhand der Misclassification Rate und dem Fehler zweiter Art bewertet Fehler zweiter Art sollte möglichst klein sein, da dieser potentielle Kunden angibt, die nicht angesprochen werden  entgangener Umsatz Um ein möglichst optimales Prognosemodell zu erhalten werden zunächst drei Standardmodelle erstellt und davon das geeignetste weiter optimiert Bevorzugt wird nach Möglichkeit der Entscheidungsbaum, da er viele positive Eigenschaften wie Verständlichkeit und hohe Performance besitzt Ausschluss von Kundendaten, welche bereits durch Kampagnen angesprochen wurden, um die Ergebnisse nicht zu verfälschen

Erstellung von Standardprognosemodellen Vorgehen 2/2 Anlegen zweier paralleler Datenstränge für je Trainings- bzw. Validierungsdaten aus Kundendaten_200806 und Testdaten aus Kundendaten_200812 Abbildung 6.12: Datenfluss

Erstellung von Standardprognosemodellen Einstellungen 1/3 Umsatz aus Datensatz ausschließen, da indirekt im Kundenwert enthalten: Abbildung 6.13: Attribute ausschließen Anlegen von fünf Pfaden (mit je zwei Datensträngen) für jedes Produkt Jeweiliges Produkt als Target definieren: Abbildung 6.14: Zielvariable definieren

Erstellung von Standardprognosemodellen Einstellungen 2/3 Künstliches Angleichen der Verteilung in den Target-Variablen, um neutralen Trainingsdatensatz zu erhalten Abbildung 6.15: Verteilung Gleichverteilung der Daten für Target, sodass keine Ausprägung der Variable dominiert Abbildung 6.16: Angleichen

Erstellung von Standardprognosemodellen Einstellungen 3/3 Datenstränge für Training, Validierung und Test aufteilen: Standardmodelle des Künstlichen Neuronalen Netzes, der Regresion und des Entscheidungsbaums erstellen: Abbildung 6.17: Datensatzaufteilung Abbildung 6.18: Standardmodelle Abbildung 6.19: Output

Erstellung von Standardprognosemodellen Vergleich Standardmodelle im Assesment-Node vergleichen Besonders geeignetes Modell auswählen, welches weiter zu optimieren ist Abbildung 6.20: Assesment Auswahl anhand von Missclassifcation für Test Erklärung: Test: Vergleich des Modells mit Dezember Validation: Zur Optimierung Trainingsmodelle Bevorzugte Auswahl für Entscheidungsbaum, sofern er nicht wesentlich schlechter ist

Optimierung Entscheidungsbaum Einstellungen Wichtigstes Bewertungskriterium ist die Misclassifiation Rate im Testdatensatz und der prozentuale Fehler zweiter Art Wenn alle Standardmodelle auf ähnlichen Niveau sind wird der Entscheidungsbaum versucht zu optimieren Wenn sich größere Abweichungen ergeben werden zusätzlich zum Entscheidungsbaum auch andere Modelle optimiert Optimierung Entscheidungsbaum: Absenkung es Signifikanzlevels im Chi-Quadrat-Test Absenkung der minimalen Beobachtungen je Blattkonten Erhöhung der benötigten Beobachtungen für jede Split-Suche Abbildung 6.21: Einstellung Entscheidungsbaum

Optimierung Neuronales Netz Einstellungen Modellauswahl Kriterium auf Misclassification Rate ändern Versteckte Neuronen erhöhen, direkte Verbindungen zulassen Abbildung 6.22: Methode auswählen Abbildung 6.23: Einstellung Neuronales Netz

Optimierung Regression Einstellungen Methode auf Backward ändern Validation Misclassification als Kriterium wählen Abbildung 6.24: Einstellung Regression

Prognosemodelle Giro Die Misclassifikation Rates im Testdatensatz stellen sich wie folgt zusammen: Abbildung 6.25: Assesment Giro Neuronal Network: 0,0586713728 Optimiert: 0,0597251027 Verschlechterung um 0,1 % Tree: 0,1738551315 Optimiert: 0,1620013139 Verbesserung um 1,2 % Regression: 0,2132549094 Neuronales Netz ist bestes Modell, konnte aber nicht weiter optimiert werden Entscheidungsbaum konnte auch mit Optimierung nicht entsprechend verbessert werden Neuronales Netz wird als Prognosemodell für Giro genommen

Prognosemodelle Giro Fehler zweiter Art von 4,7 % Abbildung 6.26: Fehlerverteilung

Prognosemodelle Kredit Die Misclassifikation Rates im Testdatensatz stellen sich wie folgt zusammen: Abbildung 6.27: Assesment Kredit Neuronal Network: 0,0032127169 Tree: 0,0019142331 Optimiert: 0,0014273017 Verbesserung um 0,05 % Regression: 0,003813008 Alle Modelle liegen nah beieinander auf sehr hohem Niveau Der Entscheidungsbaum konnte somit auch nicht mehr nennenswert optimiert werden Optimierter Entscheidungsbaum wird als Prognosemodell für Kredit genommen

Prognosemodelle Kredit Sehr geringer Fehler zweiter Art von nur 0,8 % Abbildung 6.28: Fehlerverteilung

Prognosemodelle Kredit Entscheidungsregeln im optimierten Entscheidungsbaum Abbildung 6.29: Treeview

Prognosemodelle Riester Die Misclassifikation Rates im Testdatensatz stellen sich wie folgt zusammen: Abbildung 6.30: Assesment Riester Neuronal Network: 0,2605778768 Optimiert: 0,2564376715 Verbesserung von 0,4 % Tree: 0,3665022092 Optimiert: 0,2368728181 Verbesserung um 12,9 % Regression: 0,2132549094 Entscheidungsbaum mit Abstand am schlechtesten Optimierung bei anderen Modellen versprach kein Erfolg Optimierung bei Entscheidungsbaum verbessern Ergebnis signifikant, sodass Ergebnis vergleichbar wird mit anderen Modellen Optimierter Entscheidungsbaum wird als Prognosemodell für Riester genommen

Prognosemodelle Riester extrem hoher Fehler zweiter Art von 47 % Abbildung 6.31: Fehlerverteilung

Prognosemodelle Riester Entscheidungsregeln im optimierten Entscheidungsbaum Abbildung 6.32: Treeview

Prognosemodelle Zins Die Misclassifikation Rates im Testdatensatz stellen sich wie folgt zusammen: Abbildung 6.33: Assesment Zins Neuronal Network: 0,1646240451 Tree: 0,1215602417 Optimiert: 0,1165543805 Verbesserung um 0,5 % Regression: 0,1986989398 Entscheidungsbaum ist per se schon sehr gut, konnte aber nicht signifikant optimiert werden Optimierter Entscheidungsbaum wird als Prognosemodell für Zins genommen

Prognosemodelle Zins extrem hoher Fehler zweiter Art von 44 % Abbildung 6.34: Fehlerverteilung

Prognosemodelle Zins Entscheidungsregeln im optimierten Entscheidungsbaum Abbildung 6.35: Treeview

Prognosemodelle Depot Die Misclassification Rates im Testdatensatz stellen sich wie folgt zusammen: Abbildung 6.36: Treeview Neuronal Network: 0,0889100723 Optimiert: 0,0765976632 Verschlechterung von 1,2 % Tree: 0,0921871981 Optimiert: 0,0380347551 Verbesserung von 5,4 % Regression: 0,1226526169 Der Entscheidungsbaum ist ein guter Ausgangspunkt für das Modell und liefert optimiert, die besten Ergebnisse optimierter Entscheidungsbaum wird als Prognosemodell für Depot genommen

Prognosemodelle Depot 6,9 % Fehler zweiter Art Abbildung 6.37: Fehlerverteilung

Prognosemodelle Depot Entscheidungsregeln im optimierten Entscheidungsbaum Abbildung 6.38: Treeview

Kampangen - Management Fazit … Modeling Assoziationsanalyse Clusteranalyse Prognosemodelle Standardprognosemodelle Giro Kredit Riester Zins Depot Kampangen - Management Fazit

Kampagnen-Management Vorgehen 1/2 Grundsätzliche Arbeitsweise: Vergleich der durchschnittlichen Monatsumsätze für das beworbene Produkt und die gesamte Abschlussmenge Kundenbasis: Wirkgruppe (nahm an Kampagne teil) Kontrollgruppe (nahm nicht an Kampagne teil) Datenbasis: Kampagnen-Tabelle (Kundennummer, Name, Wirkgruppe, Abschluss) Konten-Tabelle (Kundennummer, Abschluss, Produkt) Produkt-Tabelle (Name, Laufzeitertrag)

Kampagnen-Management Vorgehen 2/2 Für eine Bewertung der Kampagne wird nun untersucht, ob die angeschriebenen Kunden im Verhältnis einen höheren Umsatz erzeugt haben als die Kunden, die nicht angeschrieben wurden (Kontrollgruppe) Dazu kann der Gesamtumsatz betrachtet werden. Zur besseren Deckungsbeitragsbewertung ist jedoch die Betrachtung des Umsatzes besser, der ausschließlich mit dem beworbenen Produkt erzielt wurde Abbildung 7.1: Datenfluss

Kampagnen-Management Kreditmailing-Vergleich Ermitteln der Anzahl der angeschriebenen Kunden für die Kampagne: Alle Kunden in Wirkgruppe = 1 mit Kampagnenname = Kreditmailing sind die Wirkgruppe (32.680 Kunden) Alle Kunden in Wirkgruppe = 0 mit Kampagnenname = Kreditmailing sind die Kontrollgruppe (3.610 Kunden) Für die Bewertung des Prognosemodells wurde ein Modell für Kredit auf Basis der Kundendaten mit Stand 200805 prognostiziert, wobei für das Training alle Kunden gefiltert wurden, die an Kampagnen teilgenommen haben Die ermittelten Kunden mit einer Kreditkaufwahrscheinlichkeit werden anschließend nach Wahrscheinlichkeit gescored Für eine Bewertung anhand der gemachten Kampagne wurden nur die Kunden angeschrieben, die sowohl in der Kampagne Kreditmailing aufgeführt waren als auch vom eigenen Prognosemodell als Kaufkunden bewertet wurden Daraus ergibt sich eine Wirkgruppe mit 32.183 Kunden - die Kontrollgruppe bleibt gleich

Kampagnen-Management Kreditmailing-Vergleich Umsatz Wirkgruppe (Zeitraum 6 bis 8): Kredit: 3.908.480 EUR abzgl. Kosten 32.680 * 1,20 = 39.216 EUR Nettoumsatz 3.869.264 EUR Durchschntl. Brutto-Umsatz: 39,87 EUR Durchschntl. Netto-Umsatz: 39,47 EUR Einbezogene Kunden über 3 Monate: 98.040 Umsatz Wirkgruppe (Zeitraum 6 bis 8): mit eigenem Prognose-Modell Kredit auf Basis von Mai für August Kredit: 3.811.950 abzgl. Kosten 32183 * 1,20 = 38.619,6 Nettoumsatz 3.775.800 Durchschntl. Brutto-Umsatz: 39,48 EUR Durchschntl. Netto-Umsatz: 39,08 EUR Einbezogene Kunden über 3 Monate: 90.375 Kontrollgruppe (Zeitraum 6 bis 8): Umsatz Kredit 6 bis 8: 376.270 EUR Durchschntl. Umsatz: 34,74 EUR Einbezogene Kunden über 3 Monate: 10.830

Kampagnen-Management Ergebnis im Vergleich zur Kontrollgruppe Kampagnen-Ergebnisse im Vergleich zu Kontrollgruppe: Lift der Kampagne mit Brutto- und Netto-Ergebnissen 39,86 EUR / 34,74 EUR = 14,75 % 39,46 EUR / 34,74 EUR = 13,59 % Lift der prognostizierten Kampagne mit Brutto- und Netto-Ergebnissen 39,48 EUR / 34,74 EUR = 13,64 % 39,08 EUR / 34,74 EUR = 12,48 % Abbildung 7.2: Aufteilung der Vergleichsguppen

Modeling Assoziationsanalyse Fazit … Clusteranalyse Prognosemodelle Kampangen - Management Fazit

Fazit 1/3 Assoziation Clustering Analyse zeigt guten Ersteindruck über das Kaufverhalten der Kunden Ermöglicht Ergebnisse mit geringem Aufwand Bietet im Gegensatz zu teureren Kampagnen-Aktionen eine günstige Cross-Selling-Grundlage im direkten Verkaufsgespräch Clustering Ermöglicht Identifikation wesentlicher Kundengruppen in bestehender Kundenbasis Bietet guten Ansatz um Kampagnen speziell auf diese Kundengruppen wie Kreditkunden oder Sparkunden auszurichten Alternativ können neue Kampagnen entwickelt werden, um neue Kundengruppen in Abhängigkeit der Firmenstrategie aufzubauen

Fazit 2/3 Prognose für Produkte Scoring liefert gute Ergebnisse für Kredit, Depot und Giro Bei Zins und Riester verursacht der hohe Fehler zweiter Art hohe Opportunitätskosten, da Anteil positiver Kunden sehr gering ist Scoring Aufwändig zu ermitteln Nutzen des Scores und Umfang der einbezogenen Attribute extrem abhängig vom Ziel der Kundenbewertung Für Produktprognose schon sehr einfacher Score auf Umsatzbasis ausreichend, da Modelle bereits über hohe Aussagekraft verfügen

Fazit 3/3 Kampagnen-Management Kampagnen sehr nützlich für Umsatzsteigerung je Kunde im Vergleich zur nicht angeschriebenen Kontrollgruppe Kampagnen-Ergebnisse mit Prognose-Modell erreichen vergleichbar gute Werte trotz eingeschränkter Datenauswahl Abbildung 8.1: Umsatzvergleich

Literatur Hippner, H. et al; (2001): Handbuch Data Mining im Marketing, Vieweg, Wiesbaden Matignon, R.; (2007): Data Mining Using SAS Enterprise Miner, Wiley, New Jersey