Betrügern auf der Spur WIN-Treffen 2010 Falko Meyer 04 BW
Falko Meyer Inhalt Fokus:Marktmanipulation Situation – Möglichkeiten – Umsetzung (Gegenmaßnahmen)
Falko Meyer Situation Aribert Peters, Vorsitzender des Bundes der Energieverbraucher auf Euro Schaden für die Stromkunden durch einen hochgetriebenen Preis im Jahr Treffer Treffer bei Google mit den Begriffen EEX und Manipulation
Falko Meyer Möglichkeiten Manuelle/visuelle Kontrolle Manuelle/visuelle Kontrolle Maschinelle Unterstützung Maschinelle Unterstützung Akzeptanz Akzeptanz
Falko Meyer Fragestellungen Gibt es bestimmte Gruppen von Händlern? Gibt es bestimmte Gruppen von Händlern? – Branchen, Märkte, Produkte Bestehen Abhängigkeiten zwischen einzelnen Produkten, welche durch einen Prozess und nicht durch das Produkt begründet werden? Bestehen Abhängigkeiten zwischen einzelnen Produkten, welche durch einen Prozess und nicht durch das Produkt begründet werden? – Spot- und Terminmarkt Gibt es verschiedene Prozessmuster und können diese identifiziert werden? Gibt es verschiedene Prozessmuster und können diese identifiziert werden? – Absprachen, Insichgeschäfte, Scheingeschäfte
Falko Meyer Maschinelle Unterstützung Abhängigkeiten – Guppen - Prozessmuster Data Mining Aufgaben Bildung von Clustern Entdeckung von Abhängigkeiten Erstellung von Regressionsmodellen Erstellung von Klassifikationsmodellen
Falko Meyer Suche nach Prozessmustern Identifikation von: Prozess Prozess Prozessdaten Prozessdaten Modell Modell Interpretation von: Ergebnissen Ergebnissen
Falko Meyer Prozessidentifikation Welche Ziele werden verfolgt? Welche Ziele werden verfolgt? –Entdeckung von Unregelmäßigkeiten im Handel von Börsenprodukten Welche Prozesse sind betroffen? Welche Prozesse sind betroffen? –Einzelnes Börsengeschäft/Order
Falko Meyer Datenidentifikation Welche Daten werden benötigt? Welche Daten werden benötigt? –Daten zum Prozess (beschreiben Prozess) –Daten am Prozess (beschreiben Objekte etc.) Welche Daten müssen konstruiert werden? Welche Daten müssen konstruiert werden? –z.B. relative Kennzahlen Ist die Datenqualität ausreichend? Ist die Datenqualität ausreichend? –benötigte Daten müssen ausreichend vorhanden sein –Daten müssen sinnvolles Gesamtbild ergeben
Falko Meyer Modellidentifikation Klassifikations- verfahren Entscheidungs- baumverfahren Bayessche Netze Fuzzy Logik Neuronale Netze
Falko Meyer Durchführung Bildung einer Lern- und Testmenge Bildung des Klassifikationsmodells Überprüfung und Optimierung anhand der Testmenge Integration Kennzeichnung der Betrugsfälle und der korrekten Vorgänge u.a. Entscheidungsbaum, Neuronale Netze, Fuzzy-Logik Bagging, Stacking, X-Validation Prozessintegration Auswahl und Konstruktion der Klassifikationsattribute Orderzeitpunkt, Ordermenge etc.
Falko Meyer Integrationsmöglichkeiten Einmalige Analyse von Vorgängen Einmalige Analyse von Vorgängen Kontinuierliche Anwendung der Modelle Kontinuierliche Anwendung der Modelle Integration der Modelle in einen SOA-Prozess Integration der Modelle in einen SOA-Prozess
Falko Meyer Schlussbemerkungen Klassifikationsmodelle bieten die Möglichkeit Vorgänge/Objekte automatisiert zu bewerten, auch wiederholt und für große Zeiträume Klassifikationsmodelle bieten die Möglichkeit Vorgänge/Objekte automatisiert zu bewerten, auch wiederholt und für große Zeiträume großes Potenzial im Hinblick auf Erlös- bzw. Gewinnsteigerungen großes Potenzial im Hinblick auf Erlös- bzw. Gewinnsteigerungen Hohe Trefferquoten (ca. 85 %) Hohe Trefferquoten (ca. 85 %) Herausforderung ist die Verbindung von IT und Business Herausforderung ist die Verbindung von IT und Business mit CRISP-DM existiert ein unabhängiges Vorgehensmodell für die Einführung von Data Mining mit CRISP-DM existiert ein unabhängiges Vorgehensmodell für die Einführung von Data Mining Open-Source bietet kostengünstigen Einstieg Open-Source bietet kostengünstigen Einstieg Beachtung von rechtlichen Bestimmungen Beachtung von rechtlichen Bestimmungen
Vielen Dank für Ihre Aufmerksamkeit!