Data Mining / Wissensextraktion Data Mining Cup 2012 Projektvorstellung Team DataMineCraft Fakultät für Ingenieurwissenschaften Karsten Diepelt Ramona Goesch Hannes Wiencke
2 Gliederung Vorgehensweise Angewendete Modelle/Algorithmen Ergebnisse
1. Vorgehensweise Datenvisualisierung (Verteilung der Verkaufszahlen) 3 1. Vorgehensweise Datenvisualisierung (Verteilung der Verkaufszahlen) Entwicklung erster Testworkflow (PNN DDA) in Knime (insb. zur Fehlerauswertung) ca. 1200 eukl. Fehlerpunkte Nach genauerer Analyse der Trainingsdaten → Aufteilung in Cluster → erhebliche Verbesserung Anwendung verschiedener Modelle/Algorithmen auf Cluster Ergebnisoptimierung anhand verschiedener Clusterparameter
2. Angewendete Modelle/Algorithmen 4 2. Angewendete Modelle/Algorithmen Neuronales Netz (PNN DDA) Entscheidungsbaum Lineare Regression SVM Bayes
5 3. Ergebnisse PNN: 7 Cluster (Mittelwert, Summe, std. Abweichung) → 614 8 Cluster (Varianz, 300 Iterationen) → 617 4 Cluster (Mittelwert, Summe, std. Abweichung) → 654 Lineare Regression: 8 Cluster (Mittelwert, Summe, std. Abweichung) → 510 8 Cluster (Mittelwert, std. Abweichung) → 513 3 Cluster (Mittelwert, std. Abweichung) → 526
6 Danke!