Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Data Mining Sascha Enders / Tim Dreesen Wintersemester 07/08

Ähnliche Präsentationen


Präsentation zum Thema: "Data Mining Sascha Enders / Tim Dreesen Wintersemester 07/08"—  Präsentation transkript:

1 Data Mining Sascha Enders / Tim Dreesen Wintersemester 07/08
Version 1.0 Lehrstuhl für Wirtschaftsinformatik und Betriebliche Kommunikationssysteme Prof. Dr. Reinhard Jung

2 Wegweiser Ausgangslage Data Mining Prozess Überblick Techniken
Ausprägungen Anwendung Fazit

3 Wegweiser Ausgangslage Data Mining Prozess Überblick Techniken
Ausprägungen Anwendung Fazit

4 Einleitung Was ist Data Mining?
"Als Data Mining (engl.: data mining; deutsch: Daten-Bergbau, Daten schürfen) bezeichnet man die softwaregestützte Ermittlung bisher unbekannter Zusammenhänge, Muster und Trends aus dem Datenbestand sehr großer Datenbanken bzw. des Data Warehouse. […] “ [HaNe2005] „Data Mining ist die Anwendung spezifischer Algorithmen zur Extraktion von Mustern und Daten“ (nach Fayyad) [AlNi] 4

5 Ausgangslage Wieso Data Mining? Automatische DV auf dem Vormarsch
Datenflut! Entscheidungsfindung über Unternehmensgrenze hinweg Data Warehouse als Lösung Aber was mit dem ganzen Datenwust anstellen??? Herkömmliche Methoden nicht mehr ausreichend Hilfsmittel: Data Mining

6 Ausgangslage Wo ist Data Mining einzusortieren? Ad-Hoc Abfragen
Auswertungssysteme z.B. SQL OLAP, Data Mining Data Warehouse Operative Systeme Abb.: in Anlehnung an [AlNi]

7 Ausgangslage Data Mining als wachsendes Forschungsgebiet Web Mining
Data Warehouse Data Mining Abfragesprachen DBMS KI 1960 1970 1980 1990 2000 Abb.: in Anlehnung an [FrKö] 7

8 Wegweiser Ausgangslage Data Mining Prozess Überblick Techniken
Ausprägungen Anwendung Fazit

9 Auswahl / Datenexploration
Data Mining Prozess Überblick Daten Auswahl / Datenexploration Transformation Zieldaten / Vorverarbeitete Daten Data Mining Transformierte Daten Abb.: in Anlehnung an [AlNi] 9

10 ? Data Mining Prozess Auswahl
Welche Informationsquellen sollen genutzt werden Die Auswahl erfolgt auf einem vorhandenen Datenbestand Relevante Datenfelder / Datensätze werden ausgewählt 10

11 Data Mining Prozess Datenexploration
Ausreißer analysieren und eliminieren z.B. Herr Prof. Dr. Reinhard Jung ist 30 cm groß. Behandlung fehlender Werte z.B. ist Birgitt weiblich? Ziel: Ein möglichst fehlerfreier / konsistenter Datenbestand als Basis für das Data Mining zu schaffen. 11

12 Data Mining Prozess Transformation Daten werden bei Bedarf…
…verändert. …normiert. …kategorisiert. Datenfelder werden neu angelegt z.B. bei Aggregation von Daten Bei den meisten Transformationen werden Daten reduziert 12

13 Data Mining Prozess Zwischenstand
Die ersten drei Phasen sind laut Experten die aufwendigsten innerhalb des Data Mining Prozesses. Sie nehmen ca % des Data Mining ein. Quelle: in Anlehnung an [AlNi] 13

14 Data Mining Prozess Data Mining
Selektion der inhaltlichen Data Mining Techniken z.B. Segmentierung Klassifikation Selektion des konkret anzuwendenden Data Mining Algorithmus Lineare Diskriminanzanalyse Ablauf des Algorithmus über die transformierten Daten 14

15 Data Mining Prozess Wissen Interpretation Ergebnisse 15

16 Wegweiser Ausgangslage Data Mining Prozess Überblick Techniken
Ausprägungen Anwendung Fazit

17 Abhängigkeits-analyse
Methoden Methoden - Überblick Abhängigkeits-analyse Abweichungs-analyse Klassifikation Segmentierung Prognose Operative Systeme Abb.: in Anlehnung an [AlNi]

18 Methoden Klassifikation
Zuordnung von Elementen in bekannte Klassen, z.B. Entscheidungsbaumverfahren > 10tsd Flugmeilen < 10tsd > 2 Woche 1-2 Woche > 2 Woche 1-2 Woche Frequenz Frequenz Platinkunde Goldkunde Kunde Kunde

19 Methoden Segmentierung
Zerlegung einer Gesamtheit in kleinere Teile, z.B. Clusterverfahren (1/2) Beispiel: Lebensmittelvertrieb Erkenntnis: Fleisch- und Fischesser Nächster Schritt: Gruppenbildung Kundennr. Milchprodukte Fleischwaren Waschmittel Gebäck Fisch 4 10 5 12 2 8 6 3

20 Methoden Segmentierung
Zerlegung einer Gesamtheit in kleinere Teile, z.B. Clusterverfahren (2/2) Gruppiert: Nutzung des neuen Wissen z.B. für Personalisierung der Werbung Gruppe Milchprodukte Fleischwaren Waschmittel Gebäck Fisch Fleischesser 3,75 11,2 3,7 10,2 1,7 Fischesser 9,2 6,4 4,2 2,75 12,25 Quelle: in Anlehnung an [HaNe2005]

21 Methoden Prognose auf Basis bestehender Werte auf Zukünftige schließen, Künstliche Neuronale Netze (KNN) Stammt aus der KI Neuronen = Verarbeitungseinheiten Muss erst angelernt werden Einsatz z.B. Kreditrisikorechnung, Käuferklassen, Wertpapiere… Quelle.: in Anlehnung an [ChGl]

22 Methoden Abhängigkeitsanalyse
Beziehungen zwischen zwei Merkmalen aufdecken Assoziationsregeln Beispiel für das Aufdecken von Affinitäten : „Wenn ein Kunde eine Immobilie länger als zwei Jahre mietet und älter als 25 Jahre ist, wird er in 40% aller Fälle eine Immobilie kaufen. Diese Assoziation gilt für 35% aller Kunden, die eine Immobilie mieten.“ Quelle.: in Anlehnung an [ToBo]

23 Methoden Abhängigkeitsanalyse
Beziehungen zwischen zwei Merkmalen aufdecken Assoziationsregeln (1/2) Einkäufe Artikel E1 Saft, Cola, Bier E2 Saft, Cola, Wein E3 Saft, Wasser E4 Cola, Bier, Saft E5 Saft, Cola, Bier, Wein E6 Wasser Artikel Einkäufe Saft E1,E2,E3,E4,E5 Cola E1,E2,E4,E5 Bier E1,E4,E5 Wein E2,E5 Wasser E3,E6 Quelle.: in Anlehnung an [ToBo]

24 Methoden Abhängigkeitsanalyse
Beziehungen zwischen zwei Merkmalen aufdecken Assoziationsregeln (2/2) Regeln Einkäufe Konfidenz Support Saft  Cola E1,E2,E4,E5 80% 66% Cola  Saft 100% Cola  Bier E1,E4,E5 75% 50% Bier  Cola Quelle.: in Anlehnung an [ToBo]

25 Methoden Abweichungsanalyse
Ausreißer identifizieren z.B. mit Ausreißertests Allgemein: Gegenteil der Assoziationsanalysen Versuch der Ursachenentdeckung Ausreißer entweder fehlerhafte Daten oder interessante Ausprägungen! z.B. für Schadensfällen bei Versicherungen, QM, Kreditkartenbetrug oder allg. bei Verfolgung von Defekten Quelle.: in Anlehnung an [ToBo]

26 Wegweiser Ausgangslage Data Mining Prozess Überblick Techniken
Ausprägungen Anwendung Fazit

27 Ausprägungen Text Mining Web Mining 27

28 Ausprägungen TextMining - Aufgaben
Entdecken von Interessanten Beziehungen zwischen Dokumenten Klassifikation von Dokumenten Segmentierung von Dokumenten (Clustering) Erstellen von Abstracts Aufbau von begrifflichen Netzen 28

29 Ausprägungen Data Mining Text Mining
Der grundlegendste Unterschied zwischen Data Mining und Text Mining besteht in den vorliegenden Daten, die zur Verfügung stehen. Stark strukturierte Daten im Data Mining vs. Kaum strukturierte Daten im Text Mining 29

30 Ausprägungen Web Mining – Aufgaben / Unterscheidung
Dieselben Aufgaben die auch Data Mining ausführt, aber mit dem Bezug zum Internet / Intranet. Verarbeitung / Analyse von sekundären Daten die ein Nutzer hinterlässt. Entdecken von Interessanten Beziehungen zwischen Dokumenten –> Durch Analyse der Kundenkorrespondenz stellt sich heraus das Gemeinsamkeiten zwischen dem Kunden von Produktdivision A und dem Kunden von Produktdivision B bestehen. Dadurch könnte man ein evtl. vorhandenes Cross Selling Potenzial nutzen. Klassifikation von Dokumenten  TextMining kann große Dokumentenbasen nach bestimmten Kritieren Kategorisieren, welche gewünscht sind. Segmentierung von Dokumenten  in Anlehnung an Datamining (hat Tim dann schon erklärt. Erstellen von Abstracts  Automatische Generierung einer Zusammenfassung eines Textes. Aufbau von begrifflichen Netzen  entspricht den Neuronalen Netzen im Datamining. 30

31 Wegweiser Ausgangslage Data Mining Prozess Überblick Techniken
Ausprägungen Anwendung Fazit

32 Anwendung Beispiele Neuronalen Netze im Data Mining.
Microsoft analysiert mit Hilfe des Verfahren der Neuronalen Netze im Data Mining. Wieso die einen Kunden auf ihr Postanschreiben antworten und die Anderen nicht. Antwortquote von 2 auf 8% erhöht, mit gleichzeitiger Senkung der Portokosten. Quelle.: in Anlehnung an [WiBu] 32

33 Anwendung Beispiele Eine Firma in den USA, mit 5 Millionen Aufrufe im
Monat, analysierte mit Hilfe von Web Mining Methoden, das Verhalten der Nutzer im Bezug auf Bannerwerbung. Durch nun Zielgerichtete Bannerwerbung konnte die Klickrate von 1% auf 2% erhöht werden. Damit erhöhte sich der Erlös pro Banner, was zu einer Umsatzsteigerung der Firma um 1,2 Millionen Dollar führte. Quelle.: in Anlehnung an [WiBu] 33

34 Wegweiser Ausgangslage Data Mining Prozess Überblick Techniken
Ausprägungen Anwendung Fazit

35 Fazit Kritik Kontext und Handlungsbezug nur durch Individuum möglich!
Lediglich gutes Hilfsmittel zur Mustererkennung Hohe HW-Anforderungen Wirtschaftliche Aspekte berücksichtigen Ausblick Data Mining im großen Unternehmen „Standard“ Markt ist zukunftsträchtig Forschung, vor allem im Bereich Realitätsnaher Interpretation Neue Anwendungsgebiete

36 Fragen

37 Literatur [AlNi] Alpar, P; Niedereichholz, J.: Data Mining im praktischen Einsatz Braunschweig / Wiesbaden 2000 [ChGl] Chamoni, P.; Gluchowski, P.: Analytische Informationssysteme Berlin 2006 [DaKe] Keim, D.: Datenvisualisierung und Data Mining Universität Konstanz und AT&T Shannon Research Labs 2004 [FrKö] Köster, F.: Data Warehousing and Knowledge Discovery in Databases Universität Oldenburg 2003 [GrGe] Grothe, M.; Gentsch, P.: Business Intelligence München 2000 [GrBe] Heinz L. Grob; Frank Bensberg: Das Data Mining Konzept Universität Münster 1999 37

38 Literatur [HaNe2005] Hansen, R.; Neumann, G.: Wirtschaftsinformatik Band 1 + 2, Stuttgart 2005 [MeBo] Mertens; Bodendorf; König; Picot; Schumann; Hess: Grundzüge der Wirtschaftsinformatik, Berlin 2005 [MeWi] Mertens, P.; H.-W. Wieczorrek: Data-X Strategien, Berlin 2000 [RaWa] Walther, R.: Web Mining, Berlin 2001 (Informatik Spektrum 24) [ToBo] Bollinger, T.: Assoziationsregeln – Analyse eines Data Mining Verfahrens, Berlin 1996 (Informatik Spektrum 19 - Hauptbeitrag) [WiBu] Wiedmann, K.; Buckler, F.: Neuronale Netze im Marketing Management Braunschweig / Wiesbaden 2003 38


Herunterladen ppt "Data Mining Sascha Enders / Tim Dreesen Wintersemester 07/08"

Ähnliche Präsentationen


Google-Anzeigen