Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining
© 2008 Gottfried Vossen 16.1 Einführung 16.2 Klassifikation 16.3 Clusterbildung 16.4 Assoziationsanalyse 16.5 Sequenzanalyse 16.6 Web-Mining Inhalt Datenmodelle, 5. Auflage, Kapitel 162
© 2008 Gottfried Vossen Datenquellen (Operationale Datenbanken) Datenlager (Data Warehouse) Data Cleansing, Extraction, Transformation, Loading (ETL) Selektion Mining- Resultate Data Mining Wissen, Information Interpretation, Visualisierung Relevante Daten 16.1 Der KDD-Prozess 3 Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen Data Mining voraussagend (predictive) beschreibend (descriptive) Klassifikation Clustering Assoziations- analyse Sequenz -Analyse Web-Analyse 16.2 Data Mining in der Übersicht 4 Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen Abschluss Einkommen ohneBachelorMaster -30K30-50K50-80K80+K 16.3 Beispiel einer Klassifikation 5 Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen 16.4 Beispiel einer in Cluster aufzuteilenden Datenmenge 6 Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen 16.5 Erstes Clustering 7 Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen 16.6 Alternatives Clustering 8 Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen 16.7 Beispiel einer Warenkorbtabelle 9 Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen 16.8 Nach KundenIDs sortierte Warenkorbtabelle 10 Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen ABCD ABCABDACDBCD ABACBCADBDCD A BCD {} 16.9 Beispiel zum Dynamic Itemset Counting (DIC) 11 Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen Warenkorbtabelle zum FP-Growth-Verfahren 12 Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen {} f:1 c:1 a:1 m:1 p:1 Kopftabelle Item Häufigkeit Kopf f1 c1 a1 b1 m1 p Erster Schritt zur Erzeugung des FP-Tree zum Warenkorb aus Abbildung Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen {} f:2 c:2 a:2 b:1m:1 p:1m:1 Kopftabelle Item Häufigkeit Kopf f2 c2 a2 b1 m2 p Zweiter Schritt zur Erzeugung des FP-Tree zum Warenkorb aus Abbildung Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen {} f:4c:1 b:1 p:1 b:1c:3 a:3 b:1m:2 p:2m:1 Kopftabelle Item Häufigkeit Kopf f4 c4 a3 b3 m3 p Endgültiger FP-Tree zum Warenkorb aus Abbildung Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen Beispieltabelle studentischer Aktivitäten 16 Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen Beispiel einer Episode 17 Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen Beispiel einer Signalfolge 18 Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen Windows in einer Signalfolge 19 Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen Beispiele für Episoden 20 Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen WebseiteHyperlink Das Web als Graph 21 Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen Such- maschinen -Index Benutzeranfrage Indexer Laufzeitsystem Crawler Internet Webseiten Grundsätzliche Arbeitsweise einer Suchmaschine Datenmodelle, 5. Auflage, Kapitel 1622
© 2008 Gottfried Vossen Gefundene Dokumente Relevante und gefundene Dokumente Relevante Dokumente Alle Dokumente Ergebnisklassifikation im Information Retrieval 23 Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen Ausschnitt aus dem Log eines Web-Servers 24 Datenmodelle, 5. Auflage, Kapitel 16