Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Data Mining 1.1.2: Frequent Pattern Growth von Nicolai Voget.

Ähnliche Präsentationen


Präsentation zum Thema: "Data Mining 1.1.2: Frequent Pattern Growth von Nicolai Voget."—  Präsentation transkript:

1 Data Mining 1.1.2: Frequent Pattern Growth von Nicolai Voget

2 Nicolai Voget1.1.2 Frequent Pattern Growth Seite 1 Probleme des Apriori Ideen zur Behebung der Probleme FP-Tree: Die kompakte Datenstruktur FP-Growth: Der effiziente Algorithmus zum Durchlauf von FP-Tree Inhalt

3 Nicolai Voget1.1.2 Frequent Pattern Growth Seite 2 Effizienzprobleme bei Apriori Iterative Generierung der frequent itemsets: Für jede Länge n wird die Datenbank einmal durchlaufen! Generierung durch Verschmelzung: Es werden viele itemsets erzeugt, die nicht häufig sind.

4 Nicolai Voget1.1.2 Frequent Pattern Growth Seite 3 Ideen zur Behebung der Probleme Wir brauchen eine Möglichkeit, die Informationen der Datenbank kompakt zu speichern. Massive Reduktion möglich durch folgende Maßnahmen: Nichthäufige Elemente entfernen! Gleiche Transaktionen nicht doppelt speichern! Transaktionen, die gleich anfangen, nicht zweimal komplett speichern!

5 Nicolai Voget1.1.2 Frequent Pattern Growth Seite 4 Beispiel

6 Nicolai Voget1.1.2 Frequent Pattern Growth Seite 5 Beispiel ro ot e:3 n:2 r:2 u:1 d:1 r:1 s:1 b:1 item head of node-link enrudsbenrudsb

7 Nicolai Voget1.1.2 Frequent Pattern Growth Seite 6 Beispiel: vollständiger FP-Tree ro ot e:4 n:3 r:2 u:1 d:1 r:1 s:1 b:1 item head of node-link enrudsbenrudsb n:1 r:1 u:1 d:1 u:1 s:1 b:1

8 Nicolai Voget1.1.2 Frequent Pattern Growth Seite 7 Problem der Mustererkennung Jeder Knoten hat genau einen Pfad, der zu ihm führt Es kann mehrere wegführende Pfade geben Beginnend beim untersten Element eines jeden Pfades nach oben arbeiten Besitzt unterstes Element eines Teilpfades nicht den minimalen support, muss dieses Element nicht weiter betrachtet werden.

9 Nicolai Voget1.1.2 Frequent Pattern Growth Seite 8 Beispiel: von b abhängiger FP-Tree ro ot e: 4 n: 3 r: 2 u: 1 d: 1 r: 1 s: 1 b: 1 item head of node-link enrudsbenrudsb n: 1 r: 1 u: 1 d: 1 u: 1 s: 1 b: 1 Pfade mit b:, } von b abhängige Musterbasis: {(e:1, n:1, u:1, s:1), (e:1, r:1, s:1)} Häufige Elemente: e:2, s:2 ro ot e: 2 s: 2 item eses head of node-link


Herunterladen ppt "Data Mining 1.1.2: Frequent Pattern Growth von Nicolai Voget."

Ähnliche Präsentationen


Google-Anzeigen