1.1.2: Frequent Pattern Growth von Nicolai Voget

Slides:



Advertisements
Ähnliche Präsentationen
Support.ebsco.com Erstellen von Zeitschriften- Benachrichtigungen Lernprogramm.
Advertisements

8. Termin Teil B: Wiederholung Begriffe Baum
Punkt-in-Polygon-Verfahren III (R/R+-Baum)
Grundlagen des A*-Algorithmus und Anwendung in der Routenplanung
Man bestimme den „minimalen aufspannenden Baum“ des Graphen.
Minimum Spanning Tree: MST
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (26-Graphenalgorithmen: Wiederholung und Übung) Prof. Th. Ottmann.
Datenstrukturen, Algorithmen und Programmierung 2 (DAP2)
Apriori-Algorithmus zur Entdeckung von Assoziationsregeln
Fast Algorithm for Mining Association Rules* Vortrag im Rahmen des Seminars Neue Ansätze der Künstlichen Intelligenz Prof. Dr. Katharina Morik Lehrstuhl.
Wo stehen wir? Lernaufgaben: Klassifikation Häufige Mengen finden
Kapitel 6: Klassifizierung von Sortiertechniken
7. Natürliche Binärbäume
Durchlaufen eines Binärbaumes
R. Der - Vorlesung Algorithmen und Datenstrukturen (Magister)
11. Datenkomprimierung Bei den meisten bisher betrachteten Algorithmen wurde vor allem das Ziel verfolgt, möglichst wenig Zeit aufzuwenden, und erst in.
Übung 6.6Schranken 1.Angenommen, Ihr Algorithmus habe einen Aufwand von g(n) = 5n 3 + n für alle n a)Geben sie eine obere Schranke O(g(n)) an. b)Beweisen.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (19 - Analyse natürlicher Bäume) Prof. Th. Ottmann.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (27 – Kürzeste Wege) Prof. Th. Ottmann.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (17 – Bäume: Grundlagen und natürliche Suchbäume) Prof. Th. Ottmann.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (18 - Bäume: Durchlaufreihenfolgen, Analyse nat. Bäume) Prof. Th. Ottmann.
1 Vorlesung Informatik 2 Algorithmen und Datenstrukturen (21 – Kürzeste Wege) T. Lauer.
Algorithmen und Datenstrukturen
Seminar parallele Programmierung SS 2003

Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.
Support.ebsco.com Lernprogramm zur einfachen Suche in wissenschaftlichen Bibliotheken.
Externe Datenstruktur lineare Liste
Heaps und Priority Queues
Minimum Spanning Tree: MST
Beispielrelation Buchbestellungen H = Menge der bedeutenden Ziele = {a, d} Schwelle T = 4 Stichprobe S = {a, b, a, a, a, a} mit s = |S| = 6 N = Anzahl.
Teil I: Uninformierte Suche


Fast Algorithm for Mining Association Rules
The Rectilinear Steiner Tree Problem is NP-complete
Machine Learning Decision Trees (2).
Kurt Mehlhorn Konstantinos Panagiotou
Christian Schulz, Marc Thielbeer, Sebastian Boldt
Splay Trees Von Projdakov Benjamin.
Eine Implementierung einer effiziente externe geordnete (!) lineare Liste Operationen: Search(x) Insert(x) Delete(x)
Effiziente Algorithmen
Diskrete Mathematik II
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen
Effiziente Algorithmen
Effiziente Algorithmen
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen
Information und Kommunikation
Einführung in die Informatik für Naturwissenschaftler und Ingenieure
Berechnung von Association Rules
Ergebnispräsentation Steffen Ciupke Jörg Hipp
Informatik Datenstruktur Graph 3.3 Durchlaufen von Graphen
Einführung in die Informatik für Naturwissenschaftler und Ingenieure (alias Einführung in die Programmierung) (Vorlesung) Prof. Dr. Günter Rudolph Fachbereich.
CloseGraph: Mining Closed Frequent Graph Patterns Xifeng Yan & Jiawei Han In Proceedings of SIGKDD '03. Washington, DC. Präsentation und aktuelle ( )
Das Traveling Salesman Problem (TSP)
Algorithmen und Datenstrukturen 1 SS 2002
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Diskrete Mathematik II Vorlesung Datenstrukturen für den Algorithmus von.
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Diskrete Mathematik II Foliendesign: Jörg Steinrücken & Tobias Kahn Vorlesung
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Diskrete Mathematik II Vorlesung der Algorithmus von Floyd.
Binärer Baum, Binärer Suchbaum I
Matthias Gläfke Data Mining - Seminar im Sommersemester Vortrag Pincer-Search 5. Juni 2007.
Binärbäume.
Häufige Teilgraphen:gSpan Seminartitel: Data Mining Seminarthema:1.5.1 Häufige Teilgraphen: gSpan Fernuniversität Hagen SS 2008 Seminarleiter: Ralf.
Vorlesung April 2000 Polygon Overlay
Eine Näherungslösung für das Problem des Handlungsreisenden
Diskrete Mathematik II
Geschichten erfinden Folge 1.
2.4 Durchlaufen von Bäumen
 Präsentation transkript:

1.1.2: Frequent Pattern Growth von Nicolai Voget Data Mining 1.1.2: Frequent Pattern Growth von Nicolai Voget

Nicolai Voget 1.1.2 Frequent Pattern Growth Seite 1 Inhalt Probleme des Apriori Ideen zur Behebung der Probleme FP-Tree: Die kompakte Datenstruktur FP-Growth: Der effiziente Algorithmus zum Durchlauf von FP-Tree

Nicolai Voget 1.1.2 Frequent Pattern Growth Seite 2 Effizienzprobleme bei Apriori Iterative Generierung der frequent itemsets: Für jede Länge n wird die Datenbank einmal durchlaufen! Generierung durch Verschmelzung: Es werden viele itemsets erzeugt, die nicht häufig sind.

Nicolai Voget 1.1.2 Frequent Pattern Growth Seite 3 Ideen zur Behebung der Probleme Wir brauchen eine Möglichkeit, die Informationen der Datenbank kompakt zu speichern. Massive Reduktion möglich durch folgende Maßnahmen: Nichthäufige Elemente entfernen! Gleiche Transaktionen nicht doppelt speichern! Transaktionen, die gleich anfangen, nicht zweimal komplett speichern!

Nicolai Voget 1.1.2 Frequent Pattern Growth Seite 4 Beispiel

Nicolai Voget 1.1.2 Frequent Pattern Growth Seite 5 Beispiel head of node-link item root e n r u d s b e:3 n:2 r:1 r:2 s:1 u:1 b:1 d:1

Nicolai Voget 1.1.2 Frequent Pattern Growth Seite 6 Beispiel: vollständiger FP-Tree head of node-link item root e n r u d s b e:4 n:1 n:3 r:1 r:1 u:1 r:2 s:1 u:1 s:1 u:1 b:1 d:1 b:1 d:1

Nicolai Voget 1.1.2 Frequent Pattern Growth Seite 7 Problem der Mustererkennung Jeder Knoten hat genau einen Pfad, der zu ihm führt Es kann mehrere wegführende Pfade geben Beginnend beim untersten Element eines jeden Pfades nach oben arbeiten Besitzt unterstes Element eines Teilpfades nicht den minimalen support, muss dieses Element nicht weiter betrachtet werden.

Nicolai Voget 1.1.2 Frequent Pattern Growth Seite 8 Beispiel: von b abhängiger FP-Tree head of node-link item Pfade mit b: <e:4, n:3, u:1, s:1, b:1>, <e:4, r:1, s:1, b:1>} von b abhängige Musterbasis: {(e:1, n:1, u:1, s:1), (e:1, r:1, s:1)} Häufige Elemente: e:2, s:2 root e n r u d s b e:4 n:1 n:3 r:1 r:1 u:1 r:2 s:1 u:1 root head of node-link item s:1 u:1 b:1 d:1 e s e:2 b:1 d:1 s:2