Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

ID3 vs. Apriori Christian Schulz, Marc Thielbeer, Sebastian Boldt.

Ähnliche Präsentationen


Präsentation zum Thema: "ID3 vs. Apriori Christian Schulz, Marc Thielbeer, Sebastian Boldt."—  Präsentation transkript:

1 ID3 vs. Apriori Christian Schulz, Marc Thielbeer, Sebastian Boldt

2 Inhaltsverzeichnis 1. Klassifikation ( ID3 ) 2. Assoziationsanalyse ( Apriori ) 3. Klassifikation anhand von Assoziationsregeln 4. Realisierung in KNIME 5. Probleme 6. Auswertung der Ergebnisse 7. Zusammenfassung & Ausblick

3 Klassifikation Zuordnung von Objekten mit gemeinsamen Eigenschaften zu Gruppen/Klassen Im Gegensatz zum Clustering Klassen bereits bekannt Erstellen von Klassifikationsregeln (z.B guter Kunde wenn Alter > 20 und …) Verwendung von Stichproben (Trainigsdaten) NAMERANKSKILLAGE Peter1HIGH18 Gustav2LOW35 Harald3LOW49 Trainingsdaten Klassifikator

4 ID3-Algorithmus Algorithmus der zur Entscheidungsfindung dient Generierung von Entscheidungsbäumen Iterative Basisstruktur Für jedes nicht benutztes Attribut werden Entropien bezüglich der Traningsmenge berechnet Aus Attribut mit höchsten Informationsgehalt wird Baumknoten generiert Das Verfahren terminiert wenn alle Traningsmengen klassifiziert worden sind

5 Assoziationsanalyse Assoziationsregeln beschreiben Korrelationen zwischen gemeinsam auftretenden Dingen Zweck : Auffinden von Elementen einer Menge die das Auffinden anderer Elemente implizieren Beispielregel (Warenkorbanalyse): Kunden die Brot kaufen, werden mit einer Wahrscheinlichkeit von 60 % auch Milch kaufen Support & Konfidenz spielen wichtie Rolle

6 Apriori-Algorithmus Iteratives Verfahren zur Erzeugung von Assoziationsregeln Funktionsweise: Übergabe von: Datensätzen, min. Support, min. Konfidenz Bestimmung von Frequent Itemsets deren relative Häufigkeit min. Support übersteigt Bildung von Assoziationsregeln aus Itemsets die min. Konfidenz erfüllen

7 Klassifikation anhand von Assoziationsregeln Assoziationsregeln für die Klassifikation nutzen Aufstellen der Assoziationsregeln (Apriori Algorithmus) Klassifikation des Datensatzes anhand dieser Regeln NAMERANKSKILLAGE Peter1HIGH18 Gustav2LOW35 Harald3LOW49 Trainingsdaten Assoziationsregeln

8 Realisierung in Knime Nutzung bestehender Bausteine (ID3, Apriori, Decision Tree ) Vergleich von unterscheidlichen Datensätzen Datenvorverarbeitung mittels bestimmter Module Aufteilung von Daten in Trainings und Test-Daten Ausgabe der Ergebnisse

9 Apriori in Knime Auslesen der Daten über File Reader Aufteilung der kontinuierlichen Größen in diskrete Werte mit Numeric Binner Partionierung der Daten in Test und Trainingsdaten

10 Apriori in Knime Manuelles Filtern der Relevanten Regeln Eintragen in die Rule Engine

11 Apriori in Knime Wenn Zielattribut kein boolscher Wert -> One2Many Element notwendig Aufteilung jedes möglichen Wertes in einzelne Spalten mit boolschem Wert

12 ID3 & Decision Tree Knime Einlesen der Daten über File-Reader Aufteilung in Intervalle mittels Numeric Binner Partionierung der Datensätze und Training und Testdaten Vorhersage mittels Predictor

13 Vergleich der Genauigkeiten Vergleich von 4 Datensätzen Bei Klassenanzahl = 1 keine gravierenden Unterscheide Bei höherer Klassenanzahl bessere Klassifizierung mittels Apriori Bei großen Datensätzen zu hoher Aufwand

14 Probleme KNIME-Module bieten nicht die nötigen Ein & Ausgänge Abbildung von numerischen Daten auf Intervalle Abbildung dieser Intervalle auf boolsche Werte Mit Anzahl der Klassen steigt der Konfigurationsaufwand in KNIME A-Priori im Gegensatz zum ID3 unter Knime deshalb sehr aufwändig

15 Zusammenfassung & Ausblick Zielstellung : Apriori Regeln für die Klassififkation von Daten besser geeignet als ID3 ? Knime Module erweitern Für Große Datensätze aufgrund des manuellen Zwischenschrittes in Knime momentan noch ungeeignet Vergleichbare Ergebnisse der unterscheidlichen Ansätze Bei höherer Anzahl von Klassen bessere Klassifizierung


Herunterladen ppt "ID3 vs. Apriori Christian Schulz, Marc Thielbeer, Sebastian Boldt."

Ähnliche Präsentationen


Google-Anzeigen