Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Zur Veranstaltung Business Intelligence

Ähnliche Präsentationen


Präsentation zum Thema: "Zur Veranstaltung Business Intelligence"—  Präsentation transkript:

1 Zur Veranstaltung Business Intelligence
Data Mining Untersuchung der Umfragedaten der Direktstudenten im Bereich Wirtschaft der Hochschule Wismar mit der Open- Source Software KNIME Zur Veranstaltung Business Intelligence Vorgetragen von: Sina Maria Viehhofer Sophie Wieckowski Betreuer: Prof. Dr. Jürgen Cleve Datum:

2 Gliederung Datenvorbereitung Data Mining Clustering Klassifikation
Assoziationsanalyse Fazit

3 Datenvorbereitung Überprüfung auf Vollständigkeit Vollständigkeit
Ermittlung fehlender Werte mithilfe von kNN Datensatz Ergebnis Fr.13 WS Ergebnis Fr. 15 Ergebnis Fr. 23 22 2 60% 62 5 33% 1 41% 64 54% 87 32% 110 38% 170 70 190 Konsistenz Widersprüche identifizieren Wenn möglich korrigieren ggf. als fehlerhaft markieren

4 Datenvorbereitung Detaillierungsgrad Detaillierungsgrad reduzieren
Fragen zusammenfassen Antwortmöglichkeiten zusammenfassen Frage 6+7 (Erststudium und vorheriger Studiengang) Frage 6 Erststudium Frage 6.2 nominal Erststudium Frage (Arbeit und Stundenzahl)  Frage 13 Arbeit Frage (Fernseher und Stundenzahl)  Frage 22 Fernseher Frage (Videospiele und Stundenzahl)  Frage 24 Videospiele Frage  Antwortmöglichkeit WG in Mietwohnung ergänzt Transformation Umwandlung in numerische Daten

5 Gliederung Datenvorbereitung Data Mining Clustering Klassifikation
Assoziationsanalyse Fazit

6 Data Mining Clustering k-Means Keine sinnvollen Ergebnisse
Sinnvolle Kategorisierung bereits bei der Erstellung des Fragebogens vorgenommen

7 Fehlerfreiheit > 80 Prozent
Data Mining Klassifikation Entscheidungsbaum Vergleich Decision Tree Learner – Node (Gini- Index, Gain-Ratio) mit dem J48-Node (C4.5-Algorithmus) Fehlerfreiheit > 80 Prozent Attribut Fehlerfreiheit in Prozent Erststudium 90,425 Studium an der Hochschule Wismar aufgrund der Empfehlung 84,043 Studium an der Hochschule Wismar aufgrund im Fragebogen nicht aufgeführter Gründe 96,17 Zur Hochschule mit der Bahn 95,745 Zur Hochschule mit dem Bus 94,681 Zur Hochschule mit dem Auto 81,915 Zur Hochschule mit dem Motorrad 98,936 Fortbewegung in Wismar mit dem Bus 92,553 Fortbewegung in Wismar mit dem Fahrrad 86,17

8 Data Mining Klassifikation k- Nearest Neighbor
Überprüfung auf Vollständigkeit Ermittlung fehlender Wert emit Hilfe von kNN Fehlerfreiheit Spanne von 25% bis 100% In Summe 61% Höchste Genauigkeit bei Multiple-Choice Fragen

9 Data Mining Klassifikation Naive Bayes
Attribute müssen voneinander unabhängig sein Ausgabe über Scorer möglich Attribut: Leistung Fehlerfreiheit 61% Distanz 74 Durchschnittliche Distanz 1,17 Fehlerfreiheit Gesamt: 63%

10 Assoziationsregeln Bsp.:
Data Mining Assoziationsanalyse A-Priori Interessantheitsmaße: Konfidenz + Support Ausgabe in Assoziationsregeln Assoziationsregeln Bsp.: 1. Alter= finanz.. Unterstützung=ja (109 DS) ==> Erststudium=ja conf:(0.97) 2. Alter= Bafög=nein + Mit Leistung zufrieden=ja + ausreichend?=ja (38 DS) ==> finanz. Unterstützung=ja (37 DS) Conf:(0.97)

11 Gliederung Datenvorbereitung Data Mining Clustering Klassifikation
Assoziationsanalyse Fazit

12 Fazit Auswahl des richtigen Verfahrens von großer Bedeutung.
Die Beurteilung ob ein Fehlerfreiheitsmaß ausreichend ist, muss individuell anhand der Daten und des Verfahrens erfolgen. Eine allgemeingültige Definition existiert nicht. Algorithmus Durchschnittliche Fehlerfreiheit in Prozent k-Means k-Nearest Neighbor 61 NaiveBayes 63 C4.5 67 Apriori ---- Data Mining als unterstützendes Werkzeug

13 Danke für die Aufmerksamkeit


Herunterladen ppt "Zur Veranstaltung Business Intelligence"

Ähnliche Präsentationen


Google-Anzeigen