Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Data Mining Untersuchung der Umfragedaten der Direktstudenten im Bereich Wirtschaft der Hochschule Wismar mit der Open- Source Software KNIME Vorgetragen.

Ähnliche Präsentationen


Präsentation zum Thema: "Data Mining Untersuchung der Umfragedaten der Direktstudenten im Bereich Wirtschaft der Hochschule Wismar mit der Open- Source Software KNIME Vorgetragen."—  Präsentation transkript:

1 Data Mining Untersuchung der Umfragedaten der Direktstudenten im Bereich Wirtschaft der Hochschule Wismar mit der Open- Source Software KNIME Vorgetragen von: Sina Maria Viehhofer Sophie Wieckowski Betreuer: Prof. Dr. Jürgen Cleve Datum: Zur Veranstaltung Business Intelligence

2 Data Mining – Untersuchung der Direktstudenten im Bereich Wirtschaft Sina Viehhofer; Sophie Wieckowski 2 Gliederung 1.Datenvorbereitung 2.Data Mining -Clustering -Klassifikation -Assoziationsanalyse 3.Fazit

3 Data Mining – Untersuchung der Direktstudenten im Bereich Wirtschaft Sina Viehhofer; Sophie Wieckowski 3 Datenvorbereitung Vollständigkeit Konsistenz Überprüfung auf Vollständigkeit Ermittlung fehlender Werte mithilfe von kNN Widersprüche identifizieren Wenn möglich korrigieren ggf. als fehlerhaft markieren DatensatzErgebnis Fr.13WSErgebnis Fr. 15WSErgebnis Fr. 23WS 22260% 62533%141% 64054% 87532% % %

4 Data Mining – Untersuchung der Direktstudenten im Bereich Wirtschaft Sina Viehhofer; Sophie Wieckowski 4 Detaillierungsgrad Detaillierungsgrad reduzieren Fragen zusammenfassen Antwortmöglichkeiten zusammenfassen Transformation Umwandlung in numerische Daten Datenvorbereitung Frage 6+7 (Erststudium und vorheriger Studiengang) Frage 6 Erststudium Frage 6.2 nominal Erststudium Frage (Arbeit und Stundenzahl) Frage 13 Arbeit Frage (Fernseher und Stundenzahl) Frage 22 Fernseher Frage (Videospiele und Stundenzahl) Frage 24 Videospiele Frage 16 Antwortmöglichkeit WG in Mietwohnung ergänzt

5 Data Mining – Untersuchung der Direktstudenten im Bereich Wirtschaft Sina Viehhofer; Sophie Wieckowski 5 Gliederung 1.Datenvorbereitung 2.Data Mining -Clustering -Klassifikation -Assoziationsanalyse 3.Fazit

6 Data Mining – Untersuchung der Direktstudenten im Bereich Wirtschaft Sina Viehhofer; Sophie Wieckowski 6 Data Mining Clustering Keine sinnvollen Ergebnisse Sinnvolle Kategorisierung bereits bei der Erstellung des Fragebogens vorgenommen k-Means

7 Data Mining – Untersuchung der Direktstudenten im Bereich Wirtschaft Sina Viehhofer; Sophie Wieckowski 7 Data Mining Klassifikation Entscheidungsbaum Vergleich Decision Tree Learner – Node (Gini- Index, Gain-Ratio) mit dem J48-Node (C4.5- Algorithmus) Fehlerfreiheit > 80 Prozent Attribut Fehlerfreiheit in Prozent Erststudium90,425 Studium an der Hochschule Wismar aufgrund der Empfehlung 84,043 Studium an der Hochschule Wismar aufgrund im Fragebogen nicht aufgeführter Gründe 96,17 Zur Hochschule mit der Bahn95,745 Zur Hochschule mit dem Bus94,681 Zur Hochschule mit dem Auto81,915 Zur Hochschule mit dem Motorrad98,936 Fortbewegung in Wismar mit dem Bus92,553 Fortbewegung in Wismar mit dem Fahrrad86,17

8 Data Mining – Untersuchung der Direktstudenten im Bereich Wirtschaft Sina Viehhofer; Sophie Wieckowski 8 Data Mining Klassifikation k- Nearest Neighbor Überprüfung auf Vollständigkeit Ermittlung fehlender Wert emit Hilfe von kNN Fehlerfreiheit Spanne von 25% bis 100% In Summe 61% Höchste Genauigkeit bei Multiple-Choice Fragen

9 Data Mining – Untersuchung der Direktstudenten im Bereich Wirtschaft Sina Viehhofer; Sophie Wieckowski 9 Data Mining Klassifikation Naive Bayes Attribute müssen voneinander unabhängig sein Ausgabe über Scorer möglich Attribut: Leistung Fehlerfreiheit 61% Distanz 74 Durchschnittliche Distanz 1,17 Fehlerfreiheit Gesamt: 63%

10 Data Mining – Untersuchung der Direktstudenten im Bereich Wirtschaft Sina Viehhofer; Sophie Wieckowski 10 Data Mining Assoziationsanalyse A-Priori Interessantheitsmaße: Konfidenz + Support Ausgabe in Assoziationsregeln Assoziationsregeln Bsp.: 1. Alter= finanz.. Unterstützung=ja (109 DS) ==> Erststudium=ja conf:(0.97) 2. Alter= Bafög=nein + Mit Leistung zufrieden=ja + ausreichend?=ja (38 DS) ==> finanz. Unterstützung=ja (37 DS) Conf:(0.97)

11 Data Mining – Untersuchung der Direktstudenten im Bereich Wirtschaft Sina Viehhofer; Sophie Wieckowski 11 Gliederung 1.Datenvorbereitung 2.Data Mining -Clustering -Klassifikation -Assoziationsanalyse 3.Fazit

12 Data Mining – Untersuchung der Direktstudenten im Bereich Wirtschaft Sina Viehhofer; Sophie Wieckowski 12 Fazit AlgorithmusDurchschnittliche Fehlerfreiheit in Prozent k-Means0 k-Nearest Neighbor61 NaiveBayes63 C4.567 Apriori---- Auswahl des richtigen Verfahrens von großer Bedeutung. Die Beurteilung ob ein Fehlerfreiheitsmaß ausreichend ist, muss individuell anhand der Daten und des Verfahrens erfolgen. Eine allgemeingültige Definition existiert nicht. Data Mining als unterstützendes Werkzeug

13 Danke für die Aufmerksamkeit


Herunterladen ppt "Data Mining Untersuchung der Umfragedaten der Direktstudenten im Bereich Wirtschaft der Hochschule Wismar mit der Open- Source Software KNIME Vorgetragen."

Ähnliche Präsentationen


Google-Anzeigen