Zur Veranstaltung Business Intelligence

Slides:



Advertisements
Ähnliche Präsentationen
Ergebnisse der 21. Befragungsrunde (I. Quartal 2007)
Advertisements

Anzahl der ausgefüllten und eingesandten Fragebögen: 211
Intelligente Anwendungen im Internet
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil3.
Data Mining Anwendungen und Techniken
Data Mining / Wissensextraktion
Datenvorverarbeitung
Webseitenranking für Suchanfragen anhand von Linkgraphen
Was ist Testtheorie?.
Evaluation der bewegungstherapeutischen Behandlung mit Hilfe des Dortmunder Fragebogens zur Bewegungstherapie DFBT Stuttgart Daniela Croissant.
TECHNISCHE UNIVERSITÄT DARMSTADT Naive Bayes for Ranking
„Netzwerk Medizin und Geschlecht“ an der Medizinischen Hochschule Hannover Projektleitung: Dr. phil. Bärbel Miemietz Projektkoordination: Larissa Burruano,
-17 Konjunkturerwartung Europa September 2013 Indikator > +20 Indikator 0 a +20 Indikator 0 a -20 Indikator < -20 Europäische Union gesamt: +6 Indikator.
Forschungsstatistik II
WS Algorithmentheorie 02 - Polynomprodukt und Fast Fourier Transformation Prof. Dr. Th. Ottmann.
Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.
Internet facts 2006-II Graphiken zu dem Berichtsband AGOF e.V. November 2006.
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil2.
Kapitel 19 Astronomie Autor: Bennett et al. Unsere Galaxis, die Milchstraße Kapitel 19 Unsere Galaxis, die Milchstraße © Pearson Studium 2010 Folie: 1.
Prof. Dr. Bernhard Wasmayr
Studienverlauf im Ausländerstudium
Inhalte und Maßnahmen eingegeben haben,
Beispielrelation Buchbestellungen H = Menge der bedeutenden Ziele = {a, d} Schwelle T = 4 Stichprobe S = {a, b, a, a, a, a} mit s = |S| = 6 N = Anzahl.
Classification of Credit Applicants Using Data Mining. Thema.
Manpower Associates is a $14
PSI Code Neue Leistung im BEMA ab 2004
Prof. Dr. Bernhard Wasmayr VWL 2. Semester
Ralf KüstersDagstuhl 2008/11/30 2 Ralf KüstersDagstuhl 2008/11/30 3.
Betrügern auf der Spur WIN-Treffen 2010 Falko Meyer 04 BW.
Christian Schulz, Marc Thielbeer, Sebastian Boldt
Self Organizing Tree Algorithm
POSITIONIERUNG DES BAUSTOFFHANDELS IN OÖ 2012 WKOÖ POSITIONIERUNG DES BAUSTOFF-FACHHANDELS IN OÖ
Bearbeiter: Maren Sötebier, Hannes Neumann, Oliver Böhm
des Business Intelligence Projekts
Eine Einführung in die CD-ROM
Fuzzy Rule Learner Wissensextraktion / Data-Mining
QS- Dekubitusprophylaxe Klinikstatistik 2007 BAQ
1. 2 BAO-Absolventenbefragung n n Erhebungszeitraum: Nov./Dez n Grundgesamtheit: 171 n Stichprobe: 171 n Rücklauf: 80 n Rücklaufquote: 47 % Dr.
Fachbereich Architektur Bauingenieurwesen Geomatik Prof.Dr. Martina Klärle | Vorstellung Solardachkataster Frankfurt am Main | Datum | Seite.
Bewohnerumfrage 2009 durchgeführt vom
GIS - Seminar Wintersemester 2000/2001
Ich habe mir mal die Mühe gemacht, aus dem
Auslegung eines Vorschubantriebes
1 Nutzen Sie diese Powerpoint-Präsentation beim Selbstlernen oder in Veranstaltungen zur Einführung in das jeweilige Thema. Einführung Lernmodul Nutzungsbedingungen:
Data Mining Cup 2012 Wissensextraktion – Multimedia Engineering
Addieren und Subtrahieren von Dezimalzahlen
Technische Dokumentation für Sollich Turbotemper-Maschinen
R zieht ein in das Oracle Data Warehouse
Prädiktion und Klassifikation mit Random Forest
Diamant Zucker KG Diamant Zucker KG Gliederung: 1. Vorstellung des Betriebes 2. Entwicklung der landwirtschaftlichen Nutzfläche, der Pacht-
Identifizierung von Muschelbänken im Schleswig-Holsteinischen Wattenmeer mittels LiDAR-Daten Dr. Gabriele Müller AG GIS-Küste, 29. April 2013.
Erhebung Zufriedenheitsgrad Kur- und Meeresaufenthalte für Senioren
Ertragsteuern, 5. Auflage Christiana Djanani, Gernot Brähler, Christian Lösel, Andreas Krenzin © UVK Verlagsgesellschaft mbH, Konstanz und München 2012.
Einführung in Datenbankmodellierung und SQL
Kinderferien / Kinderferien für Kinder im Vorschulalter
Symmetrische Blockchiffren DES – der Data Encryption Standard
MINDREADER Ein magisch - interaktives Erlebnis mit ENZO PAOLO
Thema: 100%ige Leistung Wie oft wundern wir uns, wenn wir hören,
Analyseprodukte numerischer Modelle
Folie Beispiel für eine Einzelauswertung der Gemeindedaten (fiktive Daten)
Vortrag von Rechtsanwältin Verena Nedden, Fachanwältin für Steuerrecht zur Veranstaltung Wege zum bedingungslosen Grundeinkommen der Piratenpartei Rhein-Hessen.
Thema: 100%ige Leistung Wie oft wundern wir uns, wenn wir hören, dass alle anderen schon 100% Leistung erbringen! Und wie oft wird von uns verlangt, dass.
Arbeitsberatung der ITG Fachgruppe Matthias Fiedler, Gunter Scheller 13. Juni 2003 Fakultät für Elektrotechnik und Informationstechnik Fachbereich.
01-1-Anfang. 01a-1-Vortrag-Inhalt 14-4-Gründe-Masterplan.
Positionspapier AG-SW syngenio AG
Fragebogenaktion 2013 Jugendamtselternbeirat Andreas Bräutigam.
Folie Einzelauswertung der Gemeindedaten
Datum:17. Dezember 2014 Thema:IFRS Update zum Jahresende – die Neuerungen im Überblick Referent:Eberhard Grötzner, EMA ® Anlass:12. Arbeitskreis Internationale.
CL Tree MW 31.1 Business Intelligence Wintersemester 2015 / 2016 Stanislav Prokupetz.
1. Betreuer: Prof. Dr. Jörg Striegnitz 2. Betreuer: Dr. Martin Schindler Kontextsensitive Autocompletion für Klassendiagramme in der UML/P Florian Leppers.
 Präsentation transkript:

Zur Veranstaltung Business Intelligence Data Mining Untersuchung der Umfragedaten der Direktstudenten im Bereich Wirtschaft der Hochschule Wismar mit der Open- Source Software KNIME Zur Veranstaltung Business Intelligence Vorgetragen von: Sina Maria Viehhofer Sophie Wieckowski Betreuer: Prof. Dr. Jürgen Cleve Datum: 07.01.2013

Gliederung Datenvorbereitung Data Mining Clustering Klassifikation Assoziationsanalyse Fazit

Datenvorbereitung Überprüfung auf Vollständigkeit Vollständigkeit Ermittlung fehlender Werte mithilfe von kNN Datensatz Ergebnis Fr.13 WS Ergebnis Fr. 15 Ergebnis Fr. 23 22 2 60% 62 5 33% 1 41% 64 54% 87 32% 110 38% 170 70 190 Konsistenz Widersprüche identifizieren Wenn möglich korrigieren ggf. als fehlerhaft markieren

Datenvorbereitung Detaillierungsgrad Detaillierungsgrad reduzieren Fragen zusammenfassen Antwortmöglichkeiten zusammenfassen Frage 6+7 (Erststudium und vorheriger Studiengang) Frage 6 Erststudium Frage 6.2 nominal Erststudium Frage 13+14 (Arbeit und Stundenzahl)  Frage 13 Arbeit Frage 22+23 (Fernseher und Stundenzahl)  Frage 22 Fernseher Frage 24+25 (Videospiele und Stundenzahl)  Frage 24 Videospiele Frage 16  Antwortmöglichkeit WG in Mietwohnung ergänzt Transformation Umwandlung in numerische Daten

Gliederung Datenvorbereitung Data Mining Clustering Klassifikation Assoziationsanalyse Fazit

Data Mining Clustering k-Means Keine sinnvollen Ergebnisse Sinnvolle Kategorisierung bereits bei der Erstellung des Fragebogens vorgenommen

Fehlerfreiheit > 80 Prozent Data Mining Klassifikation Entscheidungsbaum Vergleich Decision Tree Learner – Node (Gini- Index, Gain-Ratio) mit dem J48-Node (C4.5-Algorithmus) Fehlerfreiheit > 80 Prozent Attribut Fehlerfreiheit in Prozent Erststudium 90,425 Studium an der Hochschule Wismar aufgrund der Empfehlung 84,043 Studium an der Hochschule Wismar aufgrund im Fragebogen nicht aufgeführter Gründe 96,17 Zur Hochschule mit der Bahn 95,745 Zur Hochschule mit dem Bus 94,681 Zur Hochschule mit dem Auto 81,915 Zur Hochschule mit dem Motorrad 98,936 Fortbewegung in Wismar mit dem Bus 92,553 Fortbewegung in Wismar mit dem Fahrrad 86,17

Data Mining Klassifikation k- Nearest Neighbor Überprüfung auf Vollständigkeit Ermittlung fehlender Wert emit Hilfe von kNN Fehlerfreiheit Spanne von 25% bis 100% In Summe 61% Höchste Genauigkeit bei Multiple-Choice Fragen

Data Mining Klassifikation Naive Bayes Attribute müssen voneinander unabhängig sein Ausgabe über Scorer möglich Attribut: Leistung Fehlerfreiheit 61% Distanz 74 Durchschnittliche Distanz 1,17 Fehlerfreiheit Gesamt: 63%

Assoziationsregeln Bsp.: Data Mining Assoziationsanalyse A-Priori Interessantheitsmaße: Konfidenz + Support Ausgabe in Assoziationsregeln Assoziationsregeln Bsp.: 1. Alter=21-25 + finanz.. Unterstützung=ja (109 DS) ==> Erststudium=ja conf:(0.97) 2. Alter=21-25 + Bafög=nein + Mit Leistung zufrieden=ja + ausreichend?=ja (38 DS) ==> finanz. Unterstützung=ja (37 DS) Conf:(0.97)

Gliederung Datenvorbereitung Data Mining Clustering Klassifikation Assoziationsanalyse Fazit

Fazit Auswahl des richtigen Verfahrens von großer Bedeutung. Die Beurteilung ob ein Fehlerfreiheitsmaß ausreichend ist, muss individuell anhand der Daten und des Verfahrens erfolgen. Eine allgemeingültige Definition existiert nicht. Algorithmus Durchschnittliche Fehlerfreiheit in Prozent k-Means k-Nearest Neighbor 61 NaiveBayes 63 C4.5 67 Apriori ---- Data Mining als unterstützendes Werkzeug

Danke für die Aufmerksamkeit