Data Mining / Wissensextraktion

Slides:



Advertisements
Ähnliche Präsentationen
Präsentiert von Torben Pastuch
Advertisements

Arbeitsgruppe Meteorologische Umweltforschung/Klimatologie Institut für Meteorologie und Geophysik der J. W. Goethe-Universität Frankfurt/M. Anwendung.
Data Mining Anwendungen und Techniken
Team 1 Annemarie Ulbricht, Ariane Kunst, Jan Bierer
Data Mining Definition, Anwendungsbespiele Data Mining Prozess
TECHNISCHE UNIVERSITÄT DARMSTADT Naive Bayes for Ranking
Rechnergestützte Musikanalyse Einführung Projektseminar Musikwissenschaftliches Institut Hamburg WS 2005/06 Leitung: Klaus Frieler.
Die Selbstbewertung – Ablauf im Betrieb
des Rebound-Effekts (REBOUND)
Harmonisierung von Ontologien Martin Zobel. Was versteht man in der Informatik unter einer Ontologie? Wikipedia: Unter Ontologie versteht man in der Informatik.
Zufallsgrößen und Beschreibung – Wiederholung Sek. I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Andreas Hense Meteorologisches Institut Universität Bonn
Computerkurs: Quantitative Auswertung biochemischer Experimente Guten Morgen.
Übung zur Vorlesung Theorien Psychometrischer Tests I
K. Desch - Statistik und Datenanalyse SS05
Projekt A4: Alignment of Situation Models Gert Rickheit Sven Wachsmuth Constanze Vorwerg Agnes Swadzba SFB-Kolloqium,
Herzlich willkommen beim 1. Workshop der AG Methodik
Das Projekt Transnationale Weiterentwicklung der Qualifizierung von Europäischen Betriebsräten zur Verbesserung der Interessenvertretung der Arbeitnehmer.
Aufgabe Der Zusammenhang zwischen einem traumatischen Erlebnis und der Entstehung einer PTBS wird von mehreren Variablen …………….: Copingstrategien, Kontrollüberzeigung,
Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des.
Mögliche Funktionenklassen
Classification of Credit Applicants Using Data Mining. Thema.
Unser zehntes Tutorium Materialien unter:
Niedersachsen Niedersachsens Zukunft sichern mit guter Bildung und solider Finanzpolitik.
(Gini-Koeffizient, Lorenz-Kurve)
XYZ - Analyse Abazi Valon 3YHWIL.
SEP Mimikerkennung in Videobildern
Machine Learning KNN und andere (Kap. 8).
Betrügern auf der Spur WIN-Treffen 2010 Falko Meyer 04 BW.
Datenverteilung in Ad-hoc Netzen 1/24 Adaptive Datenverteilung in mobilen Ad-hoc Netzen unter Verwendung des Area Graph basierten Bewegungsmodells S. Bittner,
Christian Schulz, Marc Thielbeer, Sebastian Boldt
Self Organizing Tree Algorithm
Bearbeiter: Maren Sötebier, Hannes Neumann, Oliver Böhm
Clustered Neuronal Network A C#.NET project for Compute Cluster Server 2003.
Zur Veranstaltung Business Intelligence
des Business Intelligence Projekts
DataMining Von Daten zu Informationen und Wissen
Die t-Verteilung und die Prüfstatistik
Data Mining mit SQL Server 2008 und Excel 2007
Fuzzy Rule Learner Wissensextraktion / Data-Mining
Mittelwert und Standardabweichung
Versuch zur Messung der Geschwindigkeit
Volumenorientierte Modellierung als Grundlage einer vernetzt- kooperativen Planung im konstruktiven Ingenieurbau Antragsteller: Prof. E. Rank, Prof. H.-J.
Exemplarische Anwendung des MoDALD Ziel Editors am Beispiel: Einführung eines QMS in einem KMU Thomas Vogt –
Einführung in die Programmierung Wintersemester 2012/13 Prof. Dr. Günter Rudolph Lehrstuhl für Algorithm Engineering Fakultät für Informatik TU Dortmund.
STATISIK LV Nr.: 0028 SS Mai 2005.
Statistik: Mehr zur Regression.
Data Mining Cup 2012 Wissensextraktion – Multimedia Engineering
Probabilistic Neural Network
Algorithm Engineering „GPU Algorithmen“
R zieht ein in das Oracle Data Warehouse
Foliensammlung Multivariate Analysemethoden 13. Auflage
Data Mining Georg Pölzlbauer.
Klassifikation und Regression mittels neuronaler Netze
Magisterstudium Scientific Computing Institut für Scientific Computing Infoveranstaltung Masterstudium Scientific Computing.
Varianzanalyse Teststatistik: F – Test -> vergleich zweier Varianzen -> Grundlage der Varianzanalyse Welche „Varianzen“ werden miteinander verglichen?
Evolutionärer Entwurf neuronaler Netze
Übung zur Vorlesung Theorien Psychometrischer Tests I
Erhalt der Privatsphäre beim Data Mining Ulrich Graf Betreuer: Frank Eichinger Seminar im SS 2007 Aktuelle Herausforderungen an Datenschutz und Datensicherheit.
Lernen 1. Vorlesung Ralf Der Universität Leipzig Institut für Informatik
Projekt A4: „Alignment of Situation Models“ Dr. Gerd Rickheit Dr. Sven Wachsmuth Dr. Constanze Vorwerg Agnes Swadzba SFB-Kolloqium,
Deskriptive Statistik, Korrelationen, Mittelwertvergleiche, Graphiken
6./ DGfZ/GfT-Gemeinschaftstagung, Weihenstephan Einfluss der genetischen Architektur auf die empirische Genauigkeit der genomischen Zuchtwertschätzung.
EIN NEUES ENSEMBLE- KLASSIFIKATIONSVERFAHREN Tim Schneider Rotation Forest.
PCA Principal Component Analysis. Gliederung PCA – Warum eigentlich? PCA – Was ist zu tun? Was passiert eigentlich? Anwendungen Zusammenfassung.
Prognose von Zeitreihen Hans Nübel Hans Nübel Prognose von Zeitreihen Aufbau 1.Motivation 2.Holt-Winters-Verfahren 3.Prognose.
Aufgabenstellung  gegeben ist die zeitliche Entwicklung der global gemittelten bodennahen Temperatur im Zeitraum (Dateiname= ytemp2m.obs, ascii-
Independent Component Analysis: Analyse natürlicher Bilder Friedrich Rau.
 Präsentation transkript:

Data Mining / Wissensextraktion Data Mining Cup 2012 Projektvorstellung Team DataMineCraft Fakultät für Ingenieurwissenschaften Karsten Diepelt Ramona Goesch Hannes Wiencke

2 Gliederung Vorgehensweise Angewendete Modelle/Algorithmen Ergebnisse

1. Vorgehensweise Datenvisualisierung (Verteilung der Verkaufszahlen) 3 1. Vorgehensweise Datenvisualisierung (Verteilung der Verkaufszahlen) Entwicklung erster Testworkflow (PNN DDA) in Knime (insb. zur Fehlerauswertung) ca. 1200 eukl. Fehlerpunkte Nach genauerer Analyse der Trainingsdaten → Aufteilung in Cluster → erhebliche Verbesserung Anwendung verschiedener Modelle/Algorithmen auf Cluster Ergebnisoptimierung anhand verschiedener Clusterparameter

2. Angewendete Modelle/Algorithmen 4 2. Angewendete Modelle/Algorithmen Neuronales Netz (PNN DDA) Entscheidungsbaum Lineare Regression SVM Bayes

5 3. Ergebnisse PNN: 7 Cluster (Mittelwert, Summe, std. Abweichung) → 614 8 Cluster (Varianz, 300 Iterationen) → 617 4 Cluster (Mittelwert, Summe, std. Abweichung) → 654 Lineare Regression: 8 Cluster (Mittelwert, Summe, std. Abweichung) → 510 8 Cluster (Mittelwert, std. Abweichung) → 513 3 Cluster (Mittelwert, std. Abweichung) → 526

6 Danke!