07.05.02PG402 Wissensmanagement Zeitreihen in Datenbanken 1 PG-402 Wissensmanagement: Zeitreihen in Datenbanken 07.05.2002 Klaus Unterstein.

Slides:



Advertisements
Ähnliche Präsentationen
Zwischen Kontrolle & Freiheit Felix Stalder HGKZ.
Advertisements

PHP Extension und Application Repository
Simulationsansätze in der BWL: Erstellung eines eigenen Projekts
Perceptrons and the perceptron learning rule
PG Intelligence Service
Apriori-Algorithmus zur Entdeckung von Assoziationsregeln
Data Mining Anwendungen und Techniken
SST - Sequence Search Tree
Der B-Baum Richard Göbel.
Statistische Suche nach melodischen Prototypen
Google Larry Page Sergej Brin 7. Sept Google Inc. PageRank – Citation Index – Qualität der Suchergebnisse Wider die Lügen im Hyperraum – Ranking.
1-1 Schlank und schnell zum Datawarehouse Marc Bastien Oracle Deutschland GmbH BTW Leipzig,
Wie lösen wir ILPs exakt?
1/21 UNIVERSITY OF PADERBORN Projektgruppe KIMAS – Reinforcement Learning in MAS Projektgruppe KIMAS Reinforcement Learning in MAS Marc Pannenberg.
Übersicht DIALIGN = DIagonal ALIGNment
Heuristiken und Kontexteinflüsse
Lehrstuhl Informatik III: Datenbanksysteme Achim Landschoof 28. April 2009 Strukturierte P2P Systeme 1 Achim Landschoof Betreuerin: Dipl.-Inf. Jessica.
Sortierverfahren Richard Göbel.
Sortierverfahren Richard Göbel.
WS Algorithmentheorie 05 - Treaps Prof. Dr. Th. Ottmann.
Prof. Dr. S. Albers Prof. Dr. Th. Ottmann
Sortieren vorsortierter Daten
WS Algorithmentheorie 08 – Dynamische Programmierung (2) Matrixkettenprodukt Prof. Dr. Th. Ottmann.
Erweiterte Datenmodelle Referentin: Lena Becker HS: Datenbanken vs. Markup Datum:
Datenbankdesign und Normalisierung
XML-Schema HKI Proseminar Wintersemester 2010/11 Dozentin: Frau Kurz von Jan Kohl und Christian Lütticke.
Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.
Demoprogramm: Clustering Eine graphische Demonstration verschiedener Clusteringalgorithmen anhand des Clusterings von Punkten im zweidimensionalen Raum.
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Geoinformation II Vorlesung In welcher Masche liegt der Punkt p?
Professionelles Projektmanagement in der Praxis
PG 520 Intelligence Service – gezielte Informationen aus dem Internet
1/25 UNIVERSITY OF PADERBORN Projektgruppe KIMAS Projektgruppe KIMAS MultiAgenten-Systeme Andreas Goebels.
Was sind Histogramme? (1)
Datenmanagement in Sensornetzen PRESTO - Feedback gesteuertes Datenmanagement - SS 2007 Sören Wenzlaff.
Beispielrelation Buchbestellungen H = Menge der bedeutenden Ziele = {a, d} Schwelle T = 4 Stichprobe S = {a, b, a, a, a, a} mit s = |S| = 6 N = Anzahl.
Classification of Credit Applicants Using Data Mining. Thema.
1. Einleitung Inhalt dieses Kapitels
Fast Algorithm for Mining Association Rules
Entitäten Extraktion Einführung
Christian Schulz, Marc Thielbeer, Sebastian Boldt
Diskrete Mathe 9 Vorlesung 9 SS 2001
Machine Learning & Spiele: Probleme und Ideen von Samuel bis heute Giuliana Sabbatini
Zur Veranstaltung Business Intelligence
des Business Intelligence Projekts
DataMining Von Daten zu Informationen und Wissen
Service Location Protocol Ein Service Discovery Protokoll Patric Zbinden 20. März 2003.
Markov Cohort Simulation Study Reveals Evidence for Sex-based Risk Difference in Intensive Care Unit Patients R. Baeuerle, A. Ruecker, Th. Schmandra,
Computational Thinking Online Algorithmen [Was ist es wert, die Zukunft zu kennen?] Kurt Mehlhorn Konstantinos Panagiotou.
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Geoinformation II Vorlesung 7 SS 2000 Punkt-in-Polygon-Verfahren I (Trapezkarte)
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Shape Similarity 27. Februar 2006 Michael Keller.
Archival and Discovery
CEF 2001, New Haven Genetic Neural Fuzzy Explorer GENEFER Konzeption, Technologien und Einsatzmöglichkeiten Eric Ringhut Muenster Institute for Computational.
Vom Kontext zum Projekt V Carina Berning Sabrina Gursch Pierre Streicher Intelligente Dateisysteme.
Aufgaben Version 1: Es soll eine Wetterstation mit folgenden zwei Anzeigen implementiert werden: Aktuelle Wetterbedingungen mit Temperatur und.
Stand der Normung um XML (eXtensible Markup Language) & die Aktivitäten des DIN (Stand: November 2000) Bernd Bösler, Referent im DIN/NBü DIN Deutsches.
Fundamente der Computational Intelligence (Vorlesung) Prof. Dr. Günter Rudolph Fachbereich Informatik Lehrstuhl für Algorithm Engineering Wintersemester.
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Geoinformation III Vorlesung 1 WS 2001/02 Punkt-in-Landkarte I (Streifenkarte)
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Diskrete Mathematik II Vorlesung 6 SS 2001 Segmentschnitt III.
Proseminar: Technologien des Internets
Non-Standard-Datenbanken
Niko Zenker1 Besondere Aspekte in Multimedia-Datenbanken Methoden zur iterativen Anfrageverfeinerung (Relevanz Feedback)
1 StatiX: Making XML Count J.Freire, J.R.Haritsa, M.Ramanath, P.Roy, J.Siméon: StatiX: Making XML Count ACM SIGMOD, June 2002 Ann Früchtl
CL Tree MW 31.1 Business Intelligence Wintersemester 2015 / 2016 Stanislav Prokupetz.
Zeitreihen-Analyse Norbert Fuhr, UDE Information Mining.
Chapter 1.
© 2009 Morgan Kaufmann.. © 2009 Morgan Kaufmann.
Frauenanteil im Hochschulbereich (eine komplexe Analyse von internationalen Daten unter dem Gesichtspunkt der Regionalität und von Zeitreihen) László.
Integrating Knowledge Discovery into Knowledge Management
 Präsentation transkript:

PG402 Wissensmanagement Zeitreihen in Datenbanken 1 PG-402 Wissensmanagement: Zeitreihen in Datenbanken Klaus Unterstein

PG402 Wissensmanagement Zeitreihen in Datenbanken 2 Übersicht I.Zeitreihen II.Schritte bei der Zeitreihenanalyse III.Anwendungsfallbeispiel: SLTIME2 IV.Zusammenfassung V.Anhang: Literaturangaben

PG402 Wissensmanagement Zeitreihen in Datenbanken 3 I. Zeitreihen a)Was sind Zeitreihen ? b)Wer braucht sie ? c)Wo findet man sie ? d)Warum gerade Zeitreihen ? e)Wofür sind sie gut ?

PG402 Wissensmanagement Zeitreihen in Datenbanken 4 I. Zeitreihen Univariat - ein Attribut pro Zeit (Temperatur) Multivariat - k Attribute (Temperatur, Luftdruck, Luftfeuchtigkeit) Zeit t 1 t 2 t i t m t m+1 Zeit t 1 t 2 t i t m t m+1 k [Morik/2000a]

PG402 Wissensmanagement Zeitreihen in Datenbanken 5 II. Schritte bei der Zeitreihenanalyse DB AB

PG402 Wissensmanagement Zeitreihen in Datenbanken 6 II. Zeitreihenanalyse Reihenfolge 1.Messung 2.`Tabellarisierung´ 3.Speicherung 4.Daten-Vorverarbeitung 5.Diskretisierung 6.Clustering 7.Assoziationsregeln 8.Bewertung 9.Iterationen

PG402 Wissensmanagement Zeitreihen in Datenbanken 7 II. Zeitreihe – Schritte 1.Messung 2.`Tabellarisierung´ (bereits eine Daten- Vorverarbeitung zur Speicherung) Beispiel: Data-Warehouse 3.Speicherung

PG402 Wissensmanagement Zeitreihen in Datenbanken 8 II. Zeitreihe – Schritte (2) 4.Daten-Vorverarbeitung für Zeitreihenanalyse (Data-Preprocessing) - Eignung der Daten für eine bestimmte Aufgabe (Qualitäts- und Quantitätsprüfung) - Festlegung der Lösungsmenge - Wahl des Verfahrens - Aneignung von Domain-Wissen - Dateninspektion (Behandlung v. Problemen, NULL-Einträge,...) - Vereinfachung(en) für das gewählte Verfahren [nach: DP/1999 mit Modifikationen]

PG402 Wissensmanagement Zeitreihen in Datenbanken 9 II. Zeitreihe – Schritte (3) 5.Diskretisierung von Zeitreihen - Umwandlung von kontinuierlichen Größen in diskrete Größen - Gegeben: Sequenz (s) s = (x 1, …, x n ) - Wahl der Fenstergröße (w) - Subsequenz der Zeitreihe (s i ) s i = (x i, …, x i+w-1 ) [Nach: DLM/1998]

PG402 Wissensmanagement Zeitreihen in Datenbanken 10 II. Zeitreihe – Schritte (4) 6.(Clustering der gefundenen Sub-Sequenzen [k-Means, Greedy-Algorithmen,...]) 7.Nach Assoziationsregeln suchen auf der `diskreten´ Zeitreihe 8.Bewertung der erzeugten Regeln (manuell, J-Measure,...) 9.Iterationen mit anderen Parametern, Verfahren, etc.

PG402 Wissensmanagement Zeitreihen in Datenbanken 11 III. Anwendungsfallbeispiel: SLTIME2 Bisher: Ein (optimaler) Ablauf dargestellt Idealfall ohne Probleme – Praxis meist mit Komplikationen Probleme können in jedem Schritt auftreten

PG402 Wissensmanagement Zeitreihen in Datenbanken 12 III. Ergebnisse anhand der SLTIME2 1.Schritt (1) – (3) waren unbeeinflußbar. 2.(4) Datenvorverarbeitung: - Domainwissenaneignung (Verständnis der Strukturen) - `einfache´ Bereinigung/Korrektur der Daten, Entdeckung von Problembereichen (NULLs, Inkonsistenzen, unmögliche Werte) - Transformation der Zeitstruktur für ein Verfahren 3.(5) - (9) Scheitert derzeit an (4)

PG402 Wissensmanagement Zeitreihen in Datenbanken 13 III. Ergebnisse - Datentransformation a)Transformation: Alle Vertragsereignisse einer Person als Zeitreihe - Granularität der Daten - Vertragszuordnung (VVID->PTID) - Betrachtung der Änderungen - unterschiedliche Anzahl von zu betrachtenden Teilen - grosse Flexibilität des Systems - Kodierung der Ereignisse [ f(x)-> Wert ] - NUR Label vs. Kompletter `Spaltendump´ - MANUELLE Umwandlung einzelner Person

PG402 Wissensmanagement Zeitreihen in Datenbanken 14 III. Ergebnisse – Datentransformation (2) b)Transformation: in DB enthalten. Entscheidungen, wie unterschiedliche Versionen gehandhabt werden sollen. c)Weitere Ideen: - Shop-Beispiel [Höpp/2001, HK/2001]

PG402 Wissensmanagement Zeitreihen in Datenbanken 15 III. Ergebnisse – Datentransformation (3) [Morik/2000a]

PG402 Wissensmanagement Zeitreihen in Datenbanken 16 IV. Zusammenfassung 1.Gezeigt wurde ein allgemeiner Ablauf einer optimalen Zeitreihenanalyse 2.Der aktuelle Stand der SLTIME2 wurde gewählt, um Beispiele und Probleme aufzuzeigen. 3.Weiterhin wurden zwei Ansätze angesprochen, um in der nachfolgenden Diskussion die Machbarkeit und Alternativen zu überlegen!

PG402 Wissensmanagement Zeitreihen in Datenbanken 17 V. Anhang: Literaturangaben [DP/1999]Dorian Pyle. Data Preparation for Data Mining. Morgan Kaufmann, 1999 [Morik/2000a]]Katharina Morik. The Representation Race – Preprocessing for Handling Time Phenomena. In ECML2000 [DLM/1998]Gautam Das, King-Ip Lin, Heikki Mannila. Rule discovery from time series [FB-2001] Fabian Bauschulte. PG402 – Zeitaspekte [SG/2001] Ron Sun, C. Lee Giles. Sequence Learning: From Recognition and Prediction to Sequential Decision Making IEEE-2001 [HK/2001]Frank Höppner, Frank Klawonn. Finding Informative Rules in Interval Sequences. In IDA2001. [Höpp/2001]Learning Temporal Rules from State Sequences. In WLTSD2001. [GuDa]Dimitrios Gunopulos, Gautam Das. Time Series Similarity Measures. [MaSe]Heikki Mannila, Jouni K. Seppänen. Finding similar situations in sequences of events via random projections. Danke!