Rechen- und Kommunikationszentrum (RZ) Datamining-Methoden zur Analyse von Messdaten Immanuel Zumbruch.

Slides:



Advertisements
Ähnliche Präsentationen
8. Termin Teil B: Wiederholung Begriffe Baum
Advertisements

Prognosemodelle und Modellauswahl
Bayes-Netze KI 14-Bayes-Netze.
Chartanalyse mit Erweiterten Indikatoren
7. Natürliche Binärbäume
R. Der - Vorlesung Algorithmen und Datenstrukturen (Magister)
8. Formale Sprachen und Grammatiken
Modellierung und Schätzung von Variogrammen
Seminar „Extrapolationsmethoden für zufällige Felder“
1 1. Splineglättung 1.1 Motivation 1.2 Notation 1.3 Splineglättung
Zeitreihen Gliederung Allgemeines zu Zeitreihen
Neuronale Netze Von Kay-Patrick Wittbold.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (27 – Kürzeste Wege) Prof. Th. Ottmann.
1 Vorlesung Informatik 2 Algorithmen und Datenstrukturen (21 – Kürzeste Wege) T. Lauer.
Computerkurs: Quantitative Auswertung biochemischer Experimente Guten Morgen.
2. Univariate Regressionsanalyse 2.1 Das statische Regressionsmodell
Zeitreihenanalyse WS 2004/2005 Michael Hauhs / Gunnar Lischeid
Neuronale Netze Romy Kuttner, Franco Haberland.
Mögliche Funktionenklassen
Korrelationskoeffizient nach Bravais-Pearson Eigenschaften X und Y unabhängig.
2. Biologische Neuronen Schematischer Aufbau einer Nervenzelle
Neuronale Netzwerke am Beispiel eines MLP
Generalisierte additive Modelle
Christian Schulz, Marc Thielbeer, Sebastian Boldt
Externe Bewertung in IB-Biologie
Stochastische Prozesse I
Ausgleichungsrechnung II
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Kapitel 13 Zeitreihen und Zeitreihen-Modelle
Kapitel 18 Dynamische Modelle: Schätzen der Parameter
Kapitel 19 Kointegration
Kapitel 14 Trends und Unit-root-Tests
Kapitel 13 Zeitreihen und Zeitreihen-Modelle
Wie bewältigt man Stationaritätsannahmen in der Geostatistik? Brenning & van den Boogaart A.Brenning, Humboldt-Universität zu Berlin
Kapitel 14 Trends und Unit-root-Tests
Zeitreihenanalyse und Prognoseverfahren
Ein Überblick über verschiedene Verfahren
SOTA Andrej Gisbrecht
Klassifikation und Regression mittels neuronaler Netze
Statistik – Regression - Korrelation
Modellbildung und Simulation
Methoden der Sozialwissenschaften
Mathematisch-Statistische Verfahren des Risikomanagements - SS Weitere Methoden Interne Daten reichen als einzige Datenquelle nicht aus Andere Modelle.
Stochastik ganz kurz Beispiel diskret Würfelwurf Beispiel stetig
Version vom Max-Flow in Orientierten Matroiden Winfried Hochstättler & Robert Nickel Fernuniversität in Hagen Lehrstuhl für Diskrete Mathematik.
Geoinformationssysteme
PCA Principal Component Analysis. Gliederung PCA – Warum eigentlich? PCA – Was ist zu tun? Was passiert eigentlich? Anwendungen Zusammenfassung.
Statistische Auswertung und Darstellungsmöglichkeiten von Messdaten Seminarvortrag von Christian Gorgels im Studiengang Scientific Programming.
Aachen, | WISS Seminarvortrag von Christian Wißmach Analyse von Zeitreihen.
Seminarvortrag Mobile Darstellung der Backup-Reporte Analyse und Konzept Anita Ludermann Rechen- und Kommunikationszentrum Aachen Stand:
 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.
Prognose von Zeitreihen Hans Nübel Hans Nübel Prognose von Zeitreihen Aufbau 1.Motivation 2.Holt-Winters-Verfahren 3.Prognose.
Außenhandelsbeziehungen zwischen China, USA, EU Makroökonometrie Vorlesung Dr. Oliver Bode.
Umsetzung einer Methode zur Online- Kalibrierung von Sauerstoffsensoren in oberflächenbegasten Bioreaktoren Seminarvortrag Daniel Jansen.
Rechen- und Kommunikationszentrum (RZ) Selektionsstrategien auf Graphstrukturen Sven Porsche Seminarvorträge Aachen.
Independent Component Analysis: Analyse natürlicher Bilder Friedrich Rau.
Seminarvortrag Statistische und numerische Auswertung von Schwingfestigkeits- und Ermüdungsversuchen mit SAFD Lan Tran Aachen,
Einführung Grundlagen Zwischenfazit Deep Learning Probleme Fazit
PHPUG Karlsruhe 1. Juli 2009 Zend_ProgressBar und Zend_Tag_Cloud Ben Scholzen Software Entwickler DASPRiD's.
Satellitengeodäsie Kugelfunktionen Torsten Mayer-Gürr
Ausgleich nach der Methode der kleinsten Quadrate
7.2 Theoretische Kennwerte
Comprehension and Production of Analogical Problems by a Chimpanzee
Generierung von Flächenrepräsentationen aus Punktdaten
Erstellung einer Roadmap für Profilbereiche der RWTH Aachen Video 0: Grundlegendes Vorgehen zur Erstellung einer Roadmap 1.
Kinematische Auswertung
Die Numerische Differentiation
1. Die rekursive Datenstruktur Liste 1.5 Das Entwurfsmuster Kompositum
3. Die Datenstruktur Graph 3.2 Repräsentation von Graphen
 Präsentation transkript:

Rechen- und Kommunikationszentrum (RZ) Datamining-Methoden zur Analyse von Messdaten Immanuel Zumbruch

Seminarvortrag, RZ: Immanuel ZumbruchFolie 2  Einleitung  Motivation, Ziel der Seminararbeit  Mustererkennung  Bayes Klassifikator  K-Nächste-Nachbarn Verfahren  Künstliche Neuronale Netze  Zeitreihenanalyse  Überblick, Komponentenmodelle  Bestimmung der Deterministischen Komponenten  Stochastische Prozesse für die Restkomponenten  Zusammenfassung Inhaltsverzeichnis

Seminarvortrag, RZ: Immanuel ZumbruchFolie 3 Einleitung

Seminarvortrag, RZ: Immanuel ZumbruchFolie 4  Motivation  Sehr viele Messdaten die täglich Anfallen  => Sehr viele potentiell ableitbare, wichtige Informationen!  Bisher unvollständiger Analyseprozess  Nötig zur Extraktion relevanter Informationen aus den Datenmassen  Prozessoptimierung  Kostenreduktion  Einsparung von Ressourcen  Bessere Überwachung von Prozessen  Ziel  Überblick über die vorhandenen Methoden des Dataminings schaffen.  Schwerpunkt: Zeitreihenanalyse Einführung

Seminarvortrag, RZ: Immanuel ZumbruchFolie 5 Mustererkennung

Seminarvortrag, RZ: Immanuel ZumbruchFolie 6  Grundgedanke: Finden einer Entscheidungsfunktion  Klassifizieren von Merkmalsvektor x Entscheidungsfunktion

Seminarvortrag, RZ: Immanuel ZumbruchFolie 7  Wahrscheinlichkeitstheoretischer Ansatz  Jeder Merkmalsvektor kann eindeutig einer Klasse zugeordnet werden.  Sprich:  Jede Klasse hat für die Merkmalsvektoren eine eigene gewichtete Verteilungsfunktion.  Gegeben durch:  Die Entscheidungsfunktion wählt die Klasse für den Merkmalsvektor x, welche die höchste Wahrscheinlichkeit an der Stelle im Merkmalsraum hat.  Entscheidungsfunktion  Umkehrung der Argumente, da E(x) und nicht E(b)! Bayesscher Ansatz

Seminarvortrag, RZ: Immanuel ZumbruchFolie 8 Beispiel – (A Priori-)/Klassenverteilungen

Seminarvortrag, RZ: Immanuel ZumbruchFolie 9 K-Nächste-Nachbarn Klassifikator

Seminarvortrag, RZ: Immanuel ZumbruchFolie 10 Künstliche Neuronale Netze

Seminarvortrag, RZ: Immanuel ZumbruchFolie 11  Was ist ein KNN?  Modelliert funktionale Abhängigkeiten zwischen Ein- und Ausgabe  Wofür verwendet man ein KNN  Klassifizierung  Prognose von Zeitreihen  Bildverarbeitung  Frühwarnsysteme  Schrift-/Spracherkennung Einführung

Seminarvortrag, RZ: Immanuel ZumbruchFolie 12  Aufbau neuronaler Netze von Säugetieren  Neuronen sind Zellkörper, die eingehende Signale weiterleiten  Sind verbunden durch unterschiedlich dicke/geformte Dendriten  An den Enden der Dendriten befinden sich die Synapsen  Am synaptischen Spalt werden Neurotransmitter zur Übertragung Signals verwendet. Biologisches Vorbild

Seminarvortrag, RZ: Immanuel ZumbruchFolie 13  Darstellung durch Graphen  Die Neuronen sind die Knoten des Graphen  Die Dendriten sind die Kanten, welche die Knoten verbinden.  Sind gewichtet und gerichtet!  Die Übertragungssignale werden mit Übergangsfunktionen berechnet.  Schichtenbildung Aufbau von KNNs

Seminarvortrag, RZ: Immanuel ZumbruchFolie 14 Zeitreihenanalyse

Seminarvortrag, RZ: Immanuel ZumbruchFolie 15  Was ist eine Zeitreihe?  Zeitlich geordnete Folge von Messwerten  Endlich  Feste zeitliche Abstände zwischen den Messwerten  Beispiele: Aktienkurse, Temperaturen, BIP, …  Was ist Zeitreihenanalyse  Mathematische Modelle für die deterministischen und nichtdeterministischen Komponenten der Zeitreihe.  Deterministisch: Trend, saisonale Schwankungen  Nichtdeterministisch: Restkomponenten  Ermöglicht besseres Verständnis und Prognose Einführung

Seminarvortrag, RZ: Immanuel ZumbruchFolie 16  Festlegung von Komponenten, in welche die Zeitreihe zerlegt werden soll.  Trendkomponenten  Saisonale Komponenten  Zufallskomponenten  Additives Komponentenmodell  Aufbau:  Multiplikatives Komponentenmodell  Aufbau: Komponentenmodelle

Seminarvortrag, RZ: Immanuel ZumbruchFolie 17  Methode der kleinsten Fehlerquadrate  Schätzen eines Trendpolynoms:  Beispiel: linearer Trend  Zum Schätzen von a und b gilt es folgendes Minimierungsproblem zu lösen  Auch andere Modelle möglich. Z.B. ein exponentielles Wachstum (z.B. Entwicklung der Weltbevölkerung) Trendbestimmung

Seminarvortrag, RZ: Immanuel ZumbruchFolie 18 Trendbestimmung – Beispiel 1

Seminarvortrag, RZ: Immanuel ZumbruchFolie 19  Filterung  Definieren eines Filters  Beispiel: Filter für Monatsdaten  Die 2v Randwerte fallen weg!  Exponentielles Glätten  Rekursive Definition:  Für nahe 1 ist der Einfluss vergangener Werte größer  Wenn nahe 0, werden die zukünftigen Werte stärker gewichtet Trendbestimmung

Seminarvortrag, RZ: Immanuel ZumbruchFolie 20  Bestimmung von Mittelwerten der Elemente mit gleicher Position in den Perioden.  Beispiel für Monatsdaten (bei k vollständigen Perioden):  1.  2.  Lässt sich einfach auf Perioden anderer Länge anpassen  Einfaches Verfahren Saisonale Komponenten

Seminarvortrag, RZ: Immanuel ZumbruchFolie 21  Anpassen eines trigonometrischen Polynoms an die Messwerte  Für k Perioden Verwenden des Ansatzes:  Schätzung der Parameter durch Methode der kleinsten Fehlerquadrate  Nachteil: Viele freie Parameter bei großem Messdatenumfang  Gemeinsame Schätzung mit Trendkomponente möglich  Bei einem linearen Trend z.B.:  Ziel: Subtraktion der Trend- und Saisonkomponenten von der Zeitreihe, zur Ermittlung stationärer Zufallskomponenten! Saisonale Komponenten

Seminarvortrag, RZ: Immanuel ZumbruchFolie 22  Modellierung durch stochastische Prozesse  Stationarität  Ein Stochastischer Prozess heißt (schwach) Stationär, wenn  Kovarianz ist nur noch abhängig vom Abstand der Messwerte zueinander  Heißt Autokovarianzfunktion  Wichtige Voraussetzung um Aussagen über eine ganze Reihe von Messwerten zu machen. Modelle für die Zufallskomponenten

Seminarvortrag, RZ: Immanuel ZumbruchFolie 23  Beispiel für einen einfachen stationären Prozess: Weißes Rauschen  Ein Prozess heißt weißes Rauschen, wenn  Folgende Voraussetzungen gelten für alle Elemente der Zeitreihe:  Die Autokovarianzfunktion errechnet sich zu: Weißes Rauschen

Seminarvortrag, RZ: Immanuel ZumbruchFolie 24  Ein MA-Prozess der Ordnung q ist gegeben durch  Definition:  Die Autokovarianz für einen MA(q)-Prozess:  Bsp.: MA(1)-Prozess  => Autokovarianzfkt.:  Verschwindet für h>1  Struktureigenschaften:  Nur Werte bis zum Lag q beeinflussen den aktuellen Wert. Moving-Average Prozesse

Seminarvortrag, RZ: Immanuel ZumbruchFolie 25  Ein AR-Prozess der Ordnung p ist gegeben durch  Definition:  Oder durch Umformung:  Beispiel: AR(1)-Prozess  Geg. durch  Autokovarianzfkt.:  => Exponentielle Abnahme mit wachsender Entfernung zwischen 2 Werten.  Vorteile: Leichte Schätzung der Parameter, wenn Ordnung feststeht.  Struktureigenschaften: Zufällige Ereignisse, die weit in der Vergangenheit liegen „schwingen“ in der Gegenwart trotzdem mit. Autoregressive Prozesse

Seminarvortrag, RZ: Immanuel ZumbruchFolie 26  Autoregessiver Moving-Average-Prozess der Ordnung p,q (kurz ARMA(p,q)  Definition:  Sind Kombination aus AR- und MA-Prozessen.  Vorteil: Oft weniger Parameter zur Modellierung nötig.  Nachteil: Mathematisch sehr schwierig zu handhaben. ARMA-Prozesse

Seminarvortrag, RZ: Immanuel ZumbruchFolie 27 Zusammenfassung Gegenüberstellung der Methoden zur Datenanalyse

Seminarvortrag, RZ: Immanuel ZumbruchFolie 28  Mustererkennung  Kann verwendet werden für:  Frühwarnsysteme  => Mehrere Messwerte beschreiben gemeinsam Systemzustände  Vorteile  Einfache modellierung  Einfaches training  Schnell  Nachteile  Hilft nicht bei der Prognose  Keine Abbildung zeitlicher Abläufe möglich Mustererkennung

Seminarvortrag, RZ: Immanuel ZumbruchFolie 29  Künstliche Neuronale Netze  Können verwendet werden für:  Prognose, Frühwarnsysteme  Vorteile  Schnell, da Berechnungen paralellisierbar  Anpassbar an viele Probleme  Nachteile  Training ist schwierig  Wahl der passenden Trainingsdaten und des Umfangs  Graphstruktur lässt keine Rückschlüsse auf kausale Zusammenhänge zwischen den Messwerten zu Künstliche neuronale Netze

Seminarvortrag, RZ: Immanuel ZumbruchFolie 30  Zeitreihenanalyse  Kann verwendet werden für:  Analyse zeitlicher Abläufe, Prognose  Vorteile  Liefert verständliche und genaue Modelle für zeitabhängige Daten  Nachteile  Schwierige Wahl des passendes Modells für die Zufallskomponenten  Keine Klassifikation von Zuständen möglich  Keine Zusammenführung mehrerer Messgrößen Zeitreihenanalyse

Seminarvortrag, RZ: Immanuel ZumbruchFolie 31 Vielen Dank für die Aufmerksamkeit! Gibt es noch Fragen?