Zeitreihenanalyse WS 2004/2005 Michael Hauhs / Gunnar Lischeid

Slides:



Advertisements
Ähnliche Präsentationen
Fast Fourier Transformation
Advertisements

Heute 1.F – Test zur Varianzhomogenität 2.Bartlett-Test zur Varianzhomogenität 3.Chi – Quadrat Tests für Häufigkeiten 4.Chi – Quadrat Tests zur Verteilungsanpassung.
Komplexe Zahlen und Fourier-Transformation
Unendliche Reihen Geometrische Reihe Was ist 0,999… 1+q+q2 +…
Modellierung und Schätzung von Variogrammen
1 1. Splineglättung 1.1 Motivation 1.2 Notation 1.3 Splineglättung
Zeitreihen Gliederung Allgemeines zu Zeitreihen
Forschungsstrategien Johannes Gutenberg Universität Mainz
Thema der Stunde I. Einführung in die Varianzanalyse:
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Numerik partieller Differentialgleichungen
Forschungsstatistik II
Forschungsstatistik I
Der Binomialtest Man habe einen wahren Anteil P.
Spektralanalyse Spektralanalyse ist derart wichtig in allen Naturwissenschaften, dass man deren Bedeutung nicht überbewerten kann! Mit der Spektralanalyse.
Zeitreihenanalyse WS 2004/2005 Michael Hauhs / Gunnar Lischeid
Zeitreihenanalyse WS 2004/2005 Michael Hauhs / Gunnar Lischeid
Zeitreihenanalyse WS 2003/2004 Michael Hauhs/ Holger Lange
Zeitreihenanalyse WS 2004/2005
Zeitreihenanalyse WS 2004/2005 Michael Hauhs / Gunnar Lischeid
Bruchpunktanalyse langzeitkorrelierter Daten
Zeitreihenanalyse WS 2004/2005 Michael Hauhs / Gunnar Lischeid
Fourier Transformation
Statistische Methoden I SS 2005 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.
III. Induktive Statistik
Statistische Methoden I WS 2004/2005 Probeklausur Freitag, 21. Januar statt Vorlesung - In 2 Wochen In 2 Wochen!
Bildtransformationen
Kombination von Tröpfchen- und Schalenmodell
Tutorium
Tutorium Aufgabe 1 Informationen in Designmatrix in: - Darin sind die Prädiktoren enthalten - Aber sagt uns noch mehr! Untersuchungsdesign darin.
Generalisierte additive Modelle
Vorlesung: ANOVA I
(Un-)sicherheiten in der Ökosystemmodellierung
§10 Vektorraum. Definition und Beispiele
Histogramm/empirische Verteilung Verteilungen
Stochastische Prozesse I
Saisonale Wasserbilanz (7. 2) Saisonale Trends in Niederschlag (2
Ausgleichungsrechnung II
Analyse nach harmonischen Schwingungen
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Quantum Computing Hartmut Klauck Universität Frankfurt WS 04/
Polynome und schnelle Fourier-Transformation
Mittelwert und Standardabweichung
STATISIK LV Nr.: 0028 SS Mai 2005.
Statistik: Mehr zur Regression.
Kapitel 13 Zeitreihen und Zeitreihen-Modelle
Kapitel 9 Analyse der Modellstruktur Hackl, Einführung in die Ökonometrie 2 Rekursive OLS-Schätzung Spezifiziertes Modell: y = X + u y, u:
Konfidenzintervall und Testen für den Mittelwert und Anteile
Ökonometrie I Analyse der Modellstruktur Ökonometrie I2 Rekursive OLS-Schätzung Spezifiziertes Modell: y = X + u y, u: n-Vektoren; X: Ordnung.
Kapitel 13 Zeitreihen und Zeitreihen-Modelle
Sampling, Rekonstruktion
Fourier-Reihen Was ist eine Fourier-Reihe?
Übersicht Täuschung des Tages kurze Wiederholung
Übersicht Täuschung des Tages Wiederholung: Abtastung CCD-Kamera
Fourier-Analyse und technologische Anwendungen
Stetige Kleinste-Quadrate-Approximation
Schwingungen Schwingungen sind sich periodisch wiederholende Schwankungen einer physikalischen Größe um einen Mittelwert. Beispiele: Federpendel Elektronische.
Meßreihe: Modellansatz
K. Desch - Statistik und Datenanalyse SS05
Didaktik der Geometrie (11) Vorlesung im Sommersemester 2004 Prof. Dr. Kristina Reiss Lehrstuhl für Didaktik der Mathematik Universität Augsburg.
Deterministische Verfahren
Prüft ebenfalls die Annahme der Varianzhomogenität (exakter)
Der Wiener Prozess und seltene Ereignisse
Univ.-Prof. Dr.-Ing. H. Nacken Vorlesung Wasserwirtschaft & Hydrologie I Themen: Vorlesung 8 Statistik Dichtefunktionen Jährliche und partielle Serien.
Klassifizierung der Signale
 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.
Prognose von Zeitreihen Hans Nübel Hans Nübel Prognose von Zeitreihen Aufbau 1.Motivation 2.Holt-Winters-Verfahren 3.Prognose.
Aufgabenstellung  gegeben ist die zeitliche Entwicklung der global gemittelten bodennahen Temperatur im Zeitraum (Dateiname= ytemp2m.obs, ascii-
Independent Component Analysis: Analyse natürlicher Bilder Friedrich Rau.
Kapitel 2: Analoge, periodische Signale
 Präsentation transkript:

Zeitreihenanalyse WS 2004/2005 Michael Hauhs / Gunnar Lischeid Definition einer Zeitreihe, Eigenschaften Tests und Trenderkennung bei Zeitreihen Beispiele (ACF, Tests), Fouriertransformationen, Powerspektrum Zeitreihenmodellierung der ARMA-Klasse Modellierung von Zeitreihen mit langem Gedächtnis Kausalität, Transferfunktionen, multivariate Methoden Skalierung, (Multi-)Fraktale Komplexität und Information von Zeitreihen Wavelets

Trendanalyse Zugrundeliegendes Modell (additives Komponentenmodell): Globaler monotoner Trend: "im Mittel wächst X(t) an / fällt ab" => Trend des Mittelwerts (= 1. Moment der Verteilung)

Der Mann-Kendall Test Anwendung des Kendall-Tests auf Zeitreihen (d.h., sortiert nach Zeit, ohne doppelte Einträge) => Trendtest: Für die H0-Hypothese (= "es gibt keinen Trend") gilt dann: => normalverteilt => Ableitung der Testgröße: Abweichung der beobachteten (normierten) S von den laut H0 erwarteten

Der Mann-Kendall Test beachte: Korrektur für verbundene Ränge (Ranggleichheit) notwendig => statt wobei tj = Anzahl der verbundenen Ränge (ties) => Teststatistik: , wobei D = maximal mögliche Anzahl der Konkordanzen:

Erweiterung auf saisonale Daten: saisonaler Mann-Kendall Test n Beobachtungen pro Saisonteil (z.B. fester Tag im Jahr), m Saisonteile pro Saison (z.B. 365 Tage/Jahr) i-te Beobachtung im g-ten Saisonteil Entmaskierung von Gesamttrends Trends in einzelnen Saisonteilen (z.B. Monaten)

Regressionsanalyse zur Trendbeseitigung beliebig, aber bekannt (z.B. ) Methode der kleinsten Quadrate: minimieren!  Normalgleichungen Fehler der Schätzwerte:

Desaisonalisierung r-te Messung der m-ten Stelle Vermutet wird eine (natürliche) Periode s in den Daten. r-te Messung der m-ten Stelle Unnormierte Desaisonalisierung: Normierte Desaisonalisierung:

zur Darstellung einer Zeitreihe Additive Modelle zur Darstellung einer Zeitreihe Zugrundeliegendes Modell (additives Komponentenmodell): Globaler monotoner Trend: „im Mittel wächst X(t) an / fällt ab“

Frequenzraumdarstellung von Zeitreihen bisher: Zeitreihen wurden durch ihre Werte dargestellt (Zeitdomäne): x = x(t) alternativ: Darstellung in einem Funktionenraum - möglich für jede Funktion in einem n-dimensionalen Vektorraum: : Koeffizienten : Basisfunktionen Die Wahl einer anderen Darstellung von Zeitreihen als über ihre Werte direkt hat viele Vorteile. So kann man z.B. sehr viel kompaktere Darstellungen der Zeitreihe finden (wenige Basisfunktionen stellen die Zeitreihe im wesentlichen schon vollständig dar), oder es können dominante Merkmale gefunden werden, die bei einer reinen Wertebetrachtung nicht ins Auge fallen. Allerdings hängt die damit verbundene Interpretierbarkeit der Strukturen extrem stark von der Basiswahl ab. In dieser Vorlesung beschäftigen wir uns ausschließlich mit einer besonders prominenten Wahl, den einfach periodischen Funktionen (Sinus, Kosinus bzw. die komplexe Exponentialfunktion). Noch ein bisschen mehr zur Motivation, warum die so prominent ist und mächtig ist. sinnvolle Wahl des Funktionenraums: additiv (Superposition) => orthogonale Funktionen

Orthogonalsysteme Zwei Vektoren und heißen orthogonal wenn: vergleiche: Orthogonalität = "Unabhängigkeit", "Unkorreliertheit" im statistischen Sinne => Veränderung eines Vektor hat keine Auswirkungen auf den anderen Vektor: Superposition (kontinuierlicher Fall) (diskreter Fall)

Orthogonalsystem: sin(x), cos(x) Wahl von sin(x) und cos(x) als Basisfunktionen bzw. Darstellung als komplexe Zahl: Die Wahl einer anderen Darstellung von Zeitreihen als über ihre Werte direkt hat viele Vorteile. So kann man z.B. sehr viel kompaktere Darstellungen der Zeitreihe finden (wenige Basisfunktionen stellen die Zeitreihe im wesentlichen schon vollständig dar), oder es können dominante Merkmale gefunden werden, die bei einer reinen Wertebetrachtung nicht ins Auge fallen. Allerdings hängt die damit verbundene Interpretierbarkeit der Strukturen extrem stark von der Basiswahl ab. In dieser Vorlesung beschäftigen wir uns ausschließlich mit einer besonders prominenten Wahl, den einfach periodischen Funktionen (Sinus, Kosinus bzw. die komplexe Exponentialfunktion). Noch ein bisschen mehr zur Motivation, warum die so prominent ist und mächtig ist. Wir brauchen eine Funktionenraum und keinen Vektorraum, unendlich-dimensional als Erweiterung von n-dimensional, Jedes vollständige Orthogonalsystem ist ein Basissystem www9.informatik.uni-erlangen.de/sfb603/Saeulen/Hierarchien/Wissenschaftlich/index2_html => Zugriff nicht erlaubt am 10.11.04 www.educeth.ch/informatik/interaktiv/dft/ => Visual DFT Applet für Demonstrationszwecke

Wiederholung: Komplexe Zahlen alternative Darstellung in Polarkoordinaten (φ, ρ): Eulersche Gleichung: Der lineare Raum der quadratintegrablen Funktionen über der Menge der komplexen Zahlen (ein Hilbertraum) hat sich als besonders geeignet für die Darstellung vieler Funktionen in anderen Basissystemen erwiesen. Es gibt einen wichtigen Zusammenhang zwischen komplexen Zahlen und den elementaren trigonometrischen Funktionen, den man über die Taylorreihenentwicklung herleitet. Schon aus diesem Grund ist plausibel, dass eine Verwendung der komplexen e-Funktion oder aber von Sinus und Kosinus als Basisfunktionen äquivalent ist. Es muss aber noch geklärt werden, ob man alle "vernünftigen" Funktionen mit dieser Basis darstellen kann. Eulersche Gleichung de facto erstmals von Roger Cotes 1714 gezeigt, wieder entdeckt und bekannt geworden durch Euler 1748

Taylorreihendarstellung der trigonometrischen Funktionen generell: für f(x) = ex und a = 0 : analog für f(x) = eix : für a = 0 : => f' sin = cos f' cos = -sin => Exponent n 0 1 2 3 4 5 6 7 8 i n = 1 i -1 -i 1 i -1 -i 1

Frequenzen, Zeiten, Längen, Perioden, ... Eine äquidistante Zeitreihe mit Messintervall (Zeitauflösung) und N Werten Länge der Messperiode Anzahl der Perioden im Datensatz Periodenlänge Frequenz Kreisfrequenz harmonische Frequenz Grundfrequenz, Frequenzauflösung Nyquist-Theorem, Abtasttheorem P

Frequenzen, Zeiten, Längen, Perioden, ... Eine äquidistante Zeitreihe mit Messintervall (Zeitauflösung) und N Werten Länge der Messperiode Anzahl der Perioden im Datensatz Periodenlänge Frequenz Kreisfrequenz harmonische Frequenz Grundfrequenz, Frequenzauflösung Nyquist-Theorem, Abtasttheorem

Fourieranalyse = harmonische Analyse J.B.J. Fourier (1807): Jede stetige und periodische Funktion kann (beliebig genau) dargestellt werden als Superposition einer Serie harmonischer Schwingungen unterschiedlicher Frequenzen. => Entwicklung in eine unendliche trigonometrische Reihe: Voraussetzungen (= Dirichletsche Bedingungen): Die Funktion muss sich in endlich viele Teilintervalle zerlegen lassen können, in denen jeweils x stetig und monoton ist. In den Unstetigkeitsstellen (Sprungstellen) existiert jeweils der links- und der rechtsseitige Grenzwert. Einschränkung "beliebig genau": an Unstetigkeitsstellen wird der Mittelwert der links- und rechtsseitigen Sprungstelle geschätzt periodische Funktion: einteilbar in mehrere, jeweils identische Abschnitte

Fourierkoeffizienten hier: für periodische, diskrete, äquidistante Zeitreihen mit N Werten Schätzung der Koeffizienten für die kte harmonische Frequenz: Ausnahme für k = N/2:

Fouriertransformation Für unendlich lange Zeitreihen gibt es alle Frequenzen Spektrum von Merkmale: umkehrbar existiert für absolut integrierbare Funktionen zeitglobal Stationarität prinzipiell erforderlich

Beispiel für eine Fourierapproximation Der hier gezeigte Sägezahn ist ein Beispiel für eine Funktion mit einer scharfen Kante (Unstetigkeit). Zwar existiert in diesem Fall die Fourierreihe und konvergiert auch gegen die Funktion, aber Sprünge führen zu Problemen mit endlichen Approximationen, wie in der Folge zu sehen.

1 Term: Mittelwert

2 Terme

3 Terme

5 Terme

10 Terme

100 Terme Der „Überschwinger“ verschwindet auch für beliebig viele Terme leider nicht!

Aliasing = "Frequenzmissdeutung" = "Einstrahlen" höherer Frequenzen in den niedrigen Bereich aufgrund der endlichen Länge/Auflösung des Datensatzes:

Parsevalsches Theorem Die totale Varianz der Werte ist gleich der Summe der Varianzen der einzelnen Frequenzen:  Energie ist im Zeit- und Frequenzraum gleich Def.: Energie eines Signals:

Periodogramm Aufteilung der Varianz auf die einzelnen Frequenzen: s2(k) (= spektrale Varianz) gegen k aufgetragen Berechnung anhand der Fourier-Koeffizienten:

Periodogramm = Darstellung der Varianzanteile für die einzelnen Frequenzen bzw. Phasenlängen

Aufgabe Berechnen Sie in Excel die Fourierkoeffizienten für den Datensatz in Aufgabe_Fourieranalyse.xls. Erstellen Sie anhand der Fourierkoeffizienten ein Periodogramm. Rekonstruieren Sie die Zeitreihe als Superposition der entsprechenden sin- und cos- Funktionen. Führen Sie mit den Daten eine Fourieranalyse in Statistica durch und vergleichen Sie die Ergebnisse.