Trend des Mittelwerts (= 1. Moment der Verteilung)">

Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Zeitreihenanalyse WS 2004/2005 Michael Hauhs / Gunnar Lischeid

Ähnliche Präsentationen


Präsentation zum Thema: "Zeitreihenanalyse WS 2004/2005 Michael Hauhs / Gunnar Lischeid"—  Präsentation transkript:

1 Zeitreihenanalyse WS 2004/2005 Michael Hauhs / Gunnar Lischeid
Definition einer Zeitreihe, Eigenschaften Tests und Trenderkennung bei Zeitreihen Beispiele (ACF, Tests), Fouriertransformationen, Powerspektrum Zeitreihenmodellierung der ARMA-Klasse Modellierung von Zeitreihen mit langem Gedächtnis Kausalität, Transferfunktionen, multivariate Methoden Skalierung, (Multi-)Fraktale Komplexität und Information von Zeitreihen Wavelets

2 Trendanalyse Zugrundeliegendes Modell (additives Komponentenmodell):
Globaler monotoner Trend: "im Mittel wächst X(t) an / fällt ab" => Trend des Mittelwerts (= 1. Moment der Verteilung)

3 Der Mann-Kendall Test Anwendung des Kendall-Tests auf Zeitreihen (d.h., sortiert nach Zeit, ohne doppelte Einträge) => Trendtest: Für die H0-Hypothese (= "es gibt keinen Trend") gilt dann: => normalverteilt => Ableitung der Testgröße: Abweichung der beobachteten (normierten) S von den laut H0 erwarteten

4 Der Mann-Kendall Test beachte: Korrektur für verbundene Ränge (Ranggleichheit) notwendig => statt wobei tj = Anzahl der verbundenen Ränge (ties) => Teststatistik: , wobei D = maximal mögliche Anzahl der Konkordanzen:

5 Erweiterung auf saisonale Daten: saisonaler Mann-Kendall Test
n Beobachtungen pro Saisonteil (z.B. fester Tag im Jahr), m Saisonteile pro Saison (z.B. 365 Tage/Jahr) i-te Beobachtung im g-ten Saisonteil Entmaskierung von Gesamttrends Trends in einzelnen Saisonteilen (z.B. Monaten)

6 Regressionsanalyse zur Trendbeseitigung
beliebig, aber bekannt (z.B. ) Methode der kleinsten Quadrate: minimieren!  Normalgleichungen Fehler der Schätzwerte:

7 Desaisonalisierung r-te Messung der m-ten Stelle
Vermutet wird eine (natürliche) Periode s in den Daten. r-te Messung der m-ten Stelle Unnormierte Desaisonalisierung: Normierte Desaisonalisierung:

8 zur Darstellung einer Zeitreihe
Additive Modelle zur Darstellung einer Zeitreihe Zugrundeliegendes Modell (additives Komponentenmodell): Globaler monotoner Trend: „im Mittel wächst X(t) an / fällt ab“

9 Frequenzraumdarstellung von Zeitreihen
bisher: Zeitreihen wurden durch ihre Werte dargestellt (Zeitdomäne): x = x(t) alternativ: Darstellung in einem Funktionenraum - möglich für jede Funktion in einem n-dimensionalen Vektorraum: : Koeffizienten : Basisfunktionen Die Wahl einer anderen Darstellung von Zeitreihen als über ihre Werte direkt hat viele Vorteile. So kann man z.B. sehr viel kompaktere Darstellungen der Zeitreihe finden (wenige Basisfunktionen stellen die Zeitreihe im wesentlichen schon vollständig dar), oder es können dominante Merkmale gefunden werden, die bei einer reinen Wertebetrachtung nicht ins Auge fallen. Allerdings hängt die damit verbundene Interpretierbarkeit der Strukturen extrem stark von der Basiswahl ab. In dieser Vorlesung beschäftigen wir uns ausschließlich mit einer besonders prominenten Wahl, den einfach periodischen Funktionen (Sinus, Kosinus bzw. die komplexe Exponentialfunktion). Noch ein bisschen mehr zur Motivation, warum die so prominent ist und mächtig ist. sinnvolle Wahl des Funktionenraums: additiv (Superposition) => orthogonale Funktionen

10 Orthogonalsysteme Zwei Vektoren und heißen orthogonal wenn:
vergleiche: Orthogonalität = "Unabhängigkeit", "Unkorreliertheit" im statistischen Sinne => Veränderung eines Vektor hat keine Auswirkungen auf den anderen Vektor: Superposition (kontinuierlicher Fall) (diskreter Fall)

11 Orthogonalsystem: sin(x), cos(x)
Wahl von sin(x) und cos(x) als Basisfunktionen bzw. Darstellung als komplexe Zahl: Die Wahl einer anderen Darstellung von Zeitreihen als über ihre Werte direkt hat viele Vorteile. So kann man z.B. sehr viel kompaktere Darstellungen der Zeitreihe finden (wenige Basisfunktionen stellen die Zeitreihe im wesentlichen schon vollständig dar), oder es können dominante Merkmale gefunden werden, die bei einer reinen Wertebetrachtung nicht ins Auge fallen. Allerdings hängt die damit verbundene Interpretierbarkeit der Strukturen extrem stark von der Basiswahl ab. In dieser Vorlesung beschäftigen wir uns ausschließlich mit einer besonders prominenten Wahl, den einfach periodischen Funktionen (Sinus, Kosinus bzw. die komplexe Exponentialfunktion). Noch ein bisschen mehr zur Motivation, warum die so prominent ist und mächtig ist. Wir brauchen eine Funktionenraum und keinen Vektorraum, unendlich-dimensional als Erweiterung von n-dimensional, Jedes vollständige Orthogonalsystem ist ein Basissystem www9.informatik.uni-erlangen.de/sfb603/Saeulen/Hierarchien/Wissenschaftlich/index2_html => Zugriff nicht erlaubt am => Visual DFT Applet für Demonstrationszwecke

12 Wiederholung: Komplexe Zahlen
alternative Darstellung in Polarkoordinaten (φ, ρ): Eulersche Gleichung: Der lineare Raum der quadratintegrablen Funktionen über der Menge der komplexen Zahlen (ein Hilbertraum) hat sich als besonders geeignet für die Darstellung vieler Funktionen in anderen Basissystemen erwiesen. Es gibt einen wichtigen Zusammenhang zwischen komplexen Zahlen und den elementaren trigonometrischen Funktionen, den man über die Taylorreihenentwicklung herleitet. Schon aus diesem Grund ist plausibel, dass eine Verwendung der komplexen e-Funktion oder aber von Sinus und Kosinus als Basisfunktionen äquivalent ist. Es muss aber noch geklärt werden, ob man alle "vernünftigen" Funktionen mit dieser Basis darstellen kann. Eulersche Gleichung de facto erstmals von Roger Cotes 1714 gezeigt, wieder entdeckt und bekannt geworden durch Euler 1748

13 Taylorreihendarstellung der trigonometrischen Funktionen
generell: für f(x) = ex und a = 0 : analog für f(x) = eix : für a = 0 : => f' sin = cos f' cos = -sin => Exponent n i n = i i i i 1

14 Frequenzen, Zeiten, Längen, Perioden, ...
Eine äquidistante Zeitreihe mit Messintervall (Zeitauflösung) und N Werten Länge der Messperiode Anzahl der Perioden im Datensatz Periodenlänge Frequenz Kreisfrequenz harmonische Frequenz Grundfrequenz, Frequenzauflösung Nyquist-Theorem, Abtasttheorem P

15 Frequenzen, Zeiten, Längen, Perioden, ...
Eine äquidistante Zeitreihe mit Messintervall (Zeitauflösung) und N Werten Länge der Messperiode Anzahl der Perioden im Datensatz Periodenlänge Frequenz Kreisfrequenz harmonische Frequenz Grundfrequenz, Frequenzauflösung Nyquist-Theorem, Abtasttheorem

16 Fourieranalyse = harmonische Analyse
J.B.J. Fourier (1807): Jede stetige und periodische Funktion kann (beliebig genau) dargestellt werden als Superposition einer Serie harmonischer Schwingungen unterschiedlicher Frequenzen. => Entwicklung in eine unendliche trigonometrische Reihe: Voraussetzungen (= Dirichletsche Bedingungen): Die Funktion muss sich in endlich viele Teilintervalle zerlegen lassen können, in denen jeweils x stetig und monoton ist. In den Unstetigkeitsstellen (Sprungstellen) existiert jeweils der links- und der rechtsseitige Grenzwert. Einschränkung "beliebig genau": an Unstetigkeitsstellen wird der Mittelwert der links- und rechtsseitigen Sprungstelle geschätzt periodische Funktion: einteilbar in mehrere, jeweils identische Abschnitte

17 Fourierkoeffizienten
hier: für periodische, diskrete, äquidistante Zeitreihen mit N Werten Schätzung der Koeffizienten für die kte harmonische Frequenz: Ausnahme für k = N/2:

18 Fouriertransformation
Für unendlich lange Zeitreihen gibt es alle Frequenzen Spektrum von Merkmale: umkehrbar existiert für absolut integrierbare Funktionen zeitglobal Stationarität prinzipiell erforderlich

19 Beispiel für eine Fourierapproximation
Der hier gezeigte Sägezahn ist ein Beispiel für eine Funktion mit einer scharfen Kante (Unstetigkeit). Zwar existiert in diesem Fall die Fourierreihe und konvergiert auch gegen die Funktion, aber Sprünge führen zu Problemen mit endlichen Approximationen, wie in der Folge zu sehen.

20 1 Term: Mittelwert

21 2 Terme

22 3 Terme

23 5 Terme

24 10 Terme

25 100 Terme Der „Überschwinger“ verschwindet auch für beliebig viele Terme leider nicht!

26 Aliasing = "Frequenzmissdeutung"
= "Einstrahlen" höherer Frequenzen in den niedrigen Bereich aufgrund der endlichen Länge/Auflösung des Datensatzes:

27 Parsevalsches Theorem
Die totale Varianz der Werte ist gleich der Summe der Varianzen der einzelnen Frequenzen:  Energie ist im Zeit- und Frequenzraum gleich Def.: Energie eines Signals:

28 Periodogramm Aufteilung der Varianz auf die einzelnen Frequenzen:
s2(k) (= spektrale Varianz) gegen k aufgetragen Berechnung anhand der Fourier-Koeffizienten:

29 Periodogramm = Darstellung der Varianzanteile für die einzelnen Frequenzen bzw. Phasenlängen

30 Aufgabe Berechnen Sie in Excel die Fourierkoeffizienten für den Datensatz in Aufgabe_Fourieranalyse.xls. Erstellen Sie anhand der Fourierkoeffizienten ein Periodogramm. Rekonstruieren Sie die Zeitreihe als Superposition der entsprechenden sin- und cos- Funktionen. Führen Sie mit den Daten eine Fourieranalyse in Statistica durch und vergleichen Sie die Ergebnisse.


Herunterladen ppt "Zeitreihenanalyse WS 2004/2005 Michael Hauhs / Gunnar Lischeid"

Ähnliche Präsentationen


Google-Anzeigen