Zeitreihenanalyse WS 2004/2005 Michael Hauhs / Gunnar Lischeid Definition einer Zeitreihe, Eigenschaften Tests und Trenderkennung bei Zeitreihen Beispiele (ACF, Tests), Fouriertransformationen, Powerspektrum Zeitreihenmodellierung der ARMA-Klasse Modellierung von Zeitreihen mit langem Gedächtnis Kausalität, Transferfunktionen, multivariate Methoden Skalierung, (Multi-)Fraktale Komplexität und Information von Zeitreihen Wavelets
Frequenzen, Zeiten, Längen, Perioden, ... Eine äquidistante Zeitreihe mit Messintervall (Zeitauflösung) und N Werten Länge der Messperiode Anzahl der Perioden im Datensatz Periodenlänge Frequenz Kreisfrequenz harmonische Frequenz Grundfrequenz, Frequenzauflösung Nyquist-Theorem, Abtasttheorem
Aufgabe Berechnen Sie in Excel die Fourierkoeffizienten für den Datensatz in Aufgabe_Fourieranalyse.xls. Erstellen Sie anhand der Fourierkoeffizienten ein Periodogramm. Rekonstruieren Sie die Zeitreihe als Superposition der entsprechenden sin- und cos- Funktionen. Überprüfen Sie dabei das Parsevalsche Theorem (Verteilung der Gesamtvarianz auf die einzelnen Frequenzen). Führen Sie mit den Daten eine Fourieranalyse in Statistica durch und vergleichen Sie die Ergebnisse.
Aliasing jenseits der Nyquist-Frequenz
Parsevalsches Theorem Die totale Varianz der Werte ist gleich der Summe der Varianzen der einzelnen Frequenzen: Energie ist im Zeit- und Frequenzraum gleich Def.: Energie eines Signals:
Periodogramm Aufteilung der Varianz auf die einzelnen Frequenzen: s2(k) (= spektrale Varianz) gegen k aufgetragen Berechnung anhand der Fourier-Koeffizienten:
Periodogramm = Darstellung der Varianzanteile für die einzelnen Frequenzen bzw. Phasenlängen
Amplitudenspektrum = Amplituden der harmonischen Schwingungen: mit ak, bk = Fourier-Koeffizienten grafische Darstellung im Amplitudenspektrum
Kumulatives Periodogramm (normiert auf Summe = 1) Bei weissem Rauschen: gerade Linie von (0,0) nach (, 1) => Signifikanztest gegen weißes Rauschen! ε %-Signifikanz: Senkrechter Abstand zur Geraden: mit ε 0,01 0,05 0,10 0,25 dε 1,63 1,36 1,22 1,02
Kumulatives Periodogramm: Beispiel Lehstenbach/Fichtelgebirge, Tageswerte
Kumulatives Periodogramm: Beispiel Steinkreuz/Steigerwald, Stundenwerte
Periodogramm als Schätzer Periodogramm als Schätzer für das Spektrum des die Zeitreihe erzeugende Prozesses: positiv: Erwartungswert des Periodogramms konvergiert mit zunehmender Länge der Zeitreihe negativ: die Varianz des Schätzers nimmt nicht mit zunehmender Länge des Datensatzes ab, daneu hinzukommende Information in die Verwendung von mehr Fourier-Stützstellen, und nicht in die Verringerung der Varianz an den einzelnen Stützstellen fließt: Erhöhung der Abtastrate => Verschiebung der Nyquist-Frequenz, d.h., Erfassung neuer Spektralanteile Verlängerung der Zeitreihe bei gleicher Abtastbreite => dichtere Verteilung der gleichbleibend ungenauen Schätzwerte. => verläßlichere Spektralschätzer zur Schätzung des der Zeitreihe zugrunde liegenden Prozeßspektrums gesucht
Signifikanz und Verteilung von Spektralwerten Für weißes Rauschen entstammen die Schätzwerte einer Verteilung: => unabhängig von N, d.h., keine Verbesserung durch Verlängerung der Zeitreihe !
Endliches weißes Rauschen
Spektogramm = Darstellung der Spektraldichten erfordert in der Regel eine Glättung des Periodogramms zur Verringerung von Bias und Varianz und zur Erhöhung der Stabilität der Schätzer Glättung erfolgt i.d.R. über Fenstertechniken = stückweise Gewichtung der Daten in der Zeitdomäne: Bartlett-Fenster in der Frequenzdomäne: Daniell-, Tukey-Hanning-, Hamming-, Parzen-Fenster
Typische Spektralschätzer: Versatzfenster
Peak-Identifikation: Beispiel (Quelle: W.W.S. Wei, Time Series Analysis (Addison Wesley 1990))
Powerspektrum und Varianz
Frequenzraumdarstellung von Zeitreihen bisher: Zeitreihen wurden durch ihre Werte dargestellt (Zeitdomäne): x = x(t) alternativ: Darstellung in einem Funktionenraum - möglich für jede Funktion in einem n-dimensionalen Vektorraum: : Koeffizienten : Basisfunktionen sinnvolle Wahl des Funktionenraums: additiv (Superposition) => orthogonale Funktionen
Fouriertransformation Jede periodische Zeitreihe x(t) lässt sich auch im Frequenzraum darstellen: => Verwendung der selektiven Fouriertransformation als Filter: Tiefpassfilterung: Eliminieren der hochfrequenten Anteile Hochpassfilterung: Eliminieren der niederfrequenten Anteile Bandpassfilterung: Eliminierung aller Anteile außerhalb eines bestimmten Frequenzbereiches
Fast Fourier Transformation (FFT) Numerisch schnelles numerisches Verfahren für Werte: lediglich statt Multiplikationen erforderlich Prinzip: Die diskrete Fourier-Transformation eines Datensatzes der Länge N ist gleich der Summe der beiden diskreten Fouriertransformationen der Länge N/2 (getrennt für geradzahlige und ungeradzahlige t )
Fast Fourier Transformation (FFT) Index g: für geradzahlige t Index u: für ungeradzahlige t
Fouriertransformation Für unendlich lange Zeitreihen gibt es alle Frequenzen Spektrum von Merkmale: umkehrbar existiert für absolut integrierbare Funktionen zeitglobal Stationarität prinzipiell erforderlich
Leistungsspektrum (Powerspektrum) Def.: Energie eines Signals Leistungsspektrum, Powerspektrum, spektrale Dichte,... Nachteil: keine Phaseninformation mehr => Viele Prozesse mit gleichem Powerspektrum!
Powerspektrum = Verallgemeinerung der Spektralanalyse für nicht-periodische, endliche (und diskrete) Funktionen methodisch: fensterweise Durchführung einer Fouriertransformation der Autokorrelationsfunktion übliche Darstellung: log-log-Plot des Leistungsspektrums ( 'power-law' Charakteristik)
Powerspektrum = Fouriertransformation der Autokorrelationsfunktion
Bestimmung des Powerspektrums mit ρ: Autokorrelationswert η: h: Verschiebung (Time Lag) der Autokorrelationsfunktion M: maximale Verschiebung der Autokorrelationsfunktion D(k) "Fenster", z.B. Hamming Window
Faltungstheorem und Autokorrelation Faltung zweier Funktionen: Fouriertransformierte einer Funktionenfaltung Faltungstheorem Anwendung: Das Leistungsspektrum einer Zeitreihe ist die Fouriertransformierte ihrer Autokorrelation (Wiener-Khintchin-Theorem)
Farbiges Rauschen Klassifizierung nach Steigung der an den abfallenden Ast der Kurve im doppelt-logarithmischen Plot gefitteten Gerade = 0 weißes Rauschen: ohne jegliche Struktur, frequenzunabhängige spektrale Energiedichte 1/f Rauschen: spektrale Dichte umgekehrt proportional zur Frequenz (1/f Rauschen i.e.S. = rosa Rauschen: = 1 bzw. 0,5 < < 1,5) 0 < < 1 rotes Rauschen: größere Varianz der langperiodischen (niederfrequenten) Anteile => Tiefpassfilter; autokorrelierte Daten ("Trägheit") -1 < < 0 blaues Rauschen: größere Varianz der kurzperiodischen (hochfrequenten) Anteile => Hochpassfilter
Beispiele für Powerspektren I Regen, β = 0.36 Abfluss, β = 1.15 Lehstenbach/Fichtelgebirge
Beispiele für Powerspektren II Regen, β = 0.28 Abfluss, β = 1.53 Lange Bramke/Harz
Beispiel: Fernsehturm "Telemax" (280 m) (R. Heer, Uni Hannover)
Beispiel: Cl im Abfluss kleiner Einzugsgebiete (Kirchner et al. 2000)
Beispiel: Cl im Abfluss kleiner Einzugsgebiete (Kirchner et al. 2000)
Powerspektren für nicht-äquidistante Daten: Lomb-Scargle-Normalisierung Messungen der Zeitreihe zu beliebigen Zeitpunkten tj : für und J.D. Scargle (1982): Studies in astronomical time series analysis. II. Statistical aspects of spectral analysis of unevenly spaced data. The Astrophysical Journal 263, 835-853 (1982) Lomb, N.R. (1976), Astrophysical Space Science 39 = beste (im least squares Sinne) Approximation
Ein ziemlich lückiger Datensatz...
...und sein Spektrum
Beispiel: Abflusspegel mit großer Lücke
Lomb-Scargle-Spektrum im Vergleich
Ausblick auf weitere Fouriermethoden Multivariate Fouriertransformationen Kreuz-Spektren (Kohärenz zwischen zwei Zeitreihen) Skalierung, Potenzgesetze Behandlung langreichweitiger Spektren Zeitlokale Spektren: Zeit-Frequenz-Diagramme, Wavelets