Das BMBF-Vorhaben Skalenanalyse hydrologischer und hydrometeorologischer Zeitreihen Trendverhalten und Instationarität von Verteilungen M. Kallache,

Slides:



Advertisements
Ähnliche Präsentationen
Prof. Dr. Horst-Joachim Lüdecke
Advertisements

Berechnung von Hochwasserwahrscheinlichkeiten mit dem
Heute 1.F – Test zur Varianzhomogenität 2.Bartlett-Test zur Varianzhomogenität 3.Chi – Quadrat Tests für Häufigkeiten 4.Chi – Quadrat Tests zur Verteilungsanpassung.
Zeitreihen Gliederung Allgemeines zu Zeitreihen
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik II
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26.
Computerkurs: Quantitative Auswertung biochemischer Experimente Guten Morgen.
Modellvergleich.
Hypothesen testen: Grundidee
K. Desch - Statistik und Datenanalyse SS05
Zeitreihenanalyse WS 2004/2005 Michael Hauhs / Gunnar Lischeid
Bruchpunktanalyse langzeitkorrelierter Daten
Synchrones Verhalten von Abflusszeitreihen in ausgewählten Einzugsgebieten Süddeutschlands B. Thies, H. Lange Norwegisches Waldforschungsinstitut.
Zeitreihenanalyse WS 2004/2005 Michael Hauhs / Gunnar Lischeid
Zeitreihenanalyse WS 2004/2005 Michael Hauhs / Gunnar Lischeid
Das BMBF-Vorhaben Skalenanalyse hydrologischer und hydrometeorologischer Zeitreihen Skalenanalyse in der Hydrologie – warum? Von Peter Braun, ehemals Bayerisches.
Nachholung der Vorlesung vom Freitag
Statistische Methoden I WS 2007/2008 Donnerstag, 31. Januar 2008 und Freitag, 1. Februar 2008 Probeklausur - statt Vorlesungen -
Statistische Methoden I SS 2005 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.
Kolmogorov-Smirnov-Test. A. N. Kolmogorov Geboren in Tambov, Russland. Begründer der modernen Wahrscheinlichkeitstheorie.
III. Induktive Statistik
Klausur am :00 bis 13:00 Hörsaal Loefflerstraße und Hörsaal Makarenkostraße.
Biometrie III Datenbeispiel zum Thema Permutationstests Wiebke Rygulla.
Sportwissenschaftliche Forschungsmethoden SS Statistischer Test.
Tutorium
Tutorium
Tutorium
Tutorium
Unser zehntes Tutorium Materialien unter:
Tutorium Aufgabe 1 Informationen in Designmatrix in: - Darin sind die Prädiktoren enthalten - Aber sagt uns noch mehr! Untersuchungsdesign darin.
Konzeption und Realisierung von DSS
Wiederholung und Beispiele
Eigenschaften der OLS-Schätzer
Einfache Regressionsgleichung
Probleme der Modellspezifikation
Multikollinearität Wann spricht man von Multikollinearität?
Wiederholung: Einfache Regressionsgleichung
Stochastische Prozesse I
Ausgleichungsrechnung I
Partielle Autokorrelation
K. Meusburger & C. Alewel finanziert vom BAfU
Ausgleichungsrechnung II
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Regionalisierte Variablen und Kriging
Globale Interpolations- und Prädiktionsverfahren
Einführung in SPSS/PASW. Inhaltsübersicht 1. Intro ( ) 2. Deskriptive Statistik ( ) (In Buch 1 Seite 85ff.) Kennwerte (Erwartungswert,
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Statistik: Mehr zur Regression.
Kapitel 13 Zeitreihen und Zeitreihen-Modelle
Kapitel 10 Multikollinearität
Lineare Restriktionen
Kapitel 18 Dynamische Modelle: Schätzen der Parameter
Kapitel 19 Kointegration
Kapitel 14 Trends und Unit-root-Tests
Kapitel 13 Zeitreihen und Zeitreihen-Modelle
Kapitel 18 Dynamische Modelle: Schätzen der Parameter.
STATISIK LV Nr.: 0021 WS 2005/ November 2005.
Wie bewältigt man Stationaritätsannahmen in der Geostatistik? Brenning & van den Boogaart A.Brenning, Humboldt-Universität zu Berlin
Kapitel 14 Trends und Unit-root-Tests
1 STATISIK LV Nr.: 0021 WS 2005/ November 2005.
Stochastik ganz kurz Beispiel diskret Würfelwurf Beispiel stetig
SS 2009Maschinelles Lernen und Neural Computation 133 Kapitel 7: Ensemble Methoden.
Testtheorie (Vorlesung 13: ) Wiederholung: Richtigstellung
Geoinformationssysteme
Univ.-Prof. Dr.-Ing. H. Nacken Vorlesung Wasserwirtschaft & Hydrologie I Themen: Vorlesung 8 Statistik Dichtefunktionen Jährliche und partielle Serien.
 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.
Prognose von Zeitreihen Hans Nübel Hans Nübel Prognose von Zeitreihen Aufbau 1.Motivation 2.Holt-Winters-Verfahren 3.Prognose.
Außenhandelsbeziehungen zwischen China, USA, EU Makroökonometrie Vorlesung Dr. Oliver Bode.
 Präsentation transkript:

Das BMBF-Vorhaben Skalenanalyse hydrologischer und hydrometeorologischer Zeitreihen Trendverhalten und Instationarität von Verteilungen M. Kallache, B. Thies, H. Lange Norwegisches Waldforschungsinstitut

Gliederung Einordnung Daten Trend Test unter Berücksichtigung von Autokorrelationen Analyse von Verteilungsinstationaritäten mit dem fensterbasierten, integrierten Kolmogorov-Smirnov Test Ausblick: offeneFragen/Ursachensuche 21. 10. 2004 München Trendverhalten und Instationarität von Verteilungen

Einordnung Betrachtete Verteilungs-Instationaritäten Die Bewertung von Instationaritäten hydrologischer Zeitreihen ist wichtig, da sie relevant für die Analyse von Hochwasserursachen und Abschätzung von Hochwasserrisiken ist sie Indikatioren für die Unterscheidung menschlicher und natürlicher Einflüssen bieten kann viele Zeitreihen-Methoden Stationarität voraussetzen Weitere Instationaritäten, wie z.B. Sprünge in den Daten, werden hier nicht betrachtet Speziell: Änderung des Mittelwerts: Trend Änderung der Schiefe: z.B. häufigeres Vorkommen von Niedrigwasser Die Einbeziehung von Korrelationen ist entscheidend, da langzeitkorrelierte Abflußdaten gefunden wurden Annahme: „menschlicher Einfluß“=deterministischer Trend versus „natürliche Variabilität“=stochastische Varianz Definition von Stationarität: Statistische Eigenschaften einer Zeitreihe (also Mittelwert, Varianz,....) bleiben über die Zeit gleich. Die Autokorrelationsfunktion ist nur für stationäre Prozesse definiert. 21. 10. 2004 München Trendverhalten und Instationarität von Verteilungen

Daten: Donau - D13 Burghausen Stein Altenmarkt o. d. T. Brodhausen Abflußdaten des Einzugsgebietes D13 Normierung: Trendanalyse: - Entfernung des periodischen Jahreszyklus - Mittelwert (0) und Varianz (1) [alle] Kolmogorov-Smirnov Statistik: - Mittelwert (0) und Varianz (1) [fensterweise] monatliche Werte (Trendanalyse) und tägliche Werte (KS-Statistik) gesamte Länge Burghausen Altenmarkt o. d. T. Stein Brodhausen Siegsdorf Wernleiten Staudach Unterjettenberg Ilsank längster gemeinsamer Zeitraum: 01.01.51-05.06.1958 (7 Jahre) Längster Datensatz: Burghausen/Salzach 01.01.1901-05.06.1958 Kürzester Datensatz: Brodhausen/Sur 01.01.1951-07.06.2001 Trendanalyse: habe Burghausen/Salzach nicht benutzt, also alle ZR ca. 1925-2001, außer Unterjettenberg, die ist länger (ab 1901). 21. 10. 2004 München Trendverhalten und Instationarität von Verteilungen

Trendanalyse unter Berücksichtigung von Autokorrelationen Modellannahmen: Die Zeitreihe Yt sei gegeben durch Yt = Tt + Xt Tt : deterministische Trendkomponente Xt : wird durch stochastisches Modell repräsentiert Langzeitkorrelation verursacht ggf. lange Abweichungen vom Mittelwert und lokale Trends (siehe auch Beran (1994)) AR(1) Prozeß mit Parametern =0.3, 2=1 FD() Prozeß mit Parametern  =0.45, 2=1 Trend wird als langsame Änderung auf großen Skalen interpretiert Es wird ein parametrischer Ansatz gewählt, um auch die Korrelationsstruktur der Daten abbilden zu können. Die Einbeziehung von Langzeitkorrelationen ist wichtig, da z.B. auch langzeitkorrelierte Abflußdaten gefunden wurden (siehe Lawrence et al. (1977), Montanari (1997)). Die Bewertung eines Trendes hängt immer von der Korrelationsstruktur der Daten ab. Bei sehr variablen Daten wird man weniger oft signifikante deterministische Trends finden als bei wenig variablen Daten. Starke Korrelationen machen Daten variabler. Es wird angenommen, daß das stochastische Modell linear ist. Wenn man annimmt, daß ein Prozeß stochastisch ist, können keine universellen Aussagen gemacht werden, da jede Realisierung eines Prozesses anders aussieht. Betrachtet man endliche Zeitreihen, wird man niemals abschließend entscheiden können, welches Modell am besten zu den Daten paßt. Falls möglich, sollten nicht-statistische Faktoren wie geo-physische (patchiness,...) in die Entscheidung mit einbezogen werden. Die Wahl eines stochastischen Modells sagt etwas über die Annahme der Korrelationsstruktur der Daten aus. Die langzeitkorrelierte Reihe hat keinen Trend, sie ist noch nicht mal instationär im stochastischen Sinne. Beispiel eines instationären Prozesses: random walk xt=xt-1+et=x0 +sum(et), also E(x)=x0 und Var(x)=t*sigma^2, also geht die Varianz mit der Zeit hoch, ist also abhängig von ihr 21. 10. 2004 München Trendverhalten und Instationarität von Verteilungen

Trendanalyse: Stochastische Modelle FARIMA((1,..,p),,(1,.., q)) (fractional autoregressive integrated moving average) Modelle, die sowohl Lang- als auch Kurzzeitkorrelationen abbilden können Ein Goodness-of-Fit Test (entwickelt durch Milhoj(1981)) testet, ob die empirischen Daten als Realisierung des Modells gelten können Modelle mit wenigen Parametern sind evtl. zu einfach, um die Systemynamik zu reproduzieren viele Parameter erhöhen die Unsicherheit bezüglich der Parameterschätzung Die Wahl des Stochastischen Modelles sagt etwas über die Korrelationsstruktur der Daten aus. FARIMA phi: Parameters des Autoregressiven Teils d: Parameter, der den Grad der Langzeit-Korrelationen wiedergibt und in den Hurst Koeffizienten umgerechnet werden kann fi: Parameters des Moving Average Teils Erweiterung des ARIMA Modells mit einer Langzeit-Komponente (d) Goodness-of-Fit Test hat Probleme, wenn ein Trend in den Daten vorhanden ist Der Goodness-of-Fit test, der 1981 von Milhoy entwickelt wurde, vergleicht das Periodogramm der empirischen Daten mit der Spektralen Dichtefunktion des Modells Die Whittle Näherng an den Maximum Likelihood Schätzer wird verwendet, um die Modell Parameter zu schätzen. Sie minimiert einen Bruch zwischen Periodogramm der Daten und Spektraler Dichtefunktion des FARIMA Prozesses. Durch Vergleich der Parameterschätzung auf den Daten selbst und gefilterten Daten (wo Fluktuationen auf großen Skalen entfernt worden sind) können Rückschlüsse auf die Trendstärke gezogen werden Der BIC benutzt die Log Likelihood des Modells und addiert eine Komponente, um die Anzahl Parameter p zu bestrafen (sie berücksichtigt außerdem die Länge des Datensates N): log(Np). Der AIC nimmt 2p finde das einfachste Modell, das am besten zu den Daten paßt Der AIC ( Akaike Information Criterion) vergleicht die Performance von Modellen verschiedener Komplexitätsstufen 21. 10. 2004 München Trendverhalten und Instationarität von Verteilungen

Trendanalyse: Trendschätzung mit Wavelets Mit der Diskreten Wavelet Transformierten (DWT) wird die Zeitreihe gesplittet: Y X* + T* X* : Variationen zu kleinen Skalen T* : Variationen zu großen Skalen T* enthält die deterministische Trendkomponente, sowie Variationen von X* zu großen Skalen Nun wird versucht, ein lineares stochastisches Modell zu finden, das am besten zu X* paßt. T* wird als Trendschätzer genommen (l=6, >= 5.3 Jahre). Frage: ist der gefundene Trendschätzer signifikant? Trendschätzer: nicht linear, i.e. signifikant != stark steigend/fallend. Trendschätzer ist gewichteter gleitender Mittelwert. Es ist wünschenswert, den deterministischen Trend von den stochastischen Fluktuationen trennen und von den Daten abziehen zu können. Da jedoch die Korrelationsstruktur der Daten beeinflußt, ob ein „Trend“ signifikant ist und die Form des Trendes die Korrelationsstruktur bestimmt, geht man hier schrittweise vor. Signifikanter Trend bei Maxima: Brodhausen/Sur ([1,d,1]), Stein/Traun ([1,0,1]), Wernleiten/RoteTraun ([3,0,3]), Altenmarkt/Alz ([1,0,1]) Signifikanter Trend bei Durchschnitten: Altenmarkt/Alz ([1,0,1]) 21. 10. 2004 München Trendverhalten und Instationarität von Verteilungen

Trendanalyse: Parameterschätzung Whittle Näherung an die Maximum-Likelihood Schätzung zum Bestimmen der Modellparameter eine adäquate Schätzung der Parameter ist wichtig für die Wahl des stochastischen Modells und den Trendtest ein starker Trend verzerrt die Parameterschätzung bei Daten mit starker Trendkomponente werden die Parameter exakter auf gefilterten Daten geschätzt – wo Fluktuationen auf großen Skalen mit Wavelet Filtern entfernt wurden durch interatives Vorgehen kann man sich einer exakten Parameterschätzung annähern Die Parameterschätzung wird durch einen starken Trend in den Daten verzerrt, denn schätzt man die Parameter auf allen Daten, wird implizit die Annahme T=0, i.e. Y=X getroffen. Schätzt man auf den gefilterten Daten, nimmt man einen zu starken Trend, den Trendschätzer, an. Whittle‘s Näherung minimiert einen Bruch zwischen dem Periodogramm der Daten und der Spektralen Dichte des FARIMA Prozesses. In dieser Studie wurden die Parameter sowohl auf den Daten selbst als auch auf gefilterten Daten geschätzt, um in einem iterativen Prozeß den exakten Daten näher zu kommen: Schätze die Parameter auf den Daten selbst, berechne die Varianz eines möglichen Trendes Schätze die Parameter auf den gefilterten Daten Berechne den Fehler zu diesem spezifischen Trendschätzer und Parameterschätzung und Modell über Simulation synthetischer Reihen für beide Schätzungen (1. und 2.). Ziehe den Fehler von Schätzung 1. und 2. ab und prüfe, ob die Werte konvergieren. falls ja: Ende, nimm Schätzung1-Fehler1 = Schätzung 2 – Fehler 2 falls nein: berechne neue Schätzer: Schätzer1 = Schätzer1 – Fehler1, Schätzer2 = Schätzer2 – Fehler2, gehe zu 4. 21. 10. 2004 München Trendverhalten und Instationarität von Verteilungen

Trendanalyse: Trend Test Die Teststatistik erhält man durch Vergleich der Varianz der Zeitreihe selbst mit den stochastischen Variationen auf kleinen Skalen: die Verteilung der Teststatistik wird via Monte Carlo Simulation der Zeitreihe ohne Trend generiert falls der Teststatistikwert von Yt pc(emp) ein Quantil dieser Verteilung zu einem Level  überschreitet, wird die Hypothese von keinem Trend zu diesem Level abgelehnt Das heißt, daß ein Trend als signifikant bewertet wird, wenn er die Varianz des Prozesses in einer bemerkenswerten Weise ändert 21. 10. 2004 München Trendverhalten und Instationarität von Verteilungen

Trendanalyse: Varianz des Trendes für stationäre Prozesse kann die Autokovarianzfunktion von X* benutzt werden, um die Varianz des Trend-schätzers zu bestimmen die Varianz des Trend- schätzers hängt ab von der Wahl des stochastischen Modells der Größe der geschätzten Modellparameter Trenschätzer für l=6, > 5.3 years Beispiel: Brodhausen/Sur (maximale Werte). AR1: signifikanter Trend (phi=-0.77). FD KEIN signifikanter Trend (d=0.12). FARIMA(1,d,0) KEIN signifikanter Trend (phi=0.06, d=0.08). BESTHIC FARIMA(1,d,1) signifikanter TREND (phi=-0.77, d=0.09, psi=0.85) Hier ist unter Annahme eines langzeitkorrelierten FD() Modells das Sigmaintervall des Trendschätzers breiter, was zur Akzeptanz von H0=kein Trend vorhanden führt, während H0 unter Annahme eines AR(1) Modells abgelehnt wird. Beispiel: denkt man an einen linearen Trend, führt ein breiteres Sigmaintervall für den Trendschätzer evtl. zum Einbezug von 0 für den Steigungsparameter, i.e. H0 von keinem Trend könnte nicht mehr verworfen werden (siehe Beran 1994 für ein Beispiel) je weiter das Sigmaintervall des Trendschätzers ist, desto seltener wird ein signifikanter Trend gefunden 21. 10. 2004 München Trendverhalten und Instationarität von Verteilungen

Trendanalyse: Vor- und Nachteile der Metode Vorteile: Semi-Parametrischer Ansatz Korrelationen werden berücksichtigt lokal polynomer Trenschätzer gibt Hinweis auf die Form des Trendes Test robust auch bei späterem Einsetzen eines Trendes Test robust bei Änderung der Varianz der Zeitreihe Nachteile: Semi-Parametrischer Ansatz Annahmen über die Korrelationsstruktur der Daten mittels eines stochastisches Modells werden getroffen rechenaufwändig durch Monte-Carlo Simulation zur Generierung der Verteilung der Teststatistik 21. 10. 2004 München Trendverhalten und Instationarität von Verteilungen

Trendanalyse: Ergebnisse das kurzzeitkorrelierte AR(1) Modell wird vom AIC zumeist als bester Fit gewählt der Langzeitparameter war bei der Betrachtung monatlicher Maxima (im Gegensatz zu monatlichen Durchschnittswerten) eher nötig die Form des Trendschätzers T* enthält oft Segmente des An- und Abstiegs. Es ist davon auszugehen, daß die analysierte Zeitspanne bei Trenduntersuchungen wichtig ist signifikante Trends wurden gefunden für monatliche Maxima: Brodhausen/Sur, Stein/Traun, Wernleiten/RoteTraun, Altenmarkt/Alz (Tendenz: fallend) monatliche Durchschnittswerte: Altenmarkt/Alz (Tendenz: leicht steigend) Einfache Modelle scheinen die Daten gut zu repräsentieren (FARIMA(3,d,3) max. möglich) Unterschiede zu Mann-Kendall-Test (KLIWA-Bericht „Langzeitverhalten der Hochwasserabflüsse in Baden-Württemberg und Bayern“ 2003, wo Trends gefunden wurden für Brodhausen/Sur (80% signif, stark fallend), Wernleiten/RoteTraun /95% signif, fallend), IlsankRamsauerAche (90% signif, wenig Änderung), Siegsdorf/WeisseTraun (99% signif, fallend). Bei Siegsdorf habe ich als bestHIC ein AR(1)-Modell (phi=0.15). Also müßten die Kurzzeitkorrelationen den beim Mann-Kendall festgestellten Trend erklären. Problem: MK-Test auf jährlichen Maxima gemacht, ich vergleiche mit monatlichen Maxima!!!! 21. 10. 2004 München Trendverhalten und Instationarität von Verteilungen

Trendanalyse: Konsequenzen für die Praxis die Berücksichtigung der Korrelationsstruktur bedeutet eine Spezialisierung, da sich diese für jeden Datensatz ändern kann der Trendtest wird durch Berücksichtigung der Korrelationsstruktur der Daten verbe.ssert, da diese das Testergebnis beeinflußt durch Einbeziehung der Korrelationsstruktur der Daten wird weniger häufig ein signifikanter deterministischer Trend festgestellt. Dies betrifft insbesondere langzeitkorreliere Abflußdaten (welche zum Beispiel von Lawrence et al. (1977) oder Montanari (1997) gefunden wurden). Discharge data from a large catchment, with a lot of aggregated processes, seem to tend to be represented best by a model including long range correlations The correlation structure has important consequences for the trend assessment and also for extreme value statistics to evaluate floods and droughts. Pitfall: a separating scale, up from which the trend component starts, has to be defined. KLIWA 2003: Langzeitverhalten der Hochwasserabflüsse in Baden-Württemberg und Bayern KLIWA-Projekt A. 2.1.3, presented the Mann-Kendall test Kliwa used yearly maximum values. The differences are subject of further investigations 21. 10. 2004 München Trendverhalten und Instationarität von Verteilungen

Siegsdorf / WeißeTraun Verteilungsinstationaritäten: der fensterbasierte, integrierte Kolmogorov-Smirnov Test Fenster A Fenster B Siegsdorf / WeißeTraun Ergänzend zu Trendanalysen, die Verteilungen insgesamt nicht betrachten weg von der Konzentration auf Mittelwert und Standardabweichung Zitat Abstract: Um neben den als Trend ermittelten Schwankungen im Mittelwert Veränderungen in Breite und Form der Werteverteilung von Abflusszeitreihen abzuschätzen, stellen wir ein neuartiges Instrument vor: den fensterbasierte integrierte Kolmogorow-Smirnow Test. Mittelwert 7.75 m³/s Mittelwert 8.31 m³/s 21. 10. 2004 München Trendverhalten und Instationarität von Verteilungen

Verteilungsinstationaritäten: KS-Test Fensterlänge = Zeitskala Fensterbeginn: Kalenderjahr (1.1.) Keine disjunkten Fenster, gerade langsame Veränderungen werden festgestellt Begriff „Trend“ – hier sowas wie „Veränderung in eine bestimmte Richtung“ (Zyklisches nicht ausgeschlossen, dann aber auf größerer Zeitskala) Wie stationär ist die Verteilung der Abflusswerte? Zeitskalen: 2, 5, 10, 20 und 30 Jahre Verschiebung: um je 1 Jahr Gibt es zyklische Phänomene (kleinere Zeitskalen)? Gibt es Trends (große Zeitskalen)? 21. 10. 2004 München Trendverhalten und Instationarität von Verteilungen

Verteilungsinstationaritäten: Fensterbasierter integrierter KS-Test Fenster A Kumulative Verteilungen Fenster B Differenz der kumul. Vert. Maximale Differenz: normale KS-Statistik Prinzip des KS-Tests: Kumulative Verteilungen bilden Differenz davon berechnen Maximalen Wert der absoluten Differenzen bestimmen (zweiseitiger Test) NEU: statt Maximum Mittelwert verwendet (alle Abweichungen sind darin „integriert“) Mittlerer Unterschied: „integrierte“ KS-Statistik 21. 10. 2004 München Trendverhalten und Instationarität von Verteilungen

Verteilungsinstationaritäten: Fensterbasierter integrierter KS-Test Fenster A Kumulative Verteilungen Fenster B Differenz der kumul. Vert. Maximale Differenz: normale KS-Statistik Vorteil: Oft ist der mittlere Unterschied/die integrierte KS-Statistik aussagekräftiger als die konventionelle Statistik: Abweichungen in beide Richtungen werden herausgemittelt, während das absolute Maximum eher zufällig positiv oder negativ sein kann (siehe Beispiel). Mittlerer Unterschied: „integrierte“ KS-Statistik 21. 10. 2004 München Trendverhalten und Instationarität von Verteilungen

Verteilungsinstationaritäten: z-Transformation von Verteilungen Fenster A Kumulative Verteilungen Fenster B Mittelwert = 0 Std. = 1 Mittelwert = 0 Std. = 1 Differenz der kumul. Vert. Einfluss von Mittelwert-Verschiebungen und Veränderungen in der Varianz der Verteilung herausgenommen Frage: Gibt es weiterhin Unterschiede? 21. 10. 2004 München Trendverhalten und Instationarität von Verteilungen

Verteilungsinstationaritäten: Vor- und Nachteile der Methode Vorteile: keine Datenvor-behandlung nötig hohe Datenmenge unkritisch Lücken bis 20% eines Fensters akzeptabel parameterfrei relativ unempfindlich gegen Ausreißer unabhängig von den getesteten Kumulativen Verteilungen Nachteile: Signifikanzniveaus des konventionellen KS-Tests nicht verwendbar (Voraussetzung: unkorrelierte Daten)  MC Simulation nur relative Vergleiche ist sensitiver beim Zentrum als bei den Enden der Verteilung Vorbehandlung: Fehlerquelle Desaisonalisierung! KS-Test deckt Verteilungs-Instationarität auf und bietet damit Einstieg in die Ursachensuche... Es folgen nun: Beispiele der Dedektiv-Arbeit anhand D13! Die hier aufgedeckten Instationaritäten können mit weiteren Verfahren genauer charakterisiert werden. 21. 10. 2004 München Trendverhalten und Instationarität von Verteilungen

Verteilungsinstationaritäten: Ergebnisse Siegsdorf/ Weiße Traun 10a Übergang zur Einführung: Kästchen zeigt die beiden Fenster, die zu Beginn verglichen wurden Matrix zeigt den Vergleich aller Fenster miteinander Zeitskala: 10 Jahre 21. 10. 2004 München Trendverhalten und Instationarität von Verteilungen

Verteilungsinstationaritäten: Ergebnisse Siegsdorf/ Weiße Traun 20a Gleiches Bild für doppelte Zeitskala: Klarer Trend zu anderen Verteilungen (höhere Werte), ziemlich klarer Umschwung mit Beginn der 80er Jahre Zeitskala: 20 Jahre 21. 10. 2004 München Trendverhalten und Instationarität von Verteilungen

Verteilungsinstationaritäten: Ergebnisse Datenkollektiv „D13“ 20a Zeitskala: 20 Jahre Verteilungs-Instationarität bei allen 9 Pegeln vorhanden Siegsdorf als extremster Vertreter in D13 Sehr ähnliches, aber schwächeres Muster bei Staudach/Tiroler Achen (räumlich nah) Ebenfalls ähnlich: Burghausen/Salzach, hier Einordnung in längeren zeitlichen Kontext möglich! Es zeigt sich, dass bei den Abflüssen Süddeutschlands instationäres Verhalten die Regel ist. Es treten dabei sowohl gemeinsame Muster als auch pegelspezifische Besonderheiten auf. 21. 10. 2004 München Trendverhalten und Instationarität von Verteilungen

Verteilungsinstationaritäten: Ergebnisse Datenkollektiv „D13“ 5a Zeitskala: 5 Jahre Kleinere Zeitskala (5a): Keine Trends, sondern auffällige „Streifenmuster“ (ähnelt Tischdecken-Entwürfen...) Es zeigt sich, dass bei den Abflüssen Süddeutschlands instationäres Verhalten die Regel ist. Es treten dabei sowohl gemeinsame Muster als auch pegelspezifische Besonderheiten auf. 21. 10. 2004 München Trendverhalten und Instationarität von Verteilungen

Verteilungsinstationaritäten: Ergebnisse Datenkollektiv „D13“ MW 5a Zeitskala: 5 Jahre Zeitskala: 5 Jahre Vergleich der Spaltenmittel (mittlerer Wert des integrierten KS-Test für jedes Fenster im Vergleich mit allen anderen) zeigt: Für viele Pegel/große Zeiträume synchroner Verlauf Lokale Maxima der Zeitreihe statistisch signifikant regelmäßiger als per Zufall zu erwarten! (Sherman-Statistik) Mittlerer Abstand der Maxima / Periodendauer: zwischen 4.5 - 5.5 Jahre Ursachen? Wie weit verbreitet? 21. 10. 2004 München Trendverhalten und Instationarität von Verteilungen

Verteilungsinstationaritäten: Konsequenzen für die Praxis Fakt ist: Stationarität der Werteverteilungen ist oft nicht gegeben Daher: Zusatz-/Ersatzinstrument zu Trendanalysen sinnvoll Ziel: Aufspüren von Instationaritäten Berücksichtigung bei Methoden-Voraussetzungen Charakterisierung von Einzelpegeln/ Einzugsgebieten Analysemethoden, die auf der Stationaritätsannahme beruhen, sollten auf dieser Basis neu überdacht werden. 21. 10. 2004 München Trendverhalten und Instationarität von Verteilungen

Ausblick: offene Fragen /Ursachensuche finden sich Wechsel der Messtechnik in den Werteverteilungen wieder? gibt es räumliche Muster für die Trends und Instationaritäten in den Verteilungen? lassen sich die Trends und synchronen, zyklischen Phänomene mit anthropogenen Einflüssen oder klimatischen Variablen erklären und für eine genauere Risikoabschätzung nutzbar machen? Vergleich Birgit/ich verschiedene Normierungsverfahren der Daten, deshalb evtl. unterschiedliche Ergebnisse Verfahren nicht direkt vergleichbar. Bei mir Trend: alles auf Skala größer 5 Jahre. Birgit mittelt BIS zu einer Skala. I.e., meine Trends müßten auf ihren größten Mittelungsbildern von 30a zu erkennen sein, wenn sie nicht von dem überlagert werden, was bis 5a passiert. Vielen Dank für Ihre Aufmerksamkeit! 21. 10. 2004 München Trendverhalten und Instationarität von Verteilungen

Weitere Blickwinkel /Zusatzfolien Ergebnis für normierte Fenster PCA Verteilungs-Fits & KSSUM Sherman-Statistik Noch zu erstellen.... 21. 10. 2004 München Trendverhalten und Instationarität von Verteilungen

Trendanalyse: Power des Trendtests Mittels einer Monte Carlo Studie wurde die Power des Trendtests evaluiert. Sie hängt von der Modellwahl und der Größe der Modellparameter ab ist wenig schwächer als die eines Standardtests für Lineare Regression (für lineare Trends) wird nicht signifikant schwächer, wenn der Trend erst in einem späteren Teil der Zeitreihe beginnt ist sensitiv gegenüber Sprüngen in den Daten, also sollten Sprünge vor der Analyse ausgeschlossen werden wird von einer Änderung der Varianz der Zeitreihe nicht betroffen Die Größe des Fehlers der ersten Art kann man selbst bestimmen: alpha als Prozentsatz der Fälle in denen H0 fälschlicherweise abgelehnt wird. Die Größe des Fehlers zweiter Art kann nicht einfach festgelegt werden: die Power eines Testes muß geschätzt werden um zu sehen wie oft H0 fälschlicherweise akzeptiert wird. 21. 10. 2004 München Trendverhalten und Instationarität von Verteilungen