Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Ökonometrie und Statistik Zeitreihenanalyse

Ähnliche Präsentationen


Präsentation zum Thema: "Ökonometrie und Statistik Zeitreihenanalyse"—  Präsentation transkript:

1 Ökonometrie und Statistik Zeitreihenanalyse
Dr. Bertram Wassermann

2 Zeitreihenanalyse: Definition
Kurze, übersichtliche Einführung mit Übungen gibt: Auch zu anderen Themen wie Einfach- und Mehrfachregression und Varianzanalyse. Gibt auch Einführung in statistisches Testen.

3 Zeitreihenanalyse: Definition
Was ist eine Zeitreihe? Ein metrischer KPI wird in regelmäßigen, zeitlichen Abständen erfasst oder gemessen. Notation: 𝑋 𝑡 : 𝑥 1 , 𝑥 2 , …, 𝑥 𝑛 ist eine Folge von endlich vielen Zahlen, wobei die zeitliche Reihenfolge der Ordnung der natürlichen Zahlen entspricht. Granularität: Typische Einheiten der Messung / Erfassung Jährlich Semester / Trimester Quartale Monate Kalenderwochen Arbeitswoche Tage Stunden Minuten KPI: einige Beispiele Umsatz, Gewinn Anzahl Studenten, Vorlesungsstunden Verkäufe Verkaufte KM (PKM), uvm. Besucher, Fahrgäste Arbeitsstunden Aktienkurse Anrufe beim Customer Service Serverzugriffe

4 Zeitreihenanalyse: Definition
Was ist eine Zeitreihe? Der KPI könnte auch ordinal sein oder nominal. Ist aber eher untypisch und wenn, dann informell. Und die zeitliche Reihenfolge könnte auch unregelmäßig sein: 𝑋 𝑁(𝑡) : 𝑥 𝑡1 , 𝑥 𝑡2 , …, 𝑥 𝑡𝑛 Quelle:ORF.at So etwas nennt man üblicher Weise einen Prozess. Dafür gibt es auch Theorie. Auch die zeitlichen Abstände zwischen dem Eintreten von Ereignissen ist relevant. Wir betrachten Zeitreihen mit metrischem KPI in regelmäßigen Abständen erhoben / erfasst.

5 Zeitreihenanalyse: Grafische Darstellung
Welche Art von Skalierung hat die Zeit bei Zeitreihendaten? Sie ist metrisch und diskret. Richtige Darstellungsformen sind daher Säulendiagramm Punktdiagramm Typische und übliche Darstellung ist das Liniendiagramm mit Punkten, Polygon Eigentlich falsch, da x-Achse diskret. Verstärkt aber das Lesen der zeitlichen Entwicklung. Ohne Punkte ist allerdings nicht zu erkennen, dass die Daten eigentlich diskret sind.

6 Zeitreihenanalyse: Zerlegung
Analyse der Zeitreihe: Welche Muster finden Sie in den Daten? Steigung, Aufwärtstrend Eine Welle, pro Jahr wiederholt sich das Muster, steigende Umsätze mit den Quartalen. Die Zeitreihe setzt sich zusammen aus Trendkomponente Saisonkomponente Residuenkomponente Man schreibt additiv 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡

7 Zeitreihenanalyse: Zerlegung
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 nicht-parametrischer Ansatz Bestimme (größte) Periode p der saisonalen Komponente der Zeitreihe 𝑌 𝑡 Bilde gleitendes Mittel der Länge p: 𝐺𝑀(𝑌 𝑡 ) Extrahiere Saison und Fehler 𝑆 𝑡 + 𝐸 𝑡 = 𝑌 𝑡 − 𝐺𝑀(𝑌 𝑡 ) Extrahiere Saison 𝑆 𝑠𝑡1 = 𝑀𝑒𝑎𝑛(𝑆 𝑠𝑡1+𝑝 + 𝐸 𝑠𝑡1+𝑝 ) 𝑆 𝑠𝑡𝑝 = 𝑀𝑒𝑎𝑛(𝑆 𝑠𝑡𝑝+𝑝 + 𝐸 𝑠𝑡𝑝+𝑝 ) als Mittelwert aller Werte der selben Saison. Normiere Saison: Normierte Saison = Saison- Mittelwert(Saison) Bestimme die Residuen.

8 Zeitreihenanalyse: Zerlegung, Trendschätzung
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 nicht-parametrischer Ansatz Periode p = 4, Quartale Bilde gleitendes Mittel der Länge 4: 𝐺𝑀(𝑌 𝑡 )*) *) Gleitende Mittel mit gerade Periode werden korrekt etwas anders bestimmt. Um die Darstellung zu vereinfachen, wird auf eine korrekte Darstellung verzichtet. Die korrekte Vorgehensweise ist in der Literatur zu finden.

9 Zeitreihenanalyse: Zerlegung, Trendbereinigung
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 nicht-parametrischer Ansatz Extrahiere Saison und Fehler 𝑆 𝑡 + 𝐸 𝑡 = 𝑌 𝑡 − 𝐺𝑀(𝑌 𝑡 )

10 Zeitreihenanalyse: Zerlegung, Saisonschätzung
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 nicht-parametrischer Ansatz Extrahiere Saison als Mittelwert aller Werte der selben Saison.

11 Zeitreihenanalyse: Zerlegung, Saisonnormierung
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 nicht-parametrischer Ansatz Normiere Saison Mittelwert(Saison) = 6,97

12 Zeitreihenanalyse: Zerlegung, Residuenberechnung
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 nicht-parametrischer Ansatz Bestimme Residuen

13 Zeitreihenanalyse: Zerlegung, Beispiel
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 nicht-parametrischer Ansatz Zusammenfassung: Trend ist linear wachsend mit einem geschätzten Zuwachs von 20 k € pro Quartal. Saison ist auch wachsend, wobei die ersten beiden Quartale immer schwach und ungefähr gleich sind. Effekt ist also vermutlich nicht linear, was für eine Varianzanalyse spricht. Residuen werden mit der Zeit (und wachsendem Umsatz) etwas größer.

14 Zeitreihenanalyse: Regressionsmodell
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 parametrischer Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑆 𝑡 Wahl des Modells ist von der Voranalyse abgeleitet. Die Daten werden passend hergerichtet. Datenaufbereitung: Quartale sind mit 1, 2, 3 und 4 nummeriert. Neu: t ~ Jahr_Quartal einfach beginnend bei 0 durchnummeriert Konkrete Wahl ist willkürlich (können auch bei 1 beginnen). Wichtig: Abstände bleiben gleich (Intervallskalierung). Die Wahl der Werte hat Einfluss auf Größe der Koeffizienten. Regressionsgleichung 𝑈𝑚𝑠𝑎𝑡𝑧= 𝑏 0 + 𝑏 1 ∗𝐽𝑎ℎ𝑟 𝑄𝑢𝑎𝑟𝑡𝑎𝑙+ 𝑏 2 ∗𝑄𝑢𝑎𝑟𝑡𝑎𝑙

15 Zeitreihenanalyse: Regressionsmodell
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 parametrischer Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑆 𝑡 R² ist sehr hoch. Lineare Abhängigkeit von Trend und von Saisonalität sehr schön zu sehen. Alle Koeffizienten sind signifikant. Residuen werden mit der Zeit (also mit wachsendem Umsatz) größer. -> im Grunde sehr gutes Modell, aber wegen Residuen verbesserungswürdig.

16 Zeitreihenanalyse: Regressionsmodell
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 parametrischer Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑆 𝑡 5. Interpretation Beginnt auf einem Niveau von k €720 Pro Quartal wächst der Umsatz um durchschnittlich k € 15. Die Saisonalität ist linear. Passt gut Aber 15, 16 und 17 eher nicht. Mit einem zusätzlichen Quartalszuwachs von k € 73

17 Zeitreihenanalyse: Regressionsmodell mit Faktor
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 parametrischer Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) R² ist sehr hoch. F Statistik stark gesunken. Lineare Abhängigkeit von Trend schön zu sehen. Saison nicht mehr streng linear. Nicht alle Koeffizienten sind signifikant. Residuen werden mit der Zeit (also mit wachsendem Umsatz) größer. -> im Grunde sehr gutes Modell, aber wegen Residuen verbesserungswürdig.

18 Zeitreihenanalyse: Regressionsmodell mit Faktor
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 parametrischer Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) 5. Interpretation: Beginnt auf einem Niveau von k €739 Pro Quartal wächst der Umsatz um durchschnittlich k € 15, wie vorher Zweites Quartal unterscheidet sich nicht signifikant vom ersten. Drittes Quartal liefert deutlichen Zuwachs. Viertes auch, aber nicht mehr so stark.

19 Zeitreihenanalyse: Autokorrelation
Ein sehr wichtiges, ja zentrales Konzept in der Zeitreihenanalyse ist die Autokorrelation. Was ist Autokorrelation? Gegenfrage: Wie würden Sie die Temperatur für morgen ohne technische Hilfsmittel prognostizieren? Antwort: Mit der Temperatur von heute. Werte von morgen sind denen von heute ähnlich. Starke Änderungen sind eher selten. Um Autokorrelation analysieren zu können, messen zu können benötigt man die sogenannte LAG Funktion.

20 Zeitreihenanalyse: Autokorrelation und LAG
Was ist die LAG Funktion? LAG – Funktion: „Lag“ Englisch für (zeitliche) Verzögerung, Zeitabstand LAG 1: Der Wert von vorgestern wird auf gestern verschoben, von gestern auf heute und der von heute wird verworfen. Dafür fehlt der Wert am Anfang der ZR. 𝑋 𝑡 =𝐿𝑎𝑔1 𝑌 𝑡 = 𝑌 𝑡−1 Rot ~ Lag 1 ~ Vorquartal Blau ~ Lag 2 ~ Vorjahr Man erhält zusätzliche Daten, Zeitreihen, abgeleitet von der ursprünglichen Zeitreihe. In der Folge tut man so, als hätte man zusätzliche erklärende Variablen. Man berechnet Korrelation und Regression.

21 Zeitreihenanalyse: Autokorrelation
AC Funktion – ACF (autocorrelation function) Man kann nun zwischen der ursprünglichen Zeitreihe für Umsatz und ihren Lag‘s Korrelationen berechnen: Lag 1 zeigt einen eher schwachen Zusammenhang. Lag 4 hingegen ist sehr stark. Warum gerade 4? Auf Grund der Saisonalität ist das Muster 4 Quartale später sehr ähnlich egal wie das Muster aussieht. (Steigungskoeffizient fast 1) Auf Grund des linearen Zuwachses ist das Muster parallel verschoben. (Achsenabschnitt = 140)

22 Zeitreihenanalyse: Autokorrelation
AC Funktion – ACF (autocorrelation function) Die Autokorrelationsfunktion (ACF) zeigt die Korrelation zwischen der Zeitreihen und ihren Lag‘s. Lag 0 ist die Zeitreihe selbst und muss eine Korrelation von 1 haben. Die blaue Linie weist einen Schwellwert aus. Korrelationen darüber (oder im negativen Fall darunter) sind auffällig. Ergebnis wiederholt sich, Lag 1 ist zwar korreliert, aber Lag 4 tritt deutlicher hervor. Man beachte: Mit jedem Lag wird die Zeitreihe kürzer und die Korrelation unsicherer. Wie viele Lags kann man im Beispiel maximal sinnvoll berechnen?

23 Zeitreihenanalyse: Autoregressionsmodell
Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑌 𝑡−1 R² ist recht klein. F Statistik ist nicht signifikant. Koeffizienten ist nicht signifikant. Sehen Sie den Aufwärtstrend der Residuen? Es gibt in den Residuen ein lineares Wachstum!!! -> ein schlechtes Modell.

24 Zeitreihenanalyse: Autoregressionsmodell
Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑌 𝑡−1 + 𝑌 𝑡−4 R² deutlich gewachsen und recht groß. F Statistik ist signifikant. Koeffizienten von Lag 4 ist signifikant. Von Lag 1 ist er es nicht. Residuen haben sich verbessert. -> ein deutlich besseres Modell. Aber Lag 1 sollte entfernt werden.

25 Zeitreihenanalyse: Autoregressionsmodell
Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑌 𝑡−4 R² verändert sich kaum. F Statistik wächst und bleibt signifikant. Koeffizienten von Lag 4 ist signifikant. Residuen haben sich auch kaum geändert. -> ein gutes Modell.

26 Zeitreihenanalyse: Autoregressionsmodell
Interpretation von 𝑌 𝑡 ~ 𝑌 𝑡−4 Der Umsatz im kommenden Quartal wird mit 91% des Umsatzes des entsprechenden Vorjahresquartals geschätzt, was einem Abschlag von 9% entspricht. Zu dieser Schätzung kommt ein fixer Aufschlag von € 140 k. Die Umsätze bewegen sich derzeit um € 1000 k. 9% sind als € 90 k Abschlag. Da der fixe Aufschlag aber mit € 140 k größer ist, kommt es zu einem Wachstum. Irgendwann endet das Wachstum.

27 Zeitreihenanalyse: Autoregressionsmodell
Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑌 𝑡−4 -> ein gutes Modell. aber nicht so gut, wie unser ursprüngliches mit 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) und 𝑅 2 =0,9472. Was geschieht, wenn wir die Lags in dieses Modell aufnehmen?

28 Zeitreihenanalyse: Autoregressionsmodell
Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 )+ 𝑌 𝑡−1 +𝑌 𝑡−4 R² wächst deutlich. F Statistik sinkt und bleibt signifikant. Koeffizienten der Lags nicht signifikant Siasonalität auch geschwächt. -> Trotz Verbesserung des R² nicht signifikante Koeffizienten. Variablen sind zu entfernen.

29 Zeitreihenanalyse: Autoregressionsmodell
Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) +𝑌 𝑡−4 R² geht ein wenig zurück.. F Statistik wächst klarer Weise. Warum? Koeffizienten nun alle signifikant. Aber wie ist Lag 4 zu interpretieren? -> 62% des Quartalwertes vor einem Jahr werden abgezogen. Die Vorquartale wirken dämpfend. Zuvor hat Lag 4 zum Wachstum beigetragen. Nun dämpft es das Wachstum.

30 Zeitreihenanalyse: Autoregressionsmodell
Zum Vergleich 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) Was sind die Unterschiede? -> Alle Koeffizienten habe deutlich höhere Werte. Der Trend ist pro Quartal um €1000 höher. Der Zuschlag für drittes und viertes Quartal liegt um € höher. Die erhöhten Werte werden dann durch den Lag gedämpft. Lag 4 zeigt ein komplett anderes Verhalten als vorher!!!! Die zusätzlichen 2% Punkte in R² werden durch eine schwere Interpretierbarkeit erkauft. Nicht schön. Aber woher kommt die Verbesserung im R²?

31 Zeitreihenanalyse: Autokorrelation in den Residuen
AC Funktion – ACF (autocorrelation function) Was zeigt das ACF Diagramm? Es gibt in den Residuen des Modells 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) eine Autokorrelation und zwar bei Lag 1 und vor allem bei Lag 4. Was geschieht, wenn wir nun den Lag der Residuen 𝑒 𝑡 ins Modell nehmen?

32 Zeitreihenanalyse: Autokorrelation in den Residuen
Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) +𝑒 𝑡−1 +𝑒 𝑡−4 R² wächst wieder deutlich. F Statistik sinkt klarer Weise. Warum? Ist aber signifikant. Die Koeffizienten der Lag‘s sind aber nicht signifikant. -> Lag 1 entfernen.

33 Zeitreihenanalyse: Autokorrelation in den Residuen
Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) + 𝑒 𝑡−4 R² geht unwesentlich zurück. F Statistik wächst. Koeffizienten nun alle signifikant. -> Deutliche Modellverbesserung. Fast 97% der Varianz erklärt.

34 Zeitreihenanalyse: Regressionsmodell
Zum Vergleich 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) Was sind die Unterschiede? Residuen sind gedämpfter. Die Werte der Koeffizienten haben sich nicht dramatisch verändert. Was man nicht sieht, aber zutrifft: die Hochrechnung ist genauer und stabiler geworden. Forecasts sind verbessert.

35 Zeitreihenanalyse: Autokorrelation in den Residuen
AC Funktion – ACF (autocorrelation function) Erneut ein Blick auf das ACF Diagramm: Was zeigt es?

36 Zeitreihenanalyse: Regression und Autokorrelation
Interpretation des Modells 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) + 𝑒 𝑡−4 Bei t = 0 startet das Modell mit € 740 k, was ungefähr der Wert von Q ist. Pro Quartal wächst der Umsatz durchschnittlich um € 15 k. Die saisonalen Schwankungen pro Quartal sind der Tabelle zu entnehmen und zeigen das bereits besprochene Muster Die Schätzung des nächsten Quartals wird um 62% des Schätzfehlers des entsprechenden Vorjahresquartals nach unten korrigiert. Das Wachstum ist zwar unendlich, aber nicht exponentiell.

37 Zeitreihenanalyse: Autoregressionsmodell
Interpretation von 𝑌 𝑡 ~ 𝑌 𝑡−4 Der Umsatz im kommenden Quartal wird mit 91% des Umsatzes des entsprechenden Vorjahresquartals geschätzt, was einem Abschlag von 9% entspricht. Zu dieser Schätzung kommt ein fixer Aufschlag von € 140 k. Die Umsätze bewegen sich derzeit um € 1000 k. 9% sind als € 90 k Abschlag. Da der fixe Aufschlag aber mit € 140 k größer ist, kommt es zu einem Wachstum. Irgendwann endet das Wachstum.

38 Zeitreihenanalyse: Zusammenfassung Abläufe
Ablauf nicht-parametrische Zeitreihenanalyse Ablauf parametrische Zeitreihenanalyse Ablauf Zeitreihenanalyse mit Autokorrelation, Autokorrelationsmodell Ablauf parametrische Zeitreihenanalyse mit Autokorrelation der Residuen

39 Zeitreihenanalyse: Anhang
Zusätzliches Material (Nicht prüfungsrelevant) Weitere typische Saisonalitäten Besondere Effekte bzw. Ausreißer Formale Schreibweise verschiedener Arten von Zeitreihen: Aktienkurs Charts Multiplikatives Modell

40 Zeitreihenanalyse: Erweiterung
Weitere typische Saisonalitäten Jahressaisonalität : Granularität: mindestens Quartale / Monate / Wochen Periode: 4 / 12 / 52 Länge: mindestens 2 Jahre Beispiel: Budget und Planungszahlen Wochensaisonaltität: Granularität: Wochentage Periode: 5 bzw. 7 Länge: mindestens 2 Wochen, besser 1 Jahr Beispiel: Verkaufszahlen Tagessaisonalität: Granularität: z.B. stündlich Periode: 24 Länge: mindestens 2 Tage, besser 2 Wochen Beispiel: Anrufe Call Center, Verbrauchszahlen (z.B.: Tagesspitzen beim Energieverbrauch)

41 Zeitreihenanalyse: Erweiterung
Besondere Effekte bzw. Ausreißer Systematische Ausreißer: Feiertage Bewegliche Feiertage, im Wesentlichen Ostern und davon abhängige Einfluss auf Jahressaisonaliät, mögliche Interaktion Effekt auf Wochensaisonalität immer gleich -> Einschub Saisonalisierung Feste Feiertage Integration in Jahressaisonalität einfacher Effekt auf Wochensaisonalität unterschiedlich Unsystematische Ausreißer, besondere bzw. unvorhergesehene Ereignisse Passagieraufkommen z.B.: Vulkanausbruch Verkaufszahlen, außergewöhnliche Geschäftsschließung (z.B.: Wasserschaden) Call Center, besonderes Angebot im Verkauf, technische Probleme Stellen ein doppeltes Problem dar: Sind schwer vorherzusagen und stören daher die Prognose. Verzerren historische Daten, die zur Modellbildung benötigt werden.

42 Zeitreihenanalyse Formale Schreibweise verschiedener Arten von Zeitreihen: 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 𝑗 + 𝑆 𝑡 𝑤 + 𝐹 𝑡 𝑏𝑒𝑤 + 𝐹 𝑡 𝑓𝑖𝑥 + 𝐴 𝑡 + 𝐸 𝑡 Tageszeitreihe additiv 𝑌 𝑚 = 𝑇 𝑚 + 𝑆 𝑚 𝑗 + 𝐴 𝑚 + 𝐸 𝑚 Monatszeitreihe additiv 𝑋 𝑡 = 𝑇 𝑡 ∗ 𝑆 𝑡 𝑗 ∗ 𝑆 𝑡 𝑤 ∗ 𝐹 𝑡 𝑏𝑒𝑤 ∗ 𝐹 𝑡 𝑓𝑖𝑥 ∗ 𝐴 𝑡 ∗ 𝐸 𝑡 Tageszeitreihe multiplikativ 𝑋 𝑚 = 𝑇 𝑚 ∗ 𝑆 𝑚 𝑗 ∗ 𝐴 𝑚 ∗ 𝐸 𝑚 Monatszeitreihe multiplikativ 𝑌 𝑡 = ln⁡(𝑋 𝑡 ) durch logarithmieren einer multiplikativen Zeitreihe erhält man eine additive Zeitreihe 𝑌 𝑡 = 𝑇 𝑎𝑡+𝑏 + 𝑆 𝑀𝑜𝑛𝑎𝑡(𝑡) 𝑗 + 𝑆 𝑊𝑇(𝑡) 𝑤 + 𝐹 𝑊𝑇(𝑡) 𝑏𝑒𝑤 + 𝐹 𝑊𝑇(𝑡) 𝑓𝑖𝑥 + 𝐴 𝐿𝑖𝑠𝑡𝑒(𝑡) + 𝐸 𝑡 Tageszeitreihe additiv

43 Zeitreihenanalyse: Spezialfall Aktienkurse
Link: ChartTec.de Balken bzw. Bar-Chart Aufbau eines Balken

44 Zeitreihenanalyse: Spezialfall Aktienkurse
Link: ChartTec.de Candlestick-Chart, heute Standard für einen Börsen-Chart Aufbau eines Candles

45 Zeitreihenanalyse: Regression und Autokorrelation
Zum Vergleich Multiplikatives Modell mit Residuen log⁡(𝑌 𝑡 ) ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) + 𝑒 𝑡−4 Ist nicht besser als das additive Modell.

46 Zeitreihenanalyse: Regressionsmodell
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 ∗ 𝑆 𝑡 ∗ 𝐸 𝑡 parametrischer Ansatz log⁡(𝑌 𝑡 ) ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) Modellgleichung 𝑌 𝑡 =750 𝑒 0.02∗𝑡 𝑒 0.03∗ (𝑆 𝑡 =0,25) 𝑒 0.15∗ (𝑆 𝑡 =0,5) 𝑒 0.22∗ (𝑆 𝑡 =0,75) 𝑈𝑚𝑠𝑎𝑡𝑧= 𝑒 0.02∗𝑡 750, 𝑤𝑒𝑛𝑛 𝑄1 776, 𝑤𝑒𝑛𝑛 𝑄2 867, 𝑤𝑒𝑛𝑛 𝑄3 934, 𝑤𝑒𝑛𝑛 𝑄4

47 Zeitreihenanalyse: Regressionsmodell
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 ∗ 𝑆 𝑡 ∗ 𝐸 𝑡 parametrischer Ansatz Verbesserungstrick: log⁡(𝑌 𝑡 ) ~ 𝑡+ 𝑆 𝑡 was umgerechnet 𝑌 𝑡 ~ 𝑒 𝑡+ 𝑆 𝑡 = 𝑒 𝑡 ∗ 𝑒 𝑆 𝑡 ergibt. Das wird auch Multiplikatives Modell genannt.

48 Zeitreihenanalyse: Regressionsmodell
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 ∗ 𝑆 𝑡 ∗ 𝐸 𝑡 parametrischer Ansatz log⁡(𝑌 𝑡 ) ~ 𝑡+ 𝑆 𝑡 R² ist gewachsen. Koeffizienten sind signifikant. Residuen haben sich nicht wirklich verbessert. -> ein verbessertes Modell, aber wegen Residuen verbesserungswürdig. log⁡(𝑌 𝑡 )= 𝑡 𝑆 𝑡 𝑌 𝑡 = exp exp 𝑡 exp 𝑆 𝑡 𝑌 𝑡 =735 𝑒 0.02∗𝑡 𝑒 0.31∗ 𝑆 𝑡

49 Zeitreihenanalyse: Regressionsmodell
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 ∗ 𝑆 𝑡 ∗ 𝐸 𝑡 parametrischer Ansatz Saison als kategorielle Variable:, d.h. nicht-linearer Einfluss der Saison: log⁡(𝑌 𝑡 ) ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) R² wächst weiter. F Statistik sinkt, ist aber signifikant. Koeffizienten sind signifikant. Nur das zweite Quartal lässt sich nicht signifikant vom ersten Quartal unterscheiden. Residuen haben sich nun verbessert. -> ein sehr gutes Modell.

50 Zeitreihenanalyse: Regressionsmodell
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 ∗ 𝑆 𝑡 ∗ 𝐸 𝑡 parametrischer Ansatz log⁡(𝑌 𝑡 ) ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) Modellgleichung 𝑌 𝑡 =750 𝑒 0.02∗𝑡 𝑒 0.03∗ (𝑆 𝑡 =0,25) 𝑒 0.15∗ (𝑆 𝑡 =0,5) 𝑒 0.22∗ (𝑆 𝑡 =0,75) 𝑈𝑚𝑠𝑎𝑡𝑧= 𝑒 0.02∗𝑡 750, 𝑤𝑒𝑛𝑛 𝑄1 776, 𝑤𝑒𝑛𝑛 𝑄2 867, 𝑤𝑒𝑛𝑛 𝑄3 934, 𝑤𝑒𝑛𝑛 𝑄4

51 Zeitreihenanalyse: Regressionsmodell
Interpretation von 𝑈𝑚𝑠𝑎𝑡𝑧= 𝑒 0.02∗𝑡 750, 𝑤𝑒𝑛𝑛 𝑄1 776, 𝑤𝑒𝑛𝑛 𝑄2 867, 𝑤𝑒𝑛𝑛 𝑄3 934, 𝑤𝑒𝑛𝑛 𝑄4 Die (nicht lineare) Saisonalität kann an den Quartalskoeffizienten gut abgelesen werden. Jedes Quartal liefert einen Basisumsatz. Das Erste ist immer das Schwächste, das Vierte immer das Beste. Mit der Zeit (t) kommt es zu einer Steigerung, die im übrigen auch nicht linear ist. Da t bei 0 beginnt und exp(0) = 1 ist, lässt sich exp(0,02*t) als prozentueller Aufschlag interpretieren, der mit der Zeit größer wird. Ab dem Jahr 2023 kommt es schon zu 76% zusätzlicher Umsätze gegenüber Q4 2014

52 Zeitreihenanalyse: Zusammenfassung
Wir haben drei Modelle: Additives Regressionsmodell mit autokorrelierten Residuen 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) + 𝑒 𝑡−4 Multiplikatives Regressionsmodell mit autokorrelierten Residuen 𝑌 𝑡 ~ exp 𝑡 ∗ exp⁡(𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ))∗ exp⁡( 𝑒 𝑡−4 ) Autokorrelationsmodell 𝑌 𝑡 ~ 𝑌 𝑡−4 Welches nehmen? Modell 3 scheidet aus, weil R² der anderen beiden viel höher ist. Die beiden anderen sind etwa gleich gut. Vielleicht das etwas einfachere additive Modell? Weit in die Zukunft zu prognostizieren, ist mit solchen Modellen grundsätzlich nicht ratsam. Es können Ereignisse eintreten, die das extrahierte Muster komplett verändern. Keines dieser Modelle ist ein kausales Prognosemodell. Bei Prognosen weiter in die Zukunft gilt es zu bedenken, dass das multiplikative Modell den stärkeren Zuwachs hat, ein exponentielles Wachstum.


Herunterladen ppt "Ökonometrie und Statistik Zeitreihenanalyse"

Ähnliche Präsentationen


Google-Anzeigen