Ökonometrie und Statistik Zeitreihenanalyse Dr. Bertram Wassermann
Zeitreihenanalyse: Definition Kurze, übersichtliche Einführung mit Übungen gibt: Auch zu anderen Themen wie Einfach- und Mehrfachregression und Varianzanalyse. Gibt auch Einführung in statistisches Testen.
Zeitreihenanalyse: Definition Was ist eine Zeitreihe? Ein metrischer KPI wird in regelmäßigen, zeitlichen Abständen erfasst oder gemessen. Notation: 𝑋 𝑡 : 𝑥 1 , 𝑥 2 , …, 𝑥 𝑛 ist eine Folge von endlich vielen Zahlen, wobei die zeitliche Reihenfolge der Ordnung der natürlichen Zahlen entspricht. Granularität: Typische Einheiten der Messung / Erfassung Jährlich Semester / Trimester Quartale Monate Kalenderwochen Arbeitswoche Tage Stunden Minuten … KPI: einige Beispiele Umsatz, Gewinn Anzahl Studenten, Vorlesungsstunden Verkäufe Verkaufte KM (PKM), uvm. Besucher, Fahrgäste Arbeitsstunden Aktienkurse Anrufe beim Customer Service Serverzugriffe …
Zeitreihenanalyse: Definition Was ist eine Zeitreihe? Der KPI könnte auch ordinal sein oder nominal. Ist aber eher untypisch und wenn, dann informell. Und die zeitliche Reihenfolge könnte auch unregelmäßig sein: 𝑋 𝑁(𝑡) : 𝑥 𝑡1 , 𝑥 𝑡2 , …, 𝑥 𝑡𝑛 Quelle:ORF.at So etwas nennt man üblicher Weise einen Prozess. Dafür gibt es auch Theorie. Auch die zeitlichen Abstände zwischen dem Eintreten von Ereignissen ist relevant. Wir betrachten Zeitreihen mit metrischem KPI in regelmäßigen Abständen erhoben / erfasst.
Zeitreihenanalyse: Grafische Darstellung Welche Art von Skalierung hat die Zeit bei Zeitreihendaten? Sie ist metrisch und diskret. Richtige Darstellungsformen sind daher Säulendiagramm Punktdiagramm Typische und übliche Darstellung ist das Liniendiagramm mit Punkten, Polygon Eigentlich falsch, da x-Achse diskret. Verstärkt aber das Lesen der zeitlichen Entwicklung. Ohne Punkte ist allerdings nicht zu erkennen, dass die Daten eigentlich diskret sind.
Zeitreihenanalyse: Zerlegung Analyse der Zeitreihe: Welche Muster finden Sie in den Daten? Steigung, Aufwärtstrend Eine Welle, pro Jahr wiederholt sich das Muster, steigende Umsätze mit den Quartalen. Die Zeitreihe setzt sich zusammen aus Trendkomponente Saisonkomponente Residuenkomponente Man schreibt additiv 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡
Zeitreihenanalyse: Zerlegung Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 nicht-parametrischer Ansatz Bestimme (größte) Periode p der saisonalen Komponente der Zeitreihe 𝑌 𝑡 Bilde gleitendes Mittel der Länge p: 𝐺𝑀(𝑌 𝑡 ) Extrahiere Saison und Fehler 𝑆 𝑡 + 𝐸 𝑡 = 𝑌 𝑡 − 𝐺𝑀(𝑌 𝑡 ) Extrahiere Saison 𝑆 𝑠𝑡1 = 𝑀𝑒𝑎𝑛(𝑆 𝑠𝑡1+𝑝 + 𝐸 𝑠𝑡1+𝑝 ) … 𝑆 𝑠𝑡𝑝 = 𝑀𝑒𝑎𝑛(𝑆 𝑠𝑡𝑝+𝑝 + 𝐸 𝑠𝑡𝑝+𝑝 ) als Mittelwert aller Werte der selben Saison. Normiere Saison: Normierte Saison = Saison- Mittelwert(Saison) Bestimme die Residuen.
Zeitreihenanalyse: Zerlegung, Trendschätzung Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 nicht-parametrischer Ansatz Periode p = 4, Quartale Bilde gleitendes Mittel der Länge 4: 𝐺𝑀(𝑌 𝑡 )*) *) Gleitende Mittel mit gerade Periode werden korrekt etwas anders bestimmt. Um die Darstellung zu vereinfachen, wird auf eine korrekte Darstellung verzichtet. Die korrekte Vorgehensweise ist in der Literatur zu finden.
Zeitreihenanalyse: Zerlegung, Trendbereinigung Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 nicht-parametrischer Ansatz Extrahiere Saison und Fehler 𝑆 𝑡 + 𝐸 𝑡 = 𝑌 𝑡 − 𝐺𝑀(𝑌 𝑡 )
Zeitreihenanalyse: Zerlegung, Saisonschätzung Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 nicht-parametrischer Ansatz Extrahiere Saison als Mittelwert aller Werte der selben Saison.
Zeitreihenanalyse: Zerlegung, Saisonnormierung Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 nicht-parametrischer Ansatz Normiere Saison Mittelwert(Saison) = 6,97
Zeitreihenanalyse: Zerlegung, Residuenberechnung Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 nicht-parametrischer Ansatz Bestimme Residuen
Zeitreihenanalyse: Zerlegung, Beispiel Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 nicht-parametrischer Ansatz Zusammenfassung: Trend ist linear wachsend mit einem geschätzten Zuwachs von 20 k € pro Quartal. Saison ist auch wachsend, wobei die ersten beiden Quartale immer schwach und ungefähr gleich sind. Effekt ist also vermutlich nicht linear, was für eine Varianzanalyse spricht. Residuen werden mit der Zeit (und wachsendem Umsatz) etwas größer.
Zeitreihenanalyse: Regressionsmodell Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 parametrischer Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑆 𝑡 Wahl des Modells ist von der Voranalyse abgeleitet. Die Daten werden passend hergerichtet. Datenaufbereitung: Quartale sind mit 1, 2, 3 und 4 nummeriert. Neu: t ~ Jahr_Quartal einfach beginnend bei 0 durchnummeriert Konkrete Wahl ist willkürlich (können auch bei 1 beginnen). Wichtig: Abstände bleiben gleich (Intervallskalierung). Die Wahl der Werte hat Einfluss auf Größe der Koeffizienten. Regressionsgleichung 𝑈𝑚𝑠𝑎𝑡𝑧= 𝑏 0 + 𝑏 1 ∗𝐽𝑎ℎ𝑟 𝑄𝑢𝑎𝑟𝑡𝑎𝑙+ 𝑏 2 ∗𝑄𝑢𝑎𝑟𝑡𝑎𝑙
Zeitreihenanalyse: Regressionsmodell Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 parametrischer Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑆 𝑡 R² ist sehr hoch. Lineare Abhängigkeit von Trend und von Saisonalität sehr schön zu sehen. Alle Koeffizienten sind signifikant. Residuen werden mit der Zeit (also mit wachsendem Umsatz) größer. -> im Grunde sehr gutes Modell, aber wegen Residuen verbesserungswürdig.
Zeitreihenanalyse: Regressionsmodell Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 parametrischer Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑆 𝑡 5. Interpretation Beginnt auf einem Niveau von k €720 Pro Quartal wächst der Umsatz um durchschnittlich k € 15. Die Saisonalität ist linear. Passt gut 2014. Aber 15, 16 und 17 eher nicht. Mit einem zusätzlichen Quartalszuwachs von k € 73
Zeitreihenanalyse: Regressionsmodell mit Faktor Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 parametrischer Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) R² ist sehr hoch. F Statistik stark gesunken. Lineare Abhängigkeit von Trend schön zu sehen. Saison nicht mehr streng linear. Nicht alle Koeffizienten sind signifikant. Residuen werden mit der Zeit (also mit wachsendem Umsatz) größer. -> im Grunde sehr gutes Modell, aber wegen Residuen verbesserungswürdig.
Zeitreihenanalyse: Regressionsmodell mit Faktor Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 parametrischer Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) 5. Interpretation: Beginnt auf einem Niveau von k €739 Pro Quartal wächst der Umsatz um durchschnittlich k € 15, wie vorher Zweites Quartal unterscheidet sich nicht signifikant vom ersten. Drittes Quartal liefert deutlichen Zuwachs. Viertes auch, aber nicht mehr so stark.
Zeitreihenanalyse: Autokorrelation Ein sehr wichtiges, ja zentrales Konzept in der Zeitreihenanalyse ist die Autokorrelation. Was ist Autokorrelation? Gegenfrage: Wie würden Sie die Temperatur für morgen ohne technische Hilfsmittel prognostizieren? Antwort: Mit der Temperatur von heute. Werte von morgen sind denen von heute ähnlich. Starke Änderungen sind eher selten. Um Autokorrelation analysieren zu können, messen zu können benötigt man die sogenannte LAG Funktion.
Zeitreihenanalyse: Autokorrelation und LAG Was ist die LAG Funktion? LAG – Funktion: „Lag“ Englisch für (zeitliche) Verzögerung, Zeitabstand LAG 1: Der Wert von vorgestern wird auf gestern verschoben, von gestern auf heute und der von heute wird verworfen. Dafür fehlt der Wert am Anfang der ZR. 𝑋 𝑡 =𝐿𝑎𝑔1 𝑌 𝑡 = 𝑌 𝑡−1 Rot ~ Lag 1 ~ Vorquartal Blau ~ Lag 2 ~ Vorjahr Man erhält zusätzliche Daten, Zeitreihen, abgeleitet von der ursprünglichen Zeitreihe. In der Folge tut man so, als hätte man zusätzliche erklärende Variablen. Man berechnet Korrelation und Regression.
Zeitreihenanalyse: Autokorrelation AC Funktion – ACF (autocorrelation function) Man kann nun zwischen der ursprünglichen Zeitreihe für Umsatz und ihren Lag‘s Korrelationen berechnen: Lag 1 zeigt einen eher schwachen Zusammenhang. Lag 4 hingegen ist sehr stark. Warum gerade 4? Auf Grund der Saisonalität ist das Muster 4 Quartale später sehr ähnlich egal wie das Muster aussieht. (Steigungskoeffizient fast 1) Auf Grund des linearen Zuwachses ist das Muster parallel verschoben. (Achsenabschnitt = 140)
Zeitreihenanalyse: Autokorrelation AC Funktion – ACF (autocorrelation function) Die Autokorrelationsfunktion (ACF) zeigt die Korrelation zwischen der Zeitreihen und ihren Lag‘s. Lag 0 ist die Zeitreihe selbst und muss eine Korrelation von 1 haben. Die blaue Linie weist einen Schwellwert aus. Korrelationen darüber (oder im negativen Fall darunter) sind auffällig. Ergebnis wiederholt sich, Lag 1 ist zwar korreliert, aber Lag 4 tritt deutlicher hervor. Man beachte: Mit jedem Lag wird die Zeitreihe kürzer und die Korrelation unsicherer. Wie viele Lags kann man im Beispiel maximal sinnvoll berechnen?
Zeitreihenanalyse: Autoregressionsmodell Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑌 𝑡−1 R² ist recht klein. F Statistik ist nicht signifikant. Koeffizienten ist nicht signifikant. Sehen Sie den Aufwärtstrend der Residuen? Es gibt in den Residuen ein lineares Wachstum!!! -> ein schlechtes Modell.
Zeitreihenanalyse: Autoregressionsmodell Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑌 𝑡−1 + 𝑌 𝑡−4 R² deutlich gewachsen und recht groß. F Statistik ist signifikant. Koeffizienten von Lag 4 ist signifikant. Von Lag 1 ist er es nicht. Residuen haben sich verbessert. -> ein deutlich besseres Modell. Aber Lag 1 sollte entfernt werden.
Zeitreihenanalyse: Autoregressionsmodell Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑌 𝑡−4 R² verändert sich kaum. F Statistik wächst und bleibt signifikant. Koeffizienten von Lag 4 ist signifikant. Residuen haben sich auch kaum geändert. -> ein gutes Modell.
Zeitreihenanalyse: Autoregressionsmodell Interpretation von 𝑌 𝑡 ~ 𝑌 𝑡−4 Der Umsatz im kommenden Quartal wird mit 91% des Umsatzes des entsprechenden Vorjahresquartals geschätzt, was einem Abschlag von 9% entspricht. Zu dieser Schätzung kommt ein fixer Aufschlag von € 140 k. Die Umsätze bewegen sich derzeit um € 1000 k. 9% sind als € 90 k Abschlag. Da der fixe Aufschlag aber mit € 140 k größer ist, kommt es zu einem Wachstum. Irgendwann endet das Wachstum.
Zeitreihenanalyse: Autoregressionsmodell Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑌 𝑡−4 -> ein gutes Modell. aber nicht so gut, wie unser ursprüngliches mit 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) und 𝑅 2 =0,9472. Was geschieht, wenn wir die Lags in dieses Modell aufnehmen?
Zeitreihenanalyse: Autoregressionsmodell Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 )+ 𝑌 𝑡−1 +𝑌 𝑡−4 R² wächst deutlich. F Statistik sinkt und bleibt signifikant. Koeffizienten der Lags nicht signifikant Siasonalität auch geschwächt. -> Trotz Verbesserung des R² nicht signifikante Koeffizienten. Variablen sind zu entfernen.
Zeitreihenanalyse: Autoregressionsmodell Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) +𝑌 𝑡−4 R² geht ein wenig zurück.. F Statistik wächst klarer Weise. Warum? Koeffizienten nun alle signifikant. Aber wie ist Lag 4 zu interpretieren? -> 62% des Quartalwertes vor einem Jahr werden abgezogen. Die Vorquartale wirken dämpfend. Zuvor hat Lag 4 zum Wachstum beigetragen. Nun dämpft es das Wachstum.
Zeitreihenanalyse: Autoregressionsmodell Zum Vergleich 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) Was sind die Unterschiede? -> Alle Koeffizienten habe deutlich höhere Werte. Der Trend ist pro Quartal um €1000 höher. Der Zuschlag für drittes und viertes Quartal liegt um €100.000 höher. Die erhöhten Werte werden dann durch den Lag gedämpft. Lag 4 zeigt ein komplett anderes Verhalten als vorher!!!! Die zusätzlichen 2% Punkte in R² werden durch eine schwere Interpretierbarkeit erkauft. Nicht schön. Aber woher kommt die Verbesserung im R²?
Zeitreihenanalyse: Autokorrelation in den Residuen AC Funktion – ACF (autocorrelation function) Was zeigt das ACF Diagramm? Es gibt in den Residuen des Modells 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) eine Autokorrelation und zwar bei Lag 1 und vor allem bei Lag 4. Was geschieht, wenn wir nun den Lag der Residuen 𝑒 𝑡 ins Modell nehmen?
Zeitreihenanalyse: Autokorrelation in den Residuen Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) +𝑒 𝑡−1 +𝑒 𝑡−4 R² wächst wieder deutlich. F Statistik sinkt klarer Weise. Warum? Ist aber signifikant. Die Koeffizienten der Lag‘s sind aber nicht signifikant. -> Lag 1 entfernen.
Zeitreihenanalyse: Autokorrelation in den Residuen Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) + 𝑒 𝑡−4 R² geht unwesentlich zurück. F Statistik wächst. Koeffizienten nun alle signifikant. -> Deutliche Modellverbesserung. Fast 97% der Varianz erklärt.
Zeitreihenanalyse: Regressionsmodell Zum Vergleich 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) Was sind die Unterschiede? Residuen sind gedämpfter. Die Werte der Koeffizienten haben sich nicht dramatisch verändert. Was man nicht sieht, aber zutrifft: die Hochrechnung ist genauer und stabiler geworden. Forecasts sind verbessert.
Zeitreihenanalyse: Autokorrelation in den Residuen AC Funktion – ACF (autocorrelation function) Erneut ein Blick auf das ACF Diagramm: Was zeigt es?
Zeitreihenanalyse: Regression und Autokorrelation Interpretation des Modells 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) + 𝑒 𝑡−4 Bei t = 0 startet das Modell mit € 740 k, was ungefähr der Wert von Q1 2014 ist. Pro Quartal wächst der Umsatz durchschnittlich um € 15 k. Die saisonalen Schwankungen pro Quartal sind der Tabelle zu entnehmen und zeigen das bereits besprochene Muster Die Schätzung des nächsten Quartals wird um 62% des Schätzfehlers des entsprechenden Vorjahresquartals nach unten korrigiert. Das Wachstum ist zwar unendlich, aber nicht exponentiell.
Zeitreihenanalyse: Autoregressionsmodell Interpretation von 𝑌 𝑡 ~ 𝑌 𝑡−4 Der Umsatz im kommenden Quartal wird mit 91% des Umsatzes des entsprechenden Vorjahresquartals geschätzt, was einem Abschlag von 9% entspricht. Zu dieser Schätzung kommt ein fixer Aufschlag von € 140 k. Die Umsätze bewegen sich derzeit um € 1000 k. 9% sind als € 90 k Abschlag. Da der fixe Aufschlag aber mit € 140 k größer ist, kommt es zu einem Wachstum. Irgendwann endet das Wachstum.
Zeitreihenanalyse: Zusammenfassung Abläufe Ablauf nicht-parametrische Zeitreihenanalyse Ablauf parametrische Zeitreihenanalyse Ablauf Zeitreihenanalyse mit Autokorrelation, Autokorrelationsmodell Ablauf parametrische Zeitreihenanalyse mit Autokorrelation der Residuen
Zeitreihenanalyse: Anhang Zusätzliches Material (Nicht prüfungsrelevant) Weitere typische Saisonalitäten Besondere Effekte bzw. Ausreißer Formale Schreibweise verschiedener Arten von Zeitreihen: Aktienkurs Charts Multiplikatives Modell
Zeitreihenanalyse: Erweiterung Weitere typische Saisonalitäten Jahressaisonalität : Granularität: mindestens Quartale / Monate / Wochen Periode: 4 / 12 / 52 Länge: mindestens 2 Jahre Beispiel: Budget und Planungszahlen Wochensaisonaltität: Granularität: Wochentage Periode: 5 bzw. 7 Länge: mindestens 2 Wochen, besser 1 Jahr Beispiel: Verkaufszahlen Tagessaisonalität: Granularität: z.B. stündlich Periode: 24 Länge: mindestens 2 Tage, besser 2 Wochen Beispiel: Anrufe Call Center, Verbrauchszahlen (z.B.: Tagesspitzen beim Energieverbrauch)
Zeitreihenanalyse: Erweiterung Besondere Effekte bzw. Ausreißer Systematische Ausreißer: Feiertage Bewegliche Feiertage, im Wesentlichen Ostern und davon abhängige Einfluss auf Jahressaisonaliät, mögliche Interaktion Effekt auf Wochensaisonalität immer gleich -> Einschub Saisonalisierung Feste Feiertage Integration in Jahressaisonalität einfacher Effekt auf Wochensaisonalität unterschiedlich Unsystematische Ausreißer, besondere bzw. unvorhergesehene Ereignisse Passagieraufkommen z.B.: Vulkanausbruch Verkaufszahlen, außergewöhnliche Geschäftsschließung (z.B.: Wasserschaden) Call Center, besonderes Angebot im Verkauf, technische Probleme … Stellen ein doppeltes Problem dar: Sind schwer vorherzusagen und stören daher die Prognose. Verzerren historische Daten, die zur Modellbildung benötigt werden.
Zeitreihenanalyse Formale Schreibweise verschiedener Arten von Zeitreihen: 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 𝑗 + 𝑆 𝑡 𝑤 + 𝐹 𝑡 𝑏𝑒𝑤 + 𝐹 𝑡 𝑓𝑖𝑥 + 𝐴 𝑡 + 𝐸 𝑡 Tageszeitreihe additiv 𝑌 𝑚 = 𝑇 𝑚 + 𝑆 𝑚 𝑗 + 𝐴 𝑚 + 𝐸 𝑚 Monatszeitreihe additiv 𝑋 𝑡 = 𝑇 𝑡 ∗ 𝑆 𝑡 𝑗 ∗ 𝑆 𝑡 𝑤 ∗ 𝐹 𝑡 𝑏𝑒𝑤 ∗ 𝐹 𝑡 𝑓𝑖𝑥 ∗ 𝐴 𝑡 ∗ 𝐸 𝑡 Tageszeitreihe multiplikativ 𝑋 𝑚 = 𝑇 𝑚 ∗ 𝑆 𝑚 𝑗 ∗ 𝐴 𝑚 ∗ 𝐸 𝑚 Monatszeitreihe multiplikativ 𝑌 𝑡 = ln(𝑋 𝑡 ) durch logarithmieren einer multiplikativen Zeitreihe erhält man eine additive Zeitreihe 𝑌 𝑡 = 𝑇 𝑎𝑡+𝑏 + 𝑆 𝑀𝑜𝑛𝑎𝑡(𝑡) 𝑗 + 𝑆 𝑊𝑇(𝑡) 𝑤 + 𝐹 𝑊𝑇(𝑡) 𝑏𝑒𝑤 + 𝐹 𝑊𝑇(𝑡) 𝑓𝑖𝑥 + 𝐴 𝐿𝑖𝑠𝑡𝑒(𝑡) + 𝐸 𝑡 Tageszeitreihe additiv
Zeitreihenanalyse: Spezialfall Aktienkurse Link: ChartTec.de https://www.charttec.de/html/ta_charts.php Balken bzw. Bar-Chart Aufbau eines Balken
Zeitreihenanalyse: Spezialfall Aktienkurse Link: ChartTec.de https://www.charttec.de/html/ta_charts.php Candlestick-Chart, heute Standard für einen Börsen-Chart Aufbau eines Candles
Zeitreihenanalyse: Regression und Autokorrelation Zum Vergleich Multiplikatives Modell mit Residuen log(𝑌 𝑡 ) ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) + 𝑒 𝑡−4 Ist nicht besser als das additive Modell.
Zeitreihenanalyse: Regressionsmodell Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 ∗ 𝑆 𝑡 ∗ 𝐸 𝑡 parametrischer Ansatz log(𝑌 𝑡 ) ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) Modellgleichung 𝑌 𝑡 =750 𝑒 0.02∗𝑡 𝑒 0.03∗ (𝑆 𝑡 =0,25) 𝑒 0.15∗ (𝑆 𝑡 =0,5) 𝑒 0.22∗ (𝑆 𝑡 =0,75) 𝑈𝑚𝑠𝑎𝑡𝑧= 𝑒 0.02∗𝑡 750, 𝑤𝑒𝑛𝑛 𝑄1 776, 𝑤𝑒𝑛𝑛 𝑄2 867, 𝑤𝑒𝑛𝑛 𝑄3 934, 𝑤𝑒𝑛𝑛 𝑄4
Zeitreihenanalyse: Regressionsmodell Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 ∗ 𝑆 𝑡 ∗ 𝐸 𝑡 parametrischer Ansatz Verbesserungstrick: log(𝑌 𝑡 ) ~ 𝑡+ 𝑆 𝑡 was umgerechnet 𝑌 𝑡 ~ 𝑒 𝑡+ 𝑆 𝑡 = 𝑒 𝑡 ∗ 𝑒 𝑆 𝑡 ergibt. Das wird auch Multiplikatives Modell genannt.
Zeitreihenanalyse: Regressionsmodell Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 ∗ 𝑆 𝑡 ∗ 𝐸 𝑡 parametrischer Ansatz log(𝑌 𝑡 ) ~ 𝑡+ 𝑆 𝑡 R² ist gewachsen. Koeffizienten sind signifikant. Residuen haben sich nicht wirklich verbessert. -> ein verbessertes Modell, aber wegen Residuen verbesserungswürdig. log(𝑌 𝑡 )=6.6+0.02 𝑡+0.31 𝑆 𝑡 𝑌 𝑡 = exp 6.6 exp 0.02 𝑡 exp 0.31 𝑆 𝑡 𝑌 𝑡 =735 𝑒 0.02∗𝑡 𝑒 0.31∗ 𝑆 𝑡
Zeitreihenanalyse: Regressionsmodell Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 ∗ 𝑆 𝑡 ∗ 𝐸 𝑡 parametrischer Ansatz Saison als kategorielle Variable:, d.h. nicht-linearer Einfluss der Saison: log(𝑌 𝑡 ) ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) R² wächst weiter. F Statistik sinkt, ist aber signifikant. Koeffizienten sind signifikant. Nur das zweite Quartal lässt sich nicht signifikant vom ersten Quartal unterscheiden. Residuen haben sich nun verbessert. -> ein sehr gutes Modell.
Zeitreihenanalyse: Regressionsmodell Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 ∗ 𝑆 𝑡 ∗ 𝐸 𝑡 parametrischer Ansatz log(𝑌 𝑡 ) ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) Modellgleichung 𝑌 𝑡 =750 𝑒 0.02∗𝑡 𝑒 0.03∗ (𝑆 𝑡 =0,25) 𝑒 0.15∗ (𝑆 𝑡 =0,5) 𝑒 0.22∗ (𝑆 𝑡 =0,75) 𝑈𝑚𝑠𝑎𝑡𝑧= 𝑒 0.02∗𝑡 750, 𝑤𝑒𝑛𝑛 𝑄1 776, 𝑤𝑒𝑛𝑛 𝑄2 867, 𝑤𝑒𝑛𝑛 𝑄3 934, 𝑤𝑒𝑛𝑛 𝑄4
Zeitreihenanalyse: Regressionsmodell Interpretation von 𝑈𝑚𝑠𝑎𝑡𝑧= 𝑒 0.02∗𝑡 750, 𝑤𝑒𝑛𝑛 𝑄1 776, 𝑤𝑒𝑛𝑛 𝑄2 867, 𝑤𝑒𝑛𝑛 𝑄3 934, 𝑤𝑒𝑛𝑛 𝑄4 Die (nicht lineare) Saisonalität kann an den Quartalskoeffizienten gut abgelesen werden. Jedes Quartal liefert einen Basisumsatz. Das Erste ist immer das Schwächste, das Vierte immer das Beste. Mit der Zeit (t) kommt es zu einer Steigerung, die im übrigen auch nicht linear ist. Da t bei 0 beginnt und exp(0) = 1 ist, lässt sich exp(0,02*t) als prozentueller Aufschlag interpretieren, der mit der Zeit größer wird. Ab dem Jahr 2023 kommt es schon zu 76% zusätzlicher Umsätze gegenüber Q4 2014
Zeitreihenanalyse: Zusammenfassung Wir haben drei Modelle: Additives Regressionsmodell mit autokorrelierten Residuen 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) + 𝑒 𝑡−4 Multiplikatives Regressionsmodell mit autokorrelierten Residuen 𝑌 𝑡 ~ exp 𝑡 ∗ exp(𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ))∗ exp( 𝑒 𝑡−4 ) Autokorrelationsmodell 𝑌 𝑡 ~ 𝑌 𝑡−4 Welches nehmen? Modell 3 scheidet aus, weil R² der anderen beiden viel höher ist. Die beiden anderen sind etwa gleich gut. Vielleicht das etwas einfachere additive Modell? Weit in die Zukunft zu prognostizieren, ist mit solchen Modellen grundsätzlich nicht ratsam. Es können Ereignisse eintreten, die das extrahierte Muster komplett verändern. Keines dieser Modelle ist ein kausales Prognosemodell. Bei Prognosen weiter in die Zukunft gilt es zu bedenken, dass das multiplikative Modell den stärkeren Zuwachs hat, ein exponentielles Wachstum.