Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Ökonometrie und Statistik Zeitreihenanalyse

Ähnliche Präsentationen


Präsentation zum Thema: "Ökonometrie und Statistik Zeitreihenanalyse"—  Präsentation transkript:

1 Ökonometrie und Statistik Zeitreihenanalyse
Dr. Bertram Wassermann

2 Zeitreihenanalyse: Definition
Kurze, übersichtliche Einführung mit Übungen gibt: Auch zu anderen Themen wie Einfach- und Mehrfachregression und Varianzanalyse. Gibt auch Einführung in statistisches Testen.

3 Zeitreihenanalyse: Definition
Was ist eine Zeitreihe? Ein metrischer KPI wird in regelmäßigen, zeitlichen Abständen erfasst oder gemessen. Notation: 𝑋 𝑡 : 𝑥 1 , 𝑥 2 , …, 𝑥 𝑛 ist eine Folge von endlich vielen Zahlen, wobei die zeitliche Reihenfolge der Ordnung der natürlichen Zahlen entspricht. Granularität: Typische Einheiten der Messung / Erfassung Jährlich Semester / Trimester Quartale Monate Kalenderwochen Arbeitswoche Tage Stunden Minuten KPI: einige Beispiele Umsatz, Gewinn Anzahl Studenten, Vorlesungsstunden Verkäufe Verkaufte KM (PKM), uvm. Besucher, Fahrgäste Arbeitsstunden Aktienkurse Anrufe beim Customer Service Serverzugriffe

4 Zeitreihenanalyse: Definition
Was ist eine Zeitreihe? Der KPI könnte auch ordinal sein oder nominal. Ist aber eher untypisch und wenn, dann informell. Und die zeitliche Reihenfolge könnte auch unregelmäßig sein: 𝑋 𝑁(𝑡) : 𝑥 𝑡1 , 𝑥 𝑡2 , …, 𝑥 𝑡𝑛 Quelle:ORF.at So etwas nennt man üblicher Weise einen Prozess. Dafür gibt es auch Theorie. Auch die zeitlichen Abstände zwischen dem Eintreten von Ereignissen ist relevant. Wir betrachten Zeitreihen mit metrischem KPI in regelmäßigen Abständen erhoben / erfasst.

5 Zeitreihenanalyse: Grafische Darstellung
Welche Art von Skalierung hat die Zeit bei Zeitreihendaten? Sie ist metrisch und diskret. Richtige Darstellungsformen sind daher Säulendiagramm Punktdiagramm Typische und übliche Darstellung ist das Liniendiagramm mit Punkten, Polygon Eigentlich falsch, da x-Achse diskret. Verstärkt aber das Lesen der zeitlichen Entwicklung. Ohne Punkte ist allerdings nicht zu erkennen, dass die Daten eigentlich diskret sind.

6 Zeitreihenanalyse: Zerlegung
Analyse der Zeitreihe: Welche Muster finden Sie in den Daten? Steigung, Aufwärtstrend Eine Welle, pro Jahr wiederholt sich das Muster, steigende Umsätze mit den Quartalen. Die Zeitreihe setzt sich zusammen aus Trendkomponente Saisonkomponente Residuenkomponente Man schreibt 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡

7 Zeitreihenanalyse: Zerlegung
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 nicht-parametrischer Ansatz Bestimme (größte) Periode p der saisonalen Komponente der Zeitreihe 𝑌 𝑡 Bilde gleitendes Mittel der Länge p: 𝐺𝑀(𝑌 𝑡 ) Extrahiere Saison und Fehler 𝑆 𝑡 + 𝐸 𝑡 = 𝑌 𝑡 − 𝐺𝑀(𝑌 𝑡 ) Extrahiere Saison 𝑆 𝑠𝑡1 = 𝑀𝑒𝑎𝑛(𝑆 𝑠𝑡1+𝑝 + 𝐸 𝑠𝑡1+𝑝 ) 𝑆 𝑠𝑡𝑝 = 𝑀𝑒𝑎𝑛(𝑆 𝑠𝑡𝑝+𝑝 + 𝐸 𝑠𝑡𝑝+𝑝 ) Als Mittelwert aller Werte der selben Saison. Normiere Saison: Normierte Saison = Saison- Mittelwert(Saison) Bestimme die Residuen.

8 Zeitreihenanalyse: Zerlegung, Beispiel
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 nicht-parametrischer Ansatz Periode p = 4, Quartale Bilde gleitendes Mittel der Länge 4: 𝐺𝑀(𝑌 𝑡 )*) *) Gleitende Mittel mit gerade Periode werden korrekt etwas anders bestimmt. Um die Darstellung zu vereinfachen, wird auf eine korrekte Darstellung verzichtet. Die korrekte Vorgehensweise ist in der Literatur zu finden.

9 Zeitreihenanalyse: Zerlegung, Beispiel
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 nicht-parametrischer Ansatz Extrahiere Saison und Fehler 𝑆 𝑡 + 𝐸 𝑡 = 𝑌 𝑡 − 𝐺𝑀(𝑌 𝑡 )

10 Zeitreihenanalyse: Zerlegung, Beispiel
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 nicht-parametrischer Ansatz Extrahiere Saison als Mittelwert aller Werte der selben Saison.

11 Zeitreihenanalyse: Zerlegung, Beispiel
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 nicht-parametrischer Ansatz Normiere Saison Mittelwert(Saison) = 6,97

12 Zeitreihenanalyse: Zerlegung, Beispiel
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 nicht-parametrischer Ansatz Bestimme Residuen

13 Zeitreihenanalyse: Zerlegung, Beispiel
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 nicht-parametrischer Ansatz Zusammenfassung: Trend ist linear wachsend mit einem geschätzten Zuwachs von 20 k € pro Quartal. Saison ist auch wachsend, wobei die ersten beiden Quartale immer schwach und ungefähr gleich sind. Effekt ist also vermutlich nicht linear, was für eine Varianzanalyse spricht. Residuen werden mit der Zeit (und wachsendem Umsatz) größer.

14 Zeitreihenanalyse: Regressionsmodell
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 parametrischer Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑆 𝑡 Wahl des Modells ist von der Voranalyse abgeleitet. Die Daten werden passend hergerichtet. Datenaufbereitung: Jahr und Quartal, also t, einfach durchnummeriert Quartal mit 0, ¼, ½ und ¾ nummeriert. Konkrete Wahl ist willkürlich. Wichtig: Abstände bleiben gleich. Die Wahl der Werte hat Einfluss auf Größe der Koeffizienten.

15 Zeitreihenanalyse: Regressionsmodell
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 parametrischer Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑆 𝑡 R² ist sehr hoch. Lineare Abhängigkeit von Trend und von Saisonalität sehr schön zu sehen. Alle Koeffizienten sind signifikant. Residuen werden mit der Zeit (und wachsendem Umsatz) größer. -> im Grunde sehr gutes Modell, aber wegen Residuen verbesserungswürdig.

16 Zeitreihenanalyse: Regressionsmodell
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 ∗ 𝑆 𝑡 ∗ 𝐸 𝑡 parametrischer Ansatz Verbesserungstrick: log⁡(𝑌 𝑡 ) ~ 𝑡+ 𝑆 𝑡 was umgerechnet 𝑌 𝑡 ~ 𝑒 𝑡+ 𝑆 𝑡 = 𝑒 𝑡 ∗ 𝑒 𝑆 𝑡 ergibt. Das wird auch Multiplikatives Modell genannt.

17 Zeitreihenanalyse: Regressionsmodell
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 ∗ 𝑆 𝑡 ∗ 𝐸 𝑡 parametrischer Ansatz log⁡(𝑌 𝑡 ) ~ 𝑡+ 𝑆 𝑡 R² ist gewachsen. Koeffizienten sind signifikant. Residuen haben sich nicht wirklich verbessert. -> ein verbessertes Modell, aber wegen Residuen verbesserungswürdig. log⁡(𝑌 𝑡 )= 𝑡 𝑆 𝑡 𝑌 𝑡 = exp exp 𝑡 exp 𝑆 𝑡 𝑌 𝑡 =735 𝑒 0.02∗𝑡 𝑒 0.31∗ 𝑆 𝑡

18 Zeitreihenanalyse: Regressionsmodell
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 ∗ 𝑆 𝑡 ∗ 𝐸 𝑡 parametrischer Ansatz Saison als kategorielle Variable:, d.h. nicht-linearer Einfluss der Saison: log⁡(𝑌 𝑡 ) ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) R² wächst weiter. F Statistik sinkt, ist aber signifikant. Koeffizienten sind signifikant. Nur das zweite Quartal lässt sich nicht signifikant vom ersten Quartal unterscheiden. Residuen haben sich nun verbessert. -> ein sehr gutes Modell.

19 Zeitreihenanalyse: Regressionsmodell
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 ∗ 𝑆 𝑡 ∗ 𝐸 𝑡 parametrischer Ansatz log⁡(𝑌 𝑡 ) ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) Modellgleichung 𝑌 𝑡 =750 𝑒 0.02∗𝑡 𝑒 0.03∗ (𝑆 𝑡 =0,25) 𝑒 0.15∗ (𝑆 𝑡 =0,5) 𝑒 0.22∗ (𝑆 𝑡 =0,75) 𝑈𝑚𝑠𝑎𝑡𝑧= 𝑒 0.02∗𝑡 750, 𝑤𝑒𝑛𝑛 𝑄1 776, 𝑤𝑒𝑛𝑛 𝑄2 867, 𝑤𝑒𝑛𝑛 𝑄3 934, 𝑤𝑒𝑛𝑛 𝑄4

20 Zeitreihenanalyse: Regressionsmodell
Interpretation von 𝑈𝑚𝑠𝑎𝑡𝑧= 𝑒 0.02∗𝑡 750, 𝑤𝑒𝑛𝑛 𝑄1 773, 𝑤𝑒𝑛𝑛 𝑄2 871, 𝑤𝑒𝑛𝑛 𝑄3 934, 𝑤𝑒𝑛𝑛 𝑄4 Die (nicht lineare) Saisonalität kann an den Quartalskoeffizienten gut abgelesen werden. Jedes Quartal liefert einen Basisumsatz. Das Erste ist immer das Schwächste, das Vierte immer das Beste. Mit der Zeit (t) kommt es zu einer Steigerung, die im übrigen auch nicht linear ist. Da t bei 0 beginnt und exp(0) = 1 ist, lässt sich exp(0,02*t) als prozentueller Aufschlag interpretieren, der mit der Zeit größer wird. Ab dem Jahr 2023 kommt es schon zu 76% zusätzlicher Umsätze gegenüber Q4 2014

21 Zeitreihenanalyse: Autokorrelation
Ein sehr wichtiges, ja zentrales Konzept in der Zeitreihenanalyse ist die Autokorrelation. Was ist Autokorrelation? Gegenfrage: Wie würden Sie die Temperatur für morgen ohne technische Hilfsmittel prognostizieren? Antwort: Mit der Temperatur von heute. Werte von morgen sind denen von heute ähnlich. Starke Änderungen sind eher selten. Um Autokorrelation analysieren zu können, messen zu können benötigt man die sogenannte LAG Funktion.

22 Zeitreihenanalyse: Autokorrelation und LAG
Was ist die LAG Funktion? LAG – Funktion: „Lag“ Englisch für (zeitliche) Verzögerung, Zeitabstand LAG 1: Der Wert von gestern wird auf heute verschoben, der von heute auf morgen: 𝑋 𝑡 =𝐿𝑎𝑔1 𝑌 𝑡 = 𝑌 𝑡−1 Man erhält zusätzliche Daten, Zeitreihen, abgeleitet von der ursprünglichen Zeitreihe. In der Folge tut man so, als hätte man zusätzliche erklärende Variablen. Man berechnet Korrelation und Regression.

23 Zeitreihenanalyse: Autokorrelation
AC Funktion – ACF (autocorrelation function) Man kann nun zwischen der ursprünglichen Zeitreihe für Umsatz und ihren Lag‘s Korrelationen berechnen: Lag 1 zeigt einen eher schwachen Zusammenhang. Lag 4 hingegen ist sehr stark. Warum gerade 4?

24 Zeitreihenanalyse: Autokorrelation
AC Funktion – ACF (autocorrelation function) Die Autokorrelationsfunktion (ACF) zeigt die Korrelation zwischen der Zeitreihen und ihren Lag‘s. Lag 0 ist die Zeitreihe selbst und muss eine Korrelation von 1 haben. Die blaue Linie weist einen Schwellwert aus. Korrelationen darüber (oder im negativen Fall darunter) sind auffällig. Ergebnis wiederholt sich, Lag 1 ist zwar korreliert, aber Lag 4 tritt deutlicher hervor. Man beachte: Mit jedem Lag wird die Zeitreihe kürzer und die Korrelation unsicherer. Wie viele Lags kann man im Beispiel maximal sinnvoll berechnen?

25 Zeitreihenanalyse: Autoregressionsmodell
Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑌 𝑡−1 R² ist recht klein. F Statistik ist nicht signifikant. Koeffizienten ist nicht signifikant. Sehen Sie den Aufwärtstrend der Residuen? Es gibt in den Residuen ein lineares Wachstum!!! -> ein schlechtes Modell.

26 Zeitreihenanalyse: Autoregressionsmodell
Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑌 𝑡−1 + 𝑌 𝑡−4 R² deutlich gewachsen und recht groß. F Statistik ist signifikant. Koeffizienten von Lag 4 ist signifikant. Von Lag 1 ist er es nicht. Residuen haben sich verbessert. -> ein deutlich besseres Modell. Aber Lag 1 sollte entfernt werden.

27 Zeitreihenanalyse: Autoregressionsmodell
Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑌 𝑡−4 R² verändert sich kaum. F Statistik wächst und bleibt signifikant. Koeffizienten von Lag 4 ist signifikant. Residuen haben sich auch kaum geändert. -> ein gutes Modell.

28 Zeitreihenanalyse: Autoregressionsmodell
Interpretation von 𝑌 𝑡 ~ 𝑌 𝑡−4 Der Umsatz im kommenden Quartal wird mit 91% des Umsatzes des entsprechenden Vorjahresquartals geschätzt, was einem Abschlag von 9% entspricht. Zu dieser Schätzung kommt ein fixer Aufschlag von € 140 k. Die Umsätze bewegen sich derzeit um € 1000 k. 9% sind als € 90 k Abschlag. Da der fixe Aufschlag aber mit € 140 k größer ist, kommt es zu einem Wachstum. Irgendwann endet das Wachstum.

29 Zeitreihenanalyse: Autoregressionsmodell
Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑌 𝑡−4 -> ein gutes Modell. aber nicht so gut, wie unser ursprüngliches mit 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) und 𝑅 2 =0,9472. Was geschieht, wenn wir die Lags in dieses Modell aufnehmen?

30 Zeitreihenanalyse: Autoregressionsmodell
Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 )+ 𝑌 𝑡−1 +𝑌 𝑡−4 R² wächst deutlich. F Statistik sinkt und bleibt signifikant. Koeffizienten der Lags nicht signifikant Siasonalität auch geschwächt. -> Trotz Verbesserung des R² nicht signifikante Koeffizienten. Variablen sind zu entfernen.

31 Zeitreihenanalyse: Autoregressionsmodell
Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) +𝑌 𝑡−4 R² geht ein wenig zurück.. F Statistik wächst klarer Weise. Warum? Koeffizienten nun alle signifikant. Aber wie ist Lag 4 zu interpretieren? -> 62% des Quartalwertes vor einem Jahr werden abgezogen. Die Vorquartale wirken dämpfend. Zuvor hat Lag 4 zum Wachstum beigetragen. Nun dämpft es das Wachstum.

32 Zeitreihenanalyse: Autoregressionsmodell
Zum Vergleich 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) Was sind die Unterschiede? -> Alle Koeffizienten habe deutlich höhere Werte. Der Trend ist pro Quartal um €1000 höher. Der Zuschlag für drittes und viertes Quartal liegt um € höher. Die erhöhten Werte werden dann durch den Lag gedämpft. Lag 4 zeigt ein komplett anderes Verhalten als vorher!!!! Die zusätzlichen 2% Punkte in R² werden durch eine schwere Interpretierbarkeit erkauft. Nicht schön. Aber woher kommt die Verbesserung im R²?

33 Zeitreihenanalyse: Autokorrelation in den Residuen
AC Funktion – ACF (autocorrelation function) Was zeigt das ACF Diagramm? Es gibt in den Residuen des Modells 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) eine Autokorrelation und zwar bei Lag 1 und vor allem bei Lag 4. Was geschieht, wenn wir nun den Lag der Residuen 𝑒 𝑡 ins Modell nehmen?

34 Zeitreihenanalyse: Autokorrelation in den Residuen
Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) +𝑒 𝑡−1 +𝑒 𝑡−4 R² wächst wieder deutlich. F Statistik sinkt klarer Weise. Warum? Ist aber signifikant. Die Koeffizienten der Lag‘s sind aber nicht signifikant. -> Lag 1 entfernen.

35 Zeitreihenanalyse: Autokorrelation in den Residuen
Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) + 𝑒 𝑡−4 R² geht unwesentlich zurück. F Statistik wächst. Koeffizienten nun alle signifikant. -> Deutliche Modellverbesserung. Fast 97% der Varianz erklärt.

36 Zeitreihenanalyse: Regressionsmodell
Zum Vergleich 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) Was sind die Unterschiede? Residuen sind gedämpfter. Die Werte der Koeffizienten haben sich nicht dramatisch verändert. Was man nicht sieht, aber zutrifft: die Hochrechnung ist genauer und stabiler geworden. Forecasts sind verbessert.

37 Zeitreihenanalyse: Autokorrelation in den Residuen
AC Funktion – ACF (autocorrelation function) Erneut ein Blick auf das ACF Diagramm: Was zeigt es?

38 Zeitreihenanalyse: Regression und Autokorrelation
Zum Vergleich Multiplikatives Modell mit Residuen log⁡(𝑌 𝑡 ) ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) + 𝑒 𝑡−4 Ist nicht besser als das additive Modell.

39 Zeitreihenanalyse: Regression und Autokorrelation
Interpretation des Modells 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) + 𝑒 𝑡−4 Bei t = 0 startet das Modell mit € 740 k, was ungefähr der Wert von Q ist. Pro Quartal wächst der Umsatz durchschnittlich um € 15 k. Die saisonalen Schwankungen pro Quartal sind der Tabelle zu entnehmen und zeigen das bereits besprochene Muster Die Schätzung des nächsten Quartals wird um 62% des Schätzfehlers des entsprechenden Vorjahresquartals nach unten korrigiert. Das Wachstum ist zwar unendlich, aber nicht exponentiell.

40 Zeitreihenanalyse: Zusammenfassung
Was bisher geschah: Definition und Beispiele von Zeitreihen, Granularität Grafische Darstellung von Zeitreihen Zerlegung von Zeitreihen: Trend, Saisonalität und Periode Nicht - parametrische Zerlegung mit Hilfe des gleitendenden Durschnitts Parametrische Zerlegung mit Hilfe linearer Regression Autokorrelation und die Lag Funktion Zeitreihenmodell mit Hilfe von Autokorrelation und linearer Regression Wie sich Autokorrelation und parametrische Zerlegung einer Zeitreihe nicht zu einem verbesserten Modell verbinden lassen. Autokorrelation der Residuen und Verbesserung des parametrischen Zerlegungs - Modells.

41 Zeitreihenanalyse: Autoregressionsmodell
Interpretation von 𝑌 𝑡 ~ 𝑌 𝑡−4 Der Umsatz im kommenden Quartal wird mit 91% des Umsatzes des entsprechenden Vorjahresquartals geschätzt, was einem Abschlag von 9% entspricht. Zu dieser Schätzung kommt ein fixer Aufschlag von € 140 k. Die Umsätze bewegen sich derzeit um € 1000 k. 9% sind als € 90 k Abschlag. Da der fixe Aufschlag aber mit € 140 k größer ist, kommt es zu einem Wachstum. Irgendwann endet das Wachstum.

42 Zeitreihenanalyse: Regressionsmodell
Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 ∗ 𝑆 𝑡 ∗ 𝐸 𝑡 parametrischer Ansatz log⁡(𝑌 𝑡 ) ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) Modellgleichung 𝑌 𝑡 =750 𝑒 0.02∗𝑡 𝑒 0.03∗ (𝑆 𝑡 =0,25) 𝑒 0.15∗ (𝑆 𝑡 =0,5) 𝑒 0.22∗ (𝑆 𝑡 =0,75) 𝑈𝑚𝑠𝑎𝑡𝑧= 𝑒 0.02∗𝑡 750, 𝑤𝑒𝑛𝑛 𝑄1 776, 𝑤𝑒𝑛𝑛 𝑄2 867, 𝑤𝑒𝑛𝑛 𝑄3 934, 𝑤𝑒𝑛𝑛 𝑄4

43 Zeitreihenanalyse: Regression und Autokorrelation
Interpretation des Modells 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) + 𝑒 𝑡−4 Bei t = 0 startet das Modell mit € 740 k, was ungefähr der Wert von Q ist. Pro Quartal wächst der Umsatz durchschnittlich um € 15 k. Die saisonalen Schwankungen pro Quartal sind der Tabelle zu entnehmen und zeigen das bereits besprochene Muster Die Schätzung des nächsten Quartals wird um 62% des Schätzfehlers des entsprechenden Vorjahresquartals nach unten korrigiert. Das Wachstum ist zwar unendlich, aber nicht exponentiell.

44 Zeitreihenanalyse: Zusammenfassung
Wir haben drei Modelle: Additives Regressionsmodell mit autokorrelierten Residuen 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) + 𝑒 𝑡−4 Multiplikatives Regressionsmodell mit autokorrelierten Residuen 𝑌 𝑡 ~ exp 𝑡 ∗ exp⁡(𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ))∗ exp⁡( 𝑒 𝑡−4 ) Autokorrelationsmodell 𝑌 𝑡 ~ 𝑌 𝑡−4 Welches nehmen? Modell 3 scheidet aus, weil R² der anderen beiden viel höher ist. Die beiden anderen sind etwa gleich gut. Vielleicht das etwas einfachere additive Modell? Weit in die Zukunft zu prognostizieren, ist mit solchen Modellen grundsätzlich nicht ratsam. Es können Ereignisse eintreten, die das extrahierte Muster komplett verändern. Keines dieser Modelle ist ein kausales Prognosemodell. Bei Prognosen weiter in die Zukunft gilt es zu bedenken, dass das multiplikative Modell den stärkeren Zuwachs hat, ein exponentielles Wachstum.

45 Zeitreihenanalyse: Erweiterung
Weitere typische Saisonalitäten Jahressaisonalität : Granularität: mindestens Quartale / Monate / Wochen Periode: 4 / 12 / 52 Länge: mindestens 2 Jahre Beispiel: Budget und Planungszahlen Wochensaisonaltität: Granularität: Wochentage Periode: 5 bzw. 7 Länge: mindestens 2 Wochen, besser 1 Jahr Beispiel: Verkaufszahlen Tagessaisonalität: Granularität: z.B. stündlich Periode: 24 Länge: mindestens 2 Tage, besser 2 Wochen Beispiel: Anrufe Call Center, Verbrauchszahlen (z.B.: Tagesspitzen beim Energieverbrauch)

46 Zeitreihenanalyse: Erweiterung
Besondere Effekte bzw. Ausreißer Systematische Ausreißer: Feiertage Bewegliche Feiertage, im Wesentlichen Ostern und davon abhängige Einfluss auf Jahressaisonaliät, mögliche Interaktion Effekt auf Wochensaisonalität immer gleich -> Einschub Saisonalisierung Feste Feiertage Integration in Jahressaisonalität einfacher Effekt auf Wochensaisonalität unterschiedlich Unsystematische Ausreißer, besondere bzw. unvorhergesehene Ereignisse Passagieraufkommen z.B.: Vulkanausbruch Verkaufszahlen, außergewöhnliche Geschäftsschließung (z.B.: Wasserschaden) Call Center, besonderes Angebot im Verkauf, technische Probleme Stellen ein doppeltes Problem dar: Sind schwer vorherzusagen und stören daher die Prognose. Verzerren historische Daten, die zur Modellbildung benötigt werden.

47 Zeitreihenanalyse: Spezialfall Aktienkurse
Link: ChartTec.de Balken bzw. Bar-Chart Aufbau eines Balken

48 Zeitreihenanalyse: Spezialfall Aktienkurse
Link: ChartTec.de Candlestick-Chart, heute Standard für einen Börsen-Chart Aufbau eines Candles

49 Zeitreihenanalyse Formale Schreibweise einer Zeitreihe:
𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 𝑗 + 𝑆 𝑡 𝑤 + 𝐹 𝑡 𝑏𝑒𝑤 + 𝐹 𝑡 𝑓𝑖𝑥 + 𝐴 𝑡 + 𝐸 𝑡 Tageszeitreihe additiv 𝑌 𝑚 = 𝑇 𝑚 + 𝑆 𝑚 𝑗 + 𝐴 𝑚 + 𝐸 𝑚 Monatszeitreihe additiv 𝑋 𝑡 = 𝑇 𝑡 ∗ 𝑆 𝑡 𝑗 ∗ 𝑆 𝑡 𝑤 ∗ 𝐹 𝑡 𝑏𝑒𝑤 ∗ 𝐹 𝑡 𝑓𝑖𝑥 ∗ 𝐴 𝑡 ∗ 𝐸 𝑡 Tageszeitreihe multiplikativ 𝑋 𝑚 = 𝑇 𝑚 ∗ 𝑆 𝑚 𝑗 ∗ 𝐴 𝑚 ∗ 𝐸 𝑚 Monatszeitreihe multiplikativ 𝑌 𝑡 = ln⁡(𝑋 𝑡 ) durch logarithmieren einer multiplikativen Zeitreihe erhält man eine additive Zeitreihe 𝑌 𝑡 = 𝑇 𝑎𝑡+𝑏 + 𝑆 𝑀𝑜𝑛𝑎𝑡(𝑡) 𝑗 + 𝑆 𝑊𝑇(𝑡) 𝑤 + 𝐹 𝑊𝑇(𝑡) 𝑏𝑒𝑤 + 𝐹 𝑊𝑇(𝑡) 𝑓𝑖𝑥 + 𝐴 𝐿𝑖𝑠𝑡𝑒(𝑡) + 𝐸 𝑡 Tageszeitreihe additiv


Herunterladen ppt "Ökonometrie und Statistik Zeitreihenanalyse"

Ähnliche Präsentationen


Google-Anzeigen