Ökonometrie und Statistik Zeitreihenanalyse

Slides:



Advertisements
Ähnliche Präsentationen
Der Foliensatz ist unter einer Creative Commons-Lizenz lizenziert:
Advertisements

Problemlösen am Beispiel des Rückwärtsarbeitens
? Stichwortverzeichnis … zum Suchen
Stichwortverzeichnis
Heute Mathe, morgen DLR! Dr. Margrit Klitz
Einführung in Web- und Data-Science Grundlagen der Stochastik
gemeinsam.innovativ.nachhaltig.
Wissenschaftliche Methodik
3. Schafft das Internet neue Transaktionsdesign?
Umweltbezogene Entscheidungen - multidimensionale Bewertungsverfahren -
Michael Artin: Geometric Algebra
R What is this R thing, and is it worth some effort?
3 Elektrochemische Wandler
Elektro-Skateboards Teil I Grundlagen
Stichwortverzeichnis
8 Zündung/Motormanagement
Stichwortverzeichnis
2 Elektrische Maschinen in Kraftfahrzeugen
Herstellung von kristallinen Metalloxiden über die Schmelze mit einem Spiegelofen Gruppe 8: Yuki Meier, Vivien Willems, Andrea Scheidegger, Natascha Gray.
Kapitel 4 Traveling Salesman Problem (TSP)
Markus Lips März 2017 ETH-Vorlesung, 6. Sem. Agrarwissenschaft BSc Agrartechnik II.
Einführung in die Wahrscheinlichkeitsrechnung
Motoremissionen mobiler Anlagen – Stand der Technik
Lieber Leser, liebe Leserin,
Inhaltsverzeichnis In der vorliegenden Präsentation finden Sie unter anderem Antworten auf folgende Fragen… warum ist eine Gesetzesinitiative zum Betriebliches.
Einführung in Web- und Data-Science
Algorithmen und Datenstrukturen
Algorithmen und Datenstrukturen
Industrie 4.0 für die Ausbildung 4.0
Entwicklung epistemologischer Überzeugungen
Das Verdauungssystem Präsentiert von Theresa
MasterBAV© Die neue Generation BAV
Algorithmen und Datenstrukturen
Rehwild die richtige Altersbestimmung
PSG II Neuer Pflegebedürftigkeitsbegriff und dessen Begutachtung (NBA)
Medientechnische Infrastrukturen für virtuelle und lokale Lernräume
Wissensmanagement im Zeitalter von Digitaler Transformation
«Wir bereiten uns auf die Deutschlandreise vor»
GABI UND BEN.
Pflege & Finanzierung 01. Juni 2017 Dr. Sonja Unteregger
Das Arbeitgebermodell in Zeiten des
Microsoft® Office PowerPoint® 2007-Schulung
Einführung in Web- und Data-Science
Pensionsrück-stellungen Prof. Dr. Matthias Hendler
Mathematik 10.
Betriebliche Gesundheitsförderung 2
Vorlesung Wasserwirtschaft & Hydrologie I
Liebe BetrachterInnen,
Rosebrock: Geometrische Gruppen
Forschungsmethoden in der Teilchenphysik
Neue Unterrichtsmaterialien zur Teilchenphysik Philipp Lindenau CERN | Herzlich willkommen! Präsentation mit Notizen hinterlegt!
Eröffnungsveranstaltung
Aktuelle Themen aus dem KVJS-Landesjugendamt Referat 44
Roomtour - Podio für Anfänger
175 Jahre UZH Krisenkommunikation
Frauen- Männerriegen KONFERENZ
Schulung für Microsoft® Office SharePoint® 2007
Was ist eigentlich Datenschutz?
Aktuelle Aspekte des Europäischen Zivilprozessrechts
Einführung in die Benutzung des Einkaufportals der Eckelmann AG
Wer wir sind! Ihr S-Campus-Team direkt im Campus Center. Sven Deussing
Non-Standard-Datenbanken
Amand Fäßler 3. Januar 2017; RC Bregenz
Mathematik 11 Analytische Geomerie.
Non-Standard-Datenbanken
Menger-Schwamm Ausgangsfigur in Stufe 0 ist ein Würfel
Sortieren auf Multiprozessorrechnern
Wurzeln und Irrationalität nach U.Wagner, OHG Tuttlingen
Langzeitbelichtung Ein Zugang zur Kinematik in Klassenstufe 7/8
Eine kleine Einführung in das Projekt „Mausefallenauto“
 Präsentation transkript:

Ökonometrie und Statistik Zeitreihenanalyse Dr. Bertram Wassermann

Zeitreihenanalyse: Definition Kurze, übersichtliche Einführung mit Übungen gibt: Auch zu anderen Themen wie Einfach- und Mehrfachregression und Varianzanalyse. Gibt auch Einführung in statistisches Testen.

Zeitreihenanalyse: Definition Was ist eine Zeitreihe? Ein metrischer KPI wird in regelmäßigen, zeitlichen Abständen erfasst oder gemessen. Notation: 𝑋 𝑡 : 𝑥 1 , 𝑥 2 , …, 𝑥 𝑛 ist eine Folge von endlich vielen Zahlen, wobei die zeitliche Reihenfolge der Ordnung der natürlichen Zahlen entspricht. Granularität: Typische Einheiten der Messung / Erfassung Jährlich Semester / Trimester Quartale Monate Kalenderwochen Arbeitswoche Tage Stunden Minuten … KPI: einige Beispiele Umsatz, Gewinn Anzahl Studenten, Vorlesungsstunden Verkäufe Verkaufte KM (PKM), uvm. Besucher, Fahrgäste Arbeitsstunden Aktienkurse Anrufe beim Customer Service Serverzugriffe …

Zeitreihenanalyse: Definition Was ist eine Zeitreihe? Der KPI könnte auch ordinal sein oder nominal. Ist aber eher untypisch und wenn, dann informell. Und die zeitliche Reihenfolge könnte auch unregelmäßig sein: 𝑋 𝑁(𝑡) : 𝑥 𝑡1 , 𝑥 𝑡2 , …, 𝑥 𝑡𝑛 Quelle:ORF.at So etwas nennt man üblicher Weise einen Prozess. Dafür gibt es auch Theorie. Auch die zeitlichen Abstände zwischen dem Eintreten von Ereignissen ist relevant. Wir betrachten Zeitreihen mit metrischem KPI in regelmäßigen Abständen erhoben / erfasst.

Zeitreihenanalyse: Grafische Darstellung Welche Art von Skalierung hat die Zeit bei Zeitreihendaten? Sie ist metrisch und diskret. Richtige Darstellungsformen sind daher Säulendiagramm Punktdiagramm Typische und übliche Darstellung ist das Liniendiagramm mit Punkten, Polygon Eigentlich falsch, da x-Achse diskret. Verstärkt aber das Lesen der zeitlichen Entwicklung. Ohne Punkte ist allerdings nicht zu erkennen, dass die Daten eigentlich diskret sind.

Zeitreihenanalyse: Zerlegung Analyse der Zeitreihe: Welche Muster finden Sie in den Daten? Steigung, Aufwärtstrend Eine Welle, pro Jahr wiederholt sich das Muster, steigende Umsätze mit den Quartalen. Die Zeitreihe setzt sich zusammen aus Trendkomponente Saisonkomponente Residuenkomponente Man schreibt 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡

Zeitreihenanalyse: Zerlegung Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 nicht-parametrischer Ansatz Bestimme (größte) Periode p der saisonalen Komponente der Zeitreihe 𝑌 𝑡 Bilde gleitendes Mittel der Länge p: 𝐺𝑀(𝑌 𝑡 ) Extrahiere Saison und Fehler 𝑆 𝑡 + 𝐸 𝑡 = 𝑌 𝑡 − 𝐺𝑀(𝑌 𝑡 ) Extrahiere Saison 𝑆 𝑠𝑡1 = 𝑀𝑒𝑎𝑛(𝑆 𝑠𝑡1+𝑝 + 𝐸 𝑠𝑡1+𝑝 ) … 𝑆 𝑠𝑡𝑝 = 𝑀𝑒𝑎𝑛(𝑆 𝑠𝑡𝑝+𝑝 + 𝐸 𝑠𝑡𝑝+𝑝 ) Als Mittelwert aller Werte der selben Saison. Normiere Saison: Normierte Saison = Saison- Mittelwert(Saison) Bestimme die Residuen.

Zeitreihenanalyse: Zerlegung, Beispiel Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 nicht-parametrischer Ansatz Periode p = 4, Quartale Bilde gleitendes Mittel der Länge 4: 𝐺𝑀(𝑌 𝑡 )*) *) Gleitende Mittel mit gerade Periode werden korrekt etwas anders bestimmt. Um die Darstellung zu vereinfachen, wird auf eine korrekte Darstellung verzichtet. Die korrekte Vorgehensweise ist in der Literatur zu finden.

Zeitreihenanalyse: Zerlegung, Beispiel Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 nicht-parametrischer Ansatz Extrahiere Saison und Fehler 𝑆 𝑡 + 𝐸 𝑡 = 𝑌 𝑡 − 𝐺𝑀(𝑌 𝑡 )

Zeitreihenanalyse: Zerlegung, Beispiel Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 nicht-parametrischer Ansatz Extrahiere Saison als Mittelwert aller Werte der selben Saison.

Zeitreihenanalyse: Zerlegung, Beispiel Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 nicht-parametrischer Ansatz Normiere Saison Mittelwert(Saison) = 6,97

Zeitreihenanalyse: Zerlegung, Beispiel Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 nicht-parametrischer Ansatz Bestimme Residuen

Zeitreihenanalyse: Zerlegung, Beispiel Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 nicht-parametrischer Ansatz Zusammenfassung: Trend ist linear wachsend mit einem geschätzten Zuwachs von 20 k € pro Quartal. Saison ist auch wachsend, wobei die ersten beiden Quartale immer schwach und ungefähr gleich sind. Effekt ist also vermutlich nicht linear, was für eine Varianzanalyse spricht. Residuen werden mit der Zeit (und wachsendem Umsatz) größer.

Zeitreihenanalyse: Regressionsmodell Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 parametrischer Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑆 𝑡 Wahl des Modells ist von der Voranalyse abgeleitet. Die Daten werden passend hergerichtet. Datenaufbereitung: Jahr und Quartal, also t, einfach durchnummeriert Quartal mit 0, ¼, ½ und ¾ nummeriert. Konkrete Wahl ist willkürlich. Wichtig: Abstände bleiben gleich. Die Wahl der Werte hat Einfluss auf Größe der Koeffizienten.

Zeitreihenanalyse: Regressionsmodell Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 parametrischer Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑆 𝑡 R² ist sehr hoch. Lineare Abhängigkeit von Trend und von Saisonalität sehr schön zu sehen. Alle Koeffizienten sind signifikant. Residuen werden mit der Zeit (und wachsendem Umsatz) größer. -> im Grunde sehr gutes Modell, aber wegen Residuen verbesserungswürdig.

Zeitreihenanalyse: Regressionsmodell Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 ∗ 𝑆 𝑡 ∗ 𝐸 𝑡 parametrischer Ansatz Verbesserungstrick: log⁡(𝑌 𝑡 ) ~ 𝑡+ 𝑆 𝑡 was umgerechnet 𝑌 𝑡 ~ 𝑒 𝑡+ 𝑆 𝑡 = 𝑒 𝑡 ∗ 𝑒 𝑆 𝑡 ergibt. Das wird auch Multiplikatives Modell genannt.

Zeitreihenanalyse: Regressionsmodell Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 ∗ 𝑆 𝑡 ∗ 𝐸 𝑡 parametrischer Ansatz log⁡(𝑌 𝑡 ) ~ 𝑡+ 𝑆 𝑡 R² ist gewachsen. Koeffizienten sind signifikant. Residuen haben sich nicht wirklich verbessert. -> ein verbessertes Modell, aber wegen Residuen verbesserungswürdig. log⁡(𝑌 𝑡 )=6.6+0.02 𝑡+0.31 𝑆 𝑡 𝑌 𝑡 = exp 6.6 exp 0.02 𝑡 exp 0.31 𝑆 𝑡 𝑌 𝑡 =735 𝑒 0.02∗𝑡 𝑒 0.31∗ 𝑆 𝑡

Zeitreihenanalyse: Regressionsmodell Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 ∗ 𝑆 𝑡 ∗ 𝐸 𝑡 parametrischer Ansatz Saison als kategorielle Variable:, d.h. nicht-linearer Einfluss der Saison: log⁡(𝑌 𝑡 ) ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) R² wächst weiter. F Statistik sinkt, ist aber signifikant. Koeffizienten sind signifikant. Nur das zweite Quartal lässt sich nicht signifikant vom ersten Quartal unterscheiden. Residuen haben sich nun verbessert. -> ein sehr gutes Modell.

Zeitreihenanalyse: Regressionsmodell Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 ∗ 𝑆 𝑡 ∗ 𝐸 𝑡 parametrischer Ansatz log⁡(𝑌 𝑡 ) ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) Modellgleichung 𝑌 𝑡 =750 𝑒 0.02∗𝑡 𝑒 0.03∗ (𝑆 𝑡 =0,25) 𝑒 0.15∗ (𝑆 𝑡 =0,5) 𝑒 0.22∗ (𝑆 𝑡 =0,75) 𝑈𝑚𝑠𝑎𝑡𝑧= 𝑒 0.02∗𝑡 750, 𝑤𝑒𝑛𝑛 𝑄1 776, 𝑤𝑒𝑛𝑛 𝑄2 867, 𝑤𝑒𝑛𝑛 𝑄3 934, 𝑤𝑒𝑛𝑛 𝑄4

Zeitreihenanalyse: Regressionsmodell Interpretation von 𝑈𝑚𝑠𝑎𝑡𝑧= 𝑒 0.02∗𝑡 750, 𝑤𝑒𝑛𝑛 𝑄1 773, 𝑤𝑒𝑛𝑛 𝑄2 871, 𝑤𝑒𝑛𝑛 𝑄3 934, 𝑤𝑒𝑛𝑛 𝑄4 Die (nicht lineare) Saisonalität kann an den Quartalskoeffizienten gut abgelesen werden. Jedes Quartal liefert einen Basisumsatz. Das Erste ist immer das Schwächste, das Vierte immer das Beste. Mit der Zeit (t) kommt es zu einer Steigerung, die im übrigen auch nicht linear ist. Da t bei 0 beginnt und exp(0) = 1 ist, lässt sich exp(0,02*t) als prozentueller Aufschlag interpretieren, der mit der Zeit größer wird. Ab dem Jahr 2023 kommt es schon zu 76% zusätzlicher Umsätze gegenüber Q4 2014

Zeitreihenanalyse: Autokorrelation Ein sehr wichtiges, ja zentrales Konzept in der Zeitreihenanalyse ist die Autokorrelation. Was ist Autokorrelation? Gegenfrage: Wie würden Sie die Temperatur für morgen ohne technische Hilfsmittel prognostizieren? Antwort: Mit der Temperatur von heute. Werte von morgen sind denen von heute ähnlich. Starke Änderungen sind eher selten. Um Autokorrelation analysieren zu können, messen zu können benötigt man die sogenannte LAG Funktion.

Zeitreihenanalyse: Autokorrelation und LAG Was ist die LAG Funktion? LAG – Funktion: „Lag“ Englisch für (zeitliche) Verzögerung, Zeitabstand LAG 1: Der Wert von gestern wird auf heute verschoben, der von heute auf morgen: 𝑋 𝑡 =𝐿𝑎𝑔1 𝑌 𝑡 = 𝑌 𝑡−1 Man erhält zusätzliche Daten, Zeitreihen, abgeleitet von der ursprünglichen Zeitreihe. In der Folge tut man so, als hätte man zusätzliche erklärende Variablen. Man berechnet Korrelation und Regression.

Zeitreihenanalyse: Autokorrelation AC Funktion – ACF (autocorrelation function) Man kann nun zwischen der ursprünglichen Zeitreihe für Umsatz und ihren Lag‘s Korrelationen berechnen: Lag 1 zeigt einen eher schwachen Zusammenhang. Lag 4 hingegen ist sehr stark. Warum gerade 4?

Zeitreihenanalyse: Autokorrelation AC Funktion – ACF (autocorrelation function) Die Autokorrelationsfunktion (ACF) zeigt die Korrelation zwischen der Zeitreihen und ihren Lag‘s. Lag 0 ist die Zeitreihe selbst und muss eine Korrelation von 1 haben. Die blaue Linie weist einen Schwellwert aus. Korrelationen darüber (oder im negativen Fall darunter) sind auffällig. Ergebnis wiederholt sich, Lag 1 ist zwar korreliert, aber Lag 4 tritt deutlicher hervor. Man beachte: Mit jedem Lag wird die Zeitreihe kürzer und die Korrelation unsicherer. Wie viele Lags kann man im Beispiel maximal sinnvoll berechnen?

Zeitreihenanalyse: Autoregressionsmodell Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑌 𝑡−1 R² ist recht klein. F Statistik ist nicht signifikant. Koeffizienten ist nicht signifikant. Sehen Sie den Aufwärtstrend der Residuen? Es gibt in den Residuen ein lineares Wachstum!!! -> ein schlechtes Modell.

Zeitreihenanalyse: Autoregressionsmodell Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑌 𝑡−1 + 𝑌 𝑡−4 R² deutlich gewachsen und recht groß. F Statistik ist signifikant. Koeffizienten von Lag 4 ist signifikant. Von Lag 1 ist er es nicht. Residuen haben sich verbessert. -> ein deutlich besseres Modell. Aber Lag 1 sollte entfernt werden.

Zeitreihenanalyse: Autoregressionsmodell Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑌 𝑡−4 R² verändert sich kaum. F Statistik wächst und bleibt signifikant. Koeffizienten von Lag 4 ist signifikant. Residuen haben sich auch kaum geändert. -> ein gutes Modell.

Zeitreihenanalyse: Autoregressionsmodell Interpretation von 𝑌 𝑡 ~ 𝑌 𝑡−4 Der Umsatz im kommenden Quartal wird mit 91% des Umsatzes des entsprechenden Vorjahresquartals geschätzt, was einem Abschlag von 9% entspricht. Zu dieser Schätzung kommt ein fixer Aufschlag von € 140 k. Die Umsätze bewegen sich derzeit um € 1000 k. 9% sind als € 90 k Abschlag. Da der fixe Aufschlag aber mit € 140 k größer ist, kommt es zu einem Wachstum. Irgendwann endet das Wachstum.

Zeitreihenanalyse: Autoregressionsmodell Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑌 𝑡−4 -> ein gutes Modell. aber nicht so gut, wie unser ursprüngliches mit 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) und 𝑅 2 =0,9472. Was geschieht, wenn wir die Lags in dieses Modell aufnehmen?

Zeitreihenanalyse: Autoregressionsmodell Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 )+ 𝑌 𝑡−1 +𝑌 𝑡−4 R² wächst deutlich. F Statistik sinkt und bleibt signifikant. Koeffizienten der Lags nicht signifikant Siasonalität auch geschwächt. -> Trotz Verbesserung des R² nicht signifikante Koeffizienten. Variablen sind zu entfernen.

Zeitreihenanalyse: Autoregressionsmodell Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) +𝑌 𝑡−4 R² geht ein wenig zurück.. F Statistik wächst klarer Weise. Warum? Koeffizienten nun alle signifikant. Aber wie ist Lag 4 zu interpretieren? -> 62% des Quartalwertes vor einem Jahr werden abgezogen. Die Vorquartale wirken dämpfend. Zuvor hat Lag 4 zum Wachstum beigetragen. Nun dämpft es das Wachstum.

Zeitreihenanalyse: Autoregressionsmodell Zum Vergleich 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) Was sind die Unterschiede? -> Alle Koeffizienten habe deutlich höhere Werte. Der Trend ist pro Quartal um €1000 höher. Der Zuschlag für drittes und viertes Quartal liegt um €100.000 höher. Die erhöhten Werte werden dann durch den Lag gedämpft. Lag 4 zeigt ein komplett anderes Verhalten als vorher!!!! Die zusätzlichen 2% Punkte in R² werden durch eine schwere Interpretierbarkeit erkauft. Nicht schön. Aber woher kommt die Verbesserung im R²?

Zeitreihenanalyse: Autokorrelation in den Residuen AC Funktion – ACF (autocorrelation function) Was zeigt das ACF Diagramm? Es gibt in den Residuen des Modells 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) eine Autokorrelation und zwar bei Lag 1 und vor allem bei Lag 4. Was geschieht, wenn wir nun den Lag der Residuen 𝑒 𝑡 ins Modell nehmen?

Zeitreihenanalyse: Autokorrelation in den Residuen Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) +𝑒 𝑡−1 +𝑒 𝑡−4 R² wächst wieder deutlich. F Statistik sinkt klarer Weise. Warum? Ist aber signifikant. Die Koeffizienten der Lag‘s sind aber nicht signifikant. -> Lag 1 entfernen.

Zeitreihenanalyse: Autokorrelation in den Residuen Autokorrelation mit parametrischem Ansatz 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) + 𝑒 𝑡−4 R² geht unwesentlich zurück. F Statistik wächst. Koeffizienten nun alle signifikant. -> Deutliche Modellverbesserung. Fast 97% der Varianz erklärt.

Zeitreihenanalyse: Regressionsmodell Zum Vergleich 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) Was sind die Unterschiede? Residuen sind gedämpfter. Die Werte der Koeffizienten haben sich nicht dramatisch verändert. Was man nicht sieht, aber zutrifft: die Hochrechnung ist genauer und stabiler geworden. Forecasts sind verbessert.

Zeitreihenanalyse: Autokorrelation in den Residuen AC Funktion – ACF (autocorrelation function) Erneut ein Blick auf das ACF Diagramm: Was zeigt es?

Zeitreihenanalyse: Regression und Autokorrelation Zum Vergleich Multiplikatives Modell mit Residuen log⁡(𝑌 𝑡 ) ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) + 𝑒 𝑡−4 Ist nicht besser als das additive Modell.

Zeitreihenanalyse: Regression und Autokorrelation Interpretation des Modells 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) + 𝑒 𝑡−4 Bei t = 0 startet das Modell mit € 740 k, was ungefähr der Wert von Q1 2014 ist. Pro Quartal wächst der Umsatz durchschnittlich um € 15 k. Die saisonalen Schwankungen pro Quartal sind der Tabelle zu entnehmen und zeigen das bereits besprochene Muster Die Schätzung des nächsten Quartals wird um 62% des Schätzfehlers des entsprechenden Vorjahresquartals nach unten korrigiert. Das Wachstum ist zwar unendlich, aber nicht exponentiell.

Zeitreihenanalyse: Zusammenfassung Was bisher geschah: Definition und Beispiele von Zeitreihen, Granularität Grafische Darstellung von Zeitreihen Zerlegung von Zeitreihen: Trend, Saisonalität und Periode Nicht - parametrische Zerlegung mit Hilfe des gleitendenden Durschnitts Parametrische Zerlegung mit Hilfe linearer Regression Autokorrelation und die Lag Funktion Zeitreihenmodell mit Hilfe von Autokorrelation und linearer Regression Wie sich Autokorrelation und parametrische Zerlegung einer Zeitreihe nicht zu einem verbesserten Modell verbinden lassen. Autokorrelation der Residuen und Verbesserung des parametrischen Zerlegungs - Modells.

Zeitreihenanalyse: Autoregressionsmodell Interpretation von 𝑌 𝑡 ~ 𝑌 𝑡−4 Der Umsatz im kommenden Quartal wird mit 91% des Umsatzes des entsprechenden Vorjahresquartals geschätzt, was einem Abschlag von 9% entspricht. Zu dieser Schätzung kommt ein fixer Aufschlag von € 140 k. Die Umsätze bewegen sich derzeit um € 1000 k. 9% sind als € 90 k Abschlag. Da der fixe Aufschlag aber mit € 140 k größer ist, kommt es zu einem Wachstum. Irgendwann endet das Wachstum.

Zeitreihenanalyse: Regressionsmodell Zerlegung der Zeitreihe 𝑌 𝑡 = 𝑇 𝑡 ∗ 𝑆 𝑡 ∗ 𝐸 𝑡 parametrischer Ansatz log⁡(𝑌 𝑡 ) ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) Modellgleichung 𝑌 𝑡 =750 𝑒 0.02∗𝑡 𝑒 0.03∗ (𝑆 𝑡 =0,25) 𝑒 0.15∗ (𝑆 𝑡 =0,5) 𝑒 0.22∗ (𝑆 𝑡 =0,75) 𝑈𝑚𝑠𝑎𝑡𝑧= 𝑒 0.02∗𝑡 750, 𝑤𝑒𝑛𝑛 𝑄1 776, 𝑤𝑒𝑛𝑛 𝑄2 867, 𝑤𝑒𝑛𝑛 𝑄3 934, 𝑤𝑒𝑛𝑛 𝑄4

Zeitreihenanalyse: Regression und Autokorrelation Interpretation des Modells 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) + 𝑒 𝑡−4 Bei t = 0 startet das Modell mit € 740 k, was ungefähr der Wert von Q1 2014 ist. Pro Quartal wächst der Umsatz durchschnittlich um € 15 k. Die saisonalen Schwankungen pro Quartal sind der Tabelle zu entnehmen und zeigen das bereits besprochene Muster Die Schätzung des nächsten Quartals wird um 62% des Schätzfehlers des entsprechenden Vorjahresquartals nach unten korrigiert. Das Wachstum ist zwar unendlich, aber nicht exponentiell.

Zeitreihenanalyse: Zusammenfassung Wir haben drei Modelle: Additives Regressionsmodell mit autokorrelierten Residuen 𝑌 𝑡 ~ 𝑡+ 𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ) + 𝑒 𝑡−4 Multiplikatives Regressionsmodell mit autokorrelierten Residuen 𝑌 𝑡 ~ exp 𝑡 ∗ exp⁡(𝑓𝑎𝑐𝑡𝑜𝑟(𝑆 𝑡 ))∗ exp⁡( 𝑒 𝑡−4 ) Autokorrelationsmodell 𝑌 𝑡 ~ 𝑌 𝑡−4 Welches nehmen? Modell 3 scheidet aus, weil R² der anderen beiden viel höher ist. Die beiden anderen sind etwa gleich gut. Vielleicht das etwas einfachere additive Modell? Weit in die Zukunft zu prognostizieren, ist mit solchen Modellen grundsätzlich nicht ratsam. Es können Ereignisse eintreten, die das extrahierte Muster komplett verändern. Keines dieser Modelle ist ein kausales Prognosemodell. Bei Prognosen weiter in die Zukunft gilt es zu bedenken, dass das multiplikative Modell den stärkeren Zuwachs hat, ein exponentielles Wachstum.

Zeitreihenanalyse: Erweiterung Weitere typische Saisonalitäten Jahressaisonalität : Granularität: mindestens Quartale / Monate / Wochen Periode: 4 / 12 / 52 Länge: mindestens 2 Jahre Beispiel: Budget und Planungszahlen Wochensaisonaltität: Granularität: Wochentage Periode: 5 bzw. 7 Länge: mindestens 2 Wochen, besser 1 Jahr Beispiel: Verkaufszahlen Tagessaisonalität: Granularität: z.B. stündlich Periode: 24 Länge: mindestens 2 Tage, besser 2 Wochen Beispiel: Anrufe Call Center, Verbrauchszahlen (z.B.: Tagesspitzen beim Energieverbrauch)

Zeitreihenanalyse: Erweiterung Besondere Effekte bzw. Ausreißer Systematische Ausreißer: Feiertage Bewegliche Feiertage, im Wesentlichen Ostern und davon abhängige Einfluss auf Jahressaisonaliät, mögliche Interaktion Effekt auf Wochensaisonalität immer gleich -> Einschub Saisonalisierung Feste Feiertage Integration in Jahressaisonalität einfacher Effekt auf Wochensaisonalität unterschiedlich Unsystematische Ausreißer, besondere bzw. unvorhergesehene Ereignisse Passagieraufkommen z.B.: Vulkanausbruch Verkaufszahlen, außergewöhnliche Geschäftsschließung (z.B.: Wasserschaden) Call Center, besonderes Angebot im Verkauf, technische Probleme … Stellen ein doppeltes Problem dar: Sind schwer vorherzusagen und stören daher die Prognose. Verzerren historische Daten, die zur Modellbildung benötigt werden.

Zeitreihenanalyse: Spezialfall Aktienkurse Link: ChartTec.de https://www.charttec.de/html/ta_charts.php Balken bzw. Bar-Chart Aufbau eines Balken

Zeitreihenanalyse: Spezialfall Aktienkurse Link: ChartTec.de https://www.charttec.de/html/ta_charts.php Candlestick-Chart, heute Standard für einen Börsen-Chart Aufbau eines Candles

Zeitreihenanalyse Formale Schreibweise einer Zeitreihe: 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 + 𝐸 𝑡 𝑌 𝑡 = 𝑇 𝑡 + 𝑆 𝑡 𝑗 + 𝑆 𝑡 𝑤 + 𝐹 𝑡 𝑏𝑒𝑤 + 𝐹 𝑡 𝑓𝑖𝑥 + 𝐴 𝑡 + 𝐸 𝑡 Tageszeitreihe additiv 𝑌 𝑚 = 𝑇 𝑚 + 𝑆 𝑚 𝑗 + 𝐴 𝑚 + 𝐸 𝑚 Monatszeitreihe additiv 𝑋 𝑡 = 𝑇 𝑡 ∗ 𝑆 𝑡 𝑗 ∗ 𝑆 𝑡 𝑤 ∗ 𝐹 𝑡 𝑏𝑒𝑤 ∗ 𝐹 𝑡 𝑓𝑖𝑥 ∗ 𝐴 𝑡 ∗ 𝐸 𝑡 Tageszeitreihe multiplikativ 𝑋 𝑚 = 𝑇 𝑚 ∗ 𝑆 𝑚 𝑗 ∗ 𝐴 𝑚 ∗ 𝐸 𝑚 Monatszeitreihe multiplikativ 𝑌 𝑡 = ln⁡(𝑋 𝑡 ) durch logarithmieren einer multiplikativen Zeitreihe erhält man eine additive Zeitreihe 𝑌 𝑡 = 𝑇 𝑎𝑡+𝑏 + 𝑆 𝑀𝑜𝑛𝑎𝑡(𝑡) 𝑗 + 𝑆 𝑊𝑇(𝑡) 𝑤 + 𝐹 𝑊𝑇(𝑡) 𝑏𝑒𝑤 + 𝐹 𝑊𝑇(𝑡) 𝑓𝑖𝑥 + 𝐴 𝐿𝑖𝑠𝑡𝑒(𝑡) + 𝐸 𝑡 Tageszeitreihe additiv