Uveďte jeden príklad stacionárneho AR(4) procesu s nenulovou strednou hodnotou a jeden príklad nestacionárneho AR(4) procesu. V texte domácej úlohy pre každý z procesov uveďte:
Predpis pre zvolený proces v tvare \(x_t = \delta + \alpha_1x_{t−1} + \alpha_2x_{t−2} + \alpha_3x_{t−3} + \alpha_4x_{t−4} + u_t\) a odpovede na otázky: Korene akého polynómu počítame, aby sme zistili stacionaritu? Ako musia výjsť, aby bol proces stacionárny? Čo vyšlo?
Grafické znázornenie koreňov v komplexnej rovine spolu s jednotkovou kružnicou.
Pre stacionárny proces naviac:
V tomto príklade budete hľadať AR model pre prvé diferencie úrokových mier a predikovať úrokové miery. Pracovať budete s reálnymi mesačnými dátami z Európskej centrálnej banky, ktoré sú dostupné na webe: https://data.ecb.europa.eu/data/data-categories/financial-markets-and-interest-rates/interest-rate-statistics-convergence-purposes/long-term-interest-rates. Pre zjednodušenie som na stránke k predmetu uložila očistené dáta v csv formáte. Môžete pracovať priamo s týmito dátami, ktoré do R-ka načítate príkazom:
data <- read.csv("https://anna-hlubinova.github.io/ECB_data_upravene.csv")
Vyberte si jeden zo štátov, pre ktorý máme v dátach dostupné úrokové miery, s týmito podmienkami:
Každý, resp. každá dvojica pracuje s inými dátami. Rezervácia dát prebieha v tabuľke https://bit.ly/3zcqIAf v hárku DÚ 2.
Časť A: Príprava a zobrazenie dát (1 bod)
Spravte z vašich dát časový rad, ktorý začína v januári 2001 (alebo neskôr, podľa dostupnosti dát pre vami vybraný štát) a končí v decembri 2021. S výnimkou už uvedeného Estónska, počet dostupných dát však nie je výrazne malý. Napíšte časový rozsah dát, s ktorými pracujete. Zobrazte časový priebeh úrokových mier a ich diferencií.
Časť B: AR modely (3 body)
Pre diferencie úrokových mier odhadnite AR modely rádu 0 (teda model
je konštanta plus biely šum - v R-ku sa dá odhadovať ako
sarima(data, 0, k, 0)
), 1, 2, 3, 4, 5. Odhadujte ich tak,
aby ste pomocou týchto modelov mohli predikovať úrokové miery (nie ich
diferencie).
Spravte aj tabuľku, kde v riadkoch budú jednotlivé modely a v stĺpcoch
Za ”dobrý model“ budeme považovať taký, pre ktorý sú p-hodnoty Ljung-Boxovho testu pre všetky počty korelácií od minimálneho po 24 väčšie ako 0,05. Ktoré modely vyšli ako dobré? (Požiadavka na dáta zo začiatku zadania sa vzťahuje na to, že aspoň jeden z týchto modelov výjde ako dobrý.)
Časť C: Predikcie (2 body)
Vyberte z dobrých modelov z predchádzajúcej časti ten, ktorý má najnižšiu hodnotu Bayesovho informačného kritéria. Spravte pre roky 2022 a 2023 predikcie úrokových mier (nie diferencií) pomocou tohto modelu.
Zakreslite do jedného grafu farebne odlíšené: priebeh dát, z ktorých sa odhadoval model (prípadne po vynechaní nejakého vhodného začiatku dát, aby bola časť s predikciami dobre viditeľná), predikované úrokové miery, intervaly spoľahlivosti pre predikcie (+/- jedna a dve štandardné odchýlky) a skutočné hodnoty úrokových mier.
Za vizuálne atraktívne porovanie môžete získať bonusový 1
bod :). (Môžete použiť napríklad funkcie autoplot
a autolayer
, doplniť dáta do výstupu zo
sarima.for
pomocou príkazov lines
,
points
a pod. alebo použiť vlastný spôsob. Pridajte tiež
nadpis grafu, upravte označenia osí, pridajte legendu atď.)
Okomentujte získané výsledky, pričom zodpovieťe na otázky typu: Sú hodnoty systematicky vyššie alebo nižšie ako predikcie? Zmestia sa do intervalov spoľahlivosti? Ako by ste vysvetlili rozdiely? a pod. Na záver model zhodnoťte. Považujete ho za dobrý? Prečo?