Nájdite si vhodné dáta. Požiadavky na dáta:
Nájdete pre ne vyhovujúci SARIMA model. Požiadavky na model: správny rád diferencovania (v dátach nemôže zostať jednotkový koreň - klasický ani sezónny), nekorelované rezíduá, stacionárny a invertovateľný model. Musí nejakým spôsobom obsahovať sezónnosť - sezónne diferencie, sezónne AR členy, sezónne MA členy (stačí hocičo z toho).
Dáta majú byť s pravidelnou sezónnosťou. Pravidelnú sezónnosť majú napríklad mesačné hodnoty teploty alebo prietoku riek, sezónne neočistené kvartálne hodnoty HDP, dáta Air-Passengers zo začiatku semestra a pod. - je to na grafe s priebehom jasne viditeľné.
Nie z balíkov astsa
a datasets
, nie
dáta použité na prednáške alebo na cvičení. Môžete použiť iné balíky,
súčasťou ktorých sú dáta s časovými radmi, príklady k učebniciam, reálne
dáta dostupné na internete a pod.
Z dát vynechajte niekoľko posledných pozorovaní (napríklad posledný rok alebo niekoľko rokov, v závislosti od dĺžky časového radu). Tieto nebudete používať pri hľadaní modelu, ale použite ich na zhodnotenie kvality predikcií.
V domácej úlohe:
Vysvetlite, čo vyjadrujú vaše dáta, uveďte ich zdroj a znázornite ich priebeh. Ak treba stabilizovať disperziu, môžete vyskúšať logaritmy dát. (1 bod)
Uveďte, koľkokrát ste dáta diferencovali klasicky a sezónne, a vysvetlite prečo. Spíšte výsledky a doplňte ich výstupmi z R-ka tak, aby sa vaše tvrdenia dali skontrolovať bez spúšťania kódu. Ukončenie diferencovania (ako aj diferencovanie bez jasného trendu) treba zdôvodniť testami, nestačí povedať “toto už vyzerá dobre”. (2 body)
Nájdite vhodný SARIMA model (požiadavky v úvode zadanie) pre vaše dáta. Zapíšte odhadnutý model, overte stacionaritu a invertovateľnosť. Váš komentár k modelu znovu doplňte výstupmi z R-ka tak, aby sa vaše tvrdenia dali skontrolovať bez spúšťania kódu. (2 body)
Spravte predikcie z vášho modelu (pre pôvodnú premennú, nie pre prípadné diferencie) a porovnajte ich so skutočnými hodnotami, ktoré ste na začiatku vynechali. (2 body)
Pre tie isté dáta použite Holt-Wintersovu metódu (keďže pri SARIMA modeloch potrebujeme konštantnú disperziu, malo by tu ísť o aditívnu sezónnosť). Uveďte získané hodnoty parametrov a spravte predikcie. Porovnajte ich so skutočnými hodnotami, ktoré ste na začiatku vynechali. (2 body)
Porovnajte predikcie z týchto dvoch prístupov medzi sebou navzájom (Považujete ich za dobré? Sú podobné alebo výrazne iné? Je niektorá výrazne lepšia?). (1 bod)
Bonus (1 bod):
Použite na výber SARIMA modelu funkciu auto.arima
z
balíka forecast
pričom
Niečo o funkcii auto.arima
bolo na prednáške: http://www.iam.fmph.uniba.sk/institute/stehlikova/cr23/prednasky/cr05_unitroot.pdf
(slidy 56-61), viac nájdete v dokumentácii:
?auto.arima
.
Odhadnite získaný model pomocou funkcie sarima
a
zhodnoťte rezíduá. Našla funkcia auto.arima
rovnaký model
ako vy manuálne? Ak nie, porovnajte výsledky tohto automaticky vybraného
modelu s vaším modelom. Zhodnoťte, či je automaticky vybraný model
podobný (alebo lepší/horší) z hľadiska rezíduí, kvality predikcií a
hodnoty BIC.