Tuleviku prognoosimine R-forecasti mudeliga
Allikas: Äri-IT Kevad 2022
Autor: Arvo Sarapuu, BCS Itera ärianalüüsi konsultant
Prognooside tegemine on kahtlemata ärianalüüsi kõrgeim pilotaaž. Aga see tasub vaeva, sest tänu masinõppele ja tehisintellektile on selle tööriistad muutunud väga täpseteks.
Ärianalüüsi üks kõige keerukam ja väärtuslikum tase on prognoos, sellest veel samm edasi on juba tegevuste soovitamine. Nende tasemete keerukust iseloomustab ka fakt, nende puhul on räägitakse juba ka masinõppest ja tehisintellektist.
R on programmeerimiskeel, mida kasutatakse andmeanalüüsiks ning üks tööriist R-portfellis on forecast. Kõige populaarsemaks meetodiks on ehk aegridade prognoosimise meetod (time series forecasting), mis analüüsib süstemaatiliselt ja järjepidevalt kogutud andmeid.
Kõik andmed, millel on ajaline väärtus, ei ole aga veel ennustust määrav aegrida, vaid tuleks arvestada ainult nende andmetega, mis on kogutud regulaarse ning jätkuva intervalliga.
Näiteid aegridade prognoosimise rakendustest igapäevases äris:
- Aegridade prognoosi kasutatakse aktsiahindade puhul, et prognoosimaks iga päeva aktsia sulgemishinda.
- Rahavoogude prognoosimine.
- Jaekaubandusettevõtted kasutavad aegridade prognoosi toodete müügi ja varude prognoosimiseks.
- Võimaldab prognoosida ilma.
- Võimaldab prognoosida elanike arvu ning selle muutumist eri piirkondades.
Aegridade prognoosimise komponendid
Selleks et kasutada aegridade prognoosimist, tuleb aru saada, millist ajalist mustrit andmed järgivad:
- Trend – toob välja andmete pikaajalise liikumise ajas.
- Tasand – määrab ära andmete baastaseme eeldusel, et need liiguvad ajas sirgjooneliselt.
- Hooajalisus – esindab lühiajalist mustrit, mis esineb kindlal ajaperioodil ning kordub reeglipäraselt määramata ajani.
- Müra – andmed, mis tekivad ebareeglipäraselt, on juhusliku tekkega või põhjustatud mingist ainulaadsest sündmusest. Sellised kõrvalekalded ei ole prognoositavad, ei sobi mudelisse ega ka prognoosimudelite algandmeteks.
Aegridade prognoosimiseks on mitu mudelit, millest kõige populaarsem on ARIMA mudel ehk autoregressiivne integreeritud liikuv keskmine (autoregressive integrated moving average). See on kombinatsioon autoregressiivsest (AR) ning liikuva keskmise (MA) mudelist, kus AR mudeli prognoos vastab muutuja varasemate väärtuste lineaarsele kombinatsioonile, MA mudeli prognoos vastab varasemate prognoosivigade lineaarsele kombinatsioonile ning I tähistab andmeväärtusi, mis on asendatud praeguste ja varasemate väärtuste erinevusega.
ARIMA aegridade prognoosi mudel:
- võtab ajaloolised andmed,
- lõhestab need andmed ajaliste mustrite näol,
- kaardistab need mustrid ning määrab ära nende sagedased punktid,
- arvutab läbi erinevad kombinatsioonid, kuidas näitajad võivad jaguneda,
- kombineerib andmed ühte mudelisse, prognoosimaks järgmisi ajaperioode,
- toob välja veaprotsendi, et määrata ära prognoosi usaldusväärsus.
Näide siin all toob välja R-forecasti eelised teiste prognoosimudelite ees. Võtame Statistikaameti andmetel Eesti SKP ajaloolised andmed, loome prognoosi juba realiseerunud andmete kohta ja võrdleme seda realiseerunud faktiga. Kasutades aegridu alates 1995. aastast, arvutame prognoosi näiteks 2019. aasta jaoks. Andmed on esitatud kvartaalselt.
Kui võrrelda koostatud prognoosi 2019. aasta tegelike numbritega, näeme R-forecast ARIMA mudeli suurt täpsust. Ja kui seda võrrelda Excelis tavapärase liikuva keskmise mudeliga (Moving Average), on tulemus tunduvalt täpsem.
Tänu mudeli täpsusele on see hea tööriist teie ärianalüüsis. Kuna R-forecastil puudub oma graafiline kasutajakeskkond, on siin võimalik kasutada Power BId, mis suudab hallata R-pakette. Power BI on hea abivahend, et visualiseerida R-forecasti mudeleid, tuleb vaid vastavad aegread sisse importida ning käivitada kohandatud R-forecasti skript. Kohandamisel tuleb näiteks määrata andmete tsüklilisus (hooajalisus), aegrea ulatus ja prognoosi oodatav hälbe suurus.
Kokkuvõtteks: kasutades Power BI keskkonnas R-forecasti mudelit, on võimalik kerge vaevaga täiendada oma igapäevaseid numbrilaudu, lisades sinna enda jaoks oluliste näitajate prognoose.
Kui tunnete lähedat huvi R-forecasti vastu, siis kirjutage meile itera@itera.ee, märkides teemaks: ärianalüüs.