時(shí)間序列預(yù)測(cè)對(duì)不少公司來(lái)說(shuō)是一個(gè)難題的創(chuàng)新?
2021-08-16
今年3月發(fā)布的時(shí)候用過(guò),最近才想起來(lái)看...
首先,它是一個(gè)工業(yè)級(jí)的應(yīng)用,在時(shí)間序列預(yù)測(cè)的模型上不是一個(gè)很大的創(chuàng)新。
我記得今年參加貓眼電影票房預(yù)測(cè)的內(nèi)部分享時(shí),我坐在一個(gè)外賣(mài)PM旁邊。最后,對(duì)方問(wèn)我有沒(méi)有辦法預(yù)測(cè)外賣(mài)的訂單量。當(dāng)時(shí)想了想,比如Holt- ,或者deep LSTM,好像沒(méi)那么容易解釋。
時(shí)間序列預(yù)測(cè)對(duì)大多數(shù)公司都有必要的需求,例如電子商務(wù)預(yù)測(cè)GMV,外賣(mài)O2O預(yù)測(cè)量波動(dòng)以促進(jìn)容量分配,酒店預(yù)測(cè)客房和夜間量以調(diào)整定價(jià)和銷(xiāo)售等等。但總的來(lái)說(shuō),時(shí)間序列預(yù)測(cè)對(duì)很多公司來(lái)說(shuō)都是一個(gè)難題。主要原因是時(shí)間序列預(yù)測(cè)本身除了是玄學(xué)(fog)之外,還需要分析師兼具深厚的專(zhuān)業(yè)領(lǐng)域知識(shí)()和時(shí)間序列建模的統(tǒng)計(jì)知識(shí)。此外,時(shí)間序列模型的調(diào)優(yōu)也是一項(xiàng)相對(duì)復(fù)雜繁瑣的工作。
就是這種背景下的產(chǎn)品。時(shí)間序列建模的一些常用流程和參數(shù),用于讓不懂統(tǒng)計(jì)學(xué)的業(yè)務(wù)分析人員能夠快速構(gòu)建出滿足自己需求的相對(duì)實(shí)用的模型。
許多業(yè)務(wù)活動(dòng)都有特定的時(shí)間依賴(lài)模式。作者以上述用戶創(chuàng)建的“事件”()為例:
可以看到用戶創(chuàng)建的事件數(shù)量具有明顯的時(shí)間序列特征:多個(gè)周期性、趨勢(shì)、假期效應(yīng)和一些異常值。
然后作者使用了R包中的幾種常用的時(shí)間序列預(yù)測(cè)技術(shù)(指數(shù)平滑等)來(lái)建模,效果很恐怖:
圖1是,圖2是指數(shù)平滑,圖3是,圖4是。
模型結(jié)構(gòu)
本質(zhì)是一個(gè)加法模型,基本形式如下:
哪里
這是一個(gè)趨勢(shì)項(xiàng)目,
是句號(hào)stan概率編程工具,
這是一個(gè)節(jié)日項(xiàng)目,
是誤差項(xiàng),服從正態(tài)分布。
趨勢(shì)模型
兩個(gè)趨勢(shì)模型用于
:飽和增長(zhǎng)模型()和分段線性模型()。兩種模型都包含不同程度的假設(shè)和一些調(diào)整平滑度的參數(shù),并通過(guò)選擇變化點(diǎn)來(lái)預(yù)測(cè)趨勢(shì)變化()。具體推導(dǎo)不寫(xiě),只寫(xiě)最終形式:
:
:
時(shí)期模型
使用傅里葉級(jí)數(shù)()建立周期模型:
N的調(diào)整起到了低通濾波(low-pass)的作用。筆者表示,對(duì)于年周期和周周期,分別選擇N為10和3,效果更好。
假期和緊急情況模型
節(jié)假日需要用戶提前指定stan概率編程工具,每個(gè)節(jié)假日包括前后幾天。模型的形式如下(感覺(jué)像虛擬變量):
模型性能
還是用上面的例子,作者給出了模型擬合和預(yù)測(cè)能力:
似乎比之前用R做的效果好很多,而且不需要用戶有很強(qiáng)的統(tǒng)計(jì)背景就可以輕松建模。
同時(shí)支持將模型分解為單獨(dú)的組件,實(shí)現(xiàn)簡(jiǎn)單,只需要調(diào)用一行代碼nts:
適用范圍
顯然,它只適用于具有明顯內(nèi)部規(guī)律(或模式)的商業(yè)行為數(shù)據(jù)。
雖然日常數(shù)據(jù)系列通常用于官方案例,但也支持更短的時(shí)間段,例如小時(shí)數(shù)據(jù)。
但是對(duì)于沒(méi)有明顯趨勢(shì)和周期性的時(shí)間序列,預(yù)測(cè)是不合適的。比如有同學(xué)曾經(jīng)預(yù)測(cè)滬深300...更不用說(shuō)有效市場(chǎng)假說(shuō)(EMH),它否定了歷史數(shù)據(jù)擬合未來(lái)價(jià)格的可能性。即使市場(chǎng)有規(guī)律,也不能用一般模型簡(jiǎn)單地線性分解。進(jìn)入趨勢(shì)和周期。
我自己首先嘗試根據(jù)內(nèi)部歷史數(shù)據(jù)對(duì)公司風(fēng)險(xiǎn)控制的潛在損失做一個(gè)簡(jiǎn)單的預(yù)測(cè),但顯然沒(méi)有證據(jù)可以解釋過(guò)去的序列特征(如風(fēng)險(xiǎn)集中度、外部環(huán)境影響、公司級(jí)合并等)會(huì)在2017年重演。所以充其量只是用來(lái)寫(xiě)周報(bào),為2017年的風(fēng)控預(yù)算做點(diǎn)小貢獻(xiàn)...
總結(jié)
是一個(gè)比較好用的預(yù)測(cè)工具,特別適合像我這樣持有ets和auto的人。他們懶得自動(dòng)確定順序和選擇模型(逃……
對(duì)業(yè)務(wù)分析師非常友好,因?yàn)樵砗芎?jiǎn)單,而且很容易上手R和。
通常可以給出很好的預(yù)測(cè)結(jié)果。比如我對(duì)某些業(yè)務(wù)條線的交易數(shù)據(jù)進(jìn)行了預(yù)測(cè),發(fā)現(xiàn)大部分都可以,“春節(jié)效應(yīng)”等中國(guó)特色也能更準(zhǔn)確。