訂閱
糾錯(cuò)
加入自媒體

Prophet:Facebook 簡(jiǎn)單高效的時(shí)間序列模型

導(dǎo)讀:

時(shí)序預(yù)測(cè)是一個(gè)很常見(jiàn)的數(shù)據(jù)科學(xué)任務(wù),可以幫助組織或個(gè)人進(jìn)行目標(biāo)規(guī)劃或者異常檢測(cè)等。

本文介紹的是 Facebook 2017 年的工作——Prophet,這是一個(gè)適用于大規(guī)模的時(shí)序預(yù)測(cè)模型。它不僅解決了時(shí)序預(yù)測(cè)的建模問(wèn)題,還解決了模型的可解釋性問(wèn)題。

此外,F(xiàn)acebook 提供了 Prophet 的開(kāi)源代碼,并且將模型封裝的非常簡(jiǎn)單且友好,極大地降低了分析人員的入門(mén)門(mén)檻,同時(shí)也提供了各種接口以便分析人員靈活地調(diào)整模型。

1 為什么有 Prophet

構(gòu)建一個(gè)高質(zhì)量的預(yù)測(cè)不是一件容易事,而在商業(yè)預(yù)測(cè)的實(shí)踐過(guò)程中通常會(huì)出現(xiàn)兩個(gè)問(wèn)題:

完全自動(dòng)的預(yù)測(cè)技術(shù)不夠靈活,過(guò)于死板;分析師通常有較高的專(zhuān)業(yè)知識(shí),但是在時(shí)序模型預(yù)測(cè)方面一無(wú)所知;

預(yù)測(cè)是一個(gè)需要大量專(zhuān)業(yè)經(jīng)驗(yàn)的任務(wù),因此,如何能夠提供一個(gè)高質(zhì)量且簡(jiǎn)單易用的預(yù)測(cè)模型成了一個(gè)亟需解決的問(wèn)題。

為此,F(xiàn)acebook 的研究員進(jìn)行了大量的研究,并提出了 Prophet 模型,該模型非常簡(jiǎn)單靈活,適用于沒(méi)有進(jìn)行過(guò)時(shí)序預(yù)測(cè)的人員,同時(shí)也提供了非常人性化的配置。

下圖展示了大規(guī)模商業(yè)分析中的循環(huán)方法,其由自動(dòng)化建模和人工干預(yù)兩部分組成:

Modeling:首先分析師會(huì)使用制定的參數(shù)對(duì)時(shí)間序列進(jìn)行建模;Foreca and Evaluation:然后由模型產(chǎn)生預(yù)測(cè)并對(duì)其進(jìn)行評(píng)估;Surface Problems:當(dāng)性能不佳時(shí)可以進(jìn)行人工干預(yù),并將問(wèn)題標(biāo)記給分析師;Visually Inspect Forecasts:分析師進(jìn)行檢查并根據(jù)反饋調(diào)整模型。

2 Prophet 預(yù)測(cè)模型

在介紹模型之前,我們先看一張圖:

這是 Facebook 的真實(shí)數(shù)據(jù)集,每一天都有一個(gè)點(diǎn),點(diǎn)的顏色按照星期進(jìn)行編碼,以展示一個(gè)星期的周期性。

從這張圖中我們可以看到:這個(gè)時(shí)間序列具有周期性 (weekly、yearly)、趨勢(shì)變化性 (Trend)、異常點(diǎn) (outliers) 和節(jié)假日效應(yīng) (holiday)。

我們可以使用時(shí)間序列分解將其分解為趨勢(shì)、季節(jié)性、節(jié)假日:

其中,g(t)建模時(shí)間序列值非周期變化的趨勢(shì)函數(shù);s(t)建模周期性變換,包括 weekly、yearly;h(t)建模不規(guī)律的假期影響;誤差項(xiàng) 表示模型不適應(yīng)的任何特殊變化;后面我們會(huì)假設(shè)這個(gè)參數(shù)服從正態(tài)分布。

這類(lèi)規(guī)范類(lèi)似于廣義可加模型 (Generalized additive model,GAM),這是一種非線(xiàn)性的回歸模型。這里 Prophet 只使用時(shí)間作為回歸因子,并用幾個(gè)線(xiàn)性和非線(xiàn)性的時(shí)間函數(shù)作為分量。

GAM 不具備 ARIMA 重要的推論優(yōu)勢(shì),但其也具備其他方面的優(yōu)勢(shì):

靈活性強(qiáng),易于分解,且在必要時(shí)也可以容納新的成分;擬合速度快,允許用戶(hù)進(jìn)行交互式探索;測(cè)量值不需要有規(guī)則的間隔,也不需要對(duì)缺失值進(jìn)行處理;參數(shù)的可解釋性強(qiáng),方便用戶(hù)更改。

接下來(lái)我們關(guān)注模型分解后的不同模塊。

1  2  3  4  下一頁(yè)>  
聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)