PP-TS基于啟發(fā)式搜索和集成方法的時序預(yù)測模型,使預(yù)測更加準(zhǔn)確
時間序列數(shù)據(jù)在各行業(yè)和領(lǐng)域中無處不在,如物聯(lián)網(wǎng)傳感器的測量結(jié)果、每小時的銷售額業(yè)績、金融領(lǐng)域的股票價格等等,都是時間序列數(shù)據(jù)的例子。時間序列預(yù)測就是運(yùn)用歷史的多維數(shù)據(jù)進(jìn)行統(tǒng)計分析,推測出事物未來的發(fā)展趨勢。
為加快企業(yè)智能化轉(zhuǎn)型進(jìn)程,降低時序技術(shù)應(yīng)用門檻,飛槳持續(xù)進(jìn)行產(chǎn)品技術(shù)打磨,推出了基于啟發(fā)式搜索和集成學(xué)習(xí)的高精度時序模型PP-TS,在電力場景數(shù)據(jù)集上經(jīng)過驗(yàn)證,精度提升超20%。
PP-TS今天正式上線飛槳AI套件PaddleX!源碼全部開放!您可以在AI Studio(星河社區(qū))云端或者PaddleX本地端盡情探索!嘗試結(jié)合到真實(shí)的業(yè)務(wù)場景中去!在工具箱模式中,您只需提供一個場景下的歷史數(shù)據(jù),PP-TS就能為您準(zhǔn)確預(yù)測出該場景下未來一段時間內(nèi)的數(shù)據(jù)情況。

數(shù)據(jù)


除PP-TS外,飛槳也提供了8種業(yè)界領(lǐng)先的時序預(yù)測方法,即TimesNet, TiDE, PatchTST, DLinear, RLinear, NLinear, Nonstationary Transformer和XGBoost以便您對比使用。
PP-TS核心思想
基于集成方法,相較于傳統(tǒng)時序預(yù)測,PP-TS預(yù)測更加準(zhǔn)確
隨著5G時代的到來,企業(yè)逐步進(jìn)入數(shù)字化轉(zhuǎn)型新階段,面臨越來越多復(fù)雜時間序列預(yù)測場景,如設(shè)備剩余壽命預(yù)測、電力負(fù)荷預(yù)測等。在復(fù)雜時序預(yù)測場景下,長時序、多變量、非平穩(wěn)等特性嚴(yán)重影響模型預(yù)測的精度,對時序預(yù)測任務(wù)提出了更高的要求。因此我們采用集成方法,通過對多個單預(yù)測模型的選擇和融合,從而達(dá)到更佳的預(yù)測表現(xiàn)。
在電力場景下,PP-TS的準(zhǔn)確度優(yōu)于傳統(tǒng)模型,預(yù)測誤差平均降低30%


通過啟發(fā)搜索,降低搜索次數(shù)
不同單模型具有不同的能力,如Non-Stationary Transformer針對數(shù)據(jù)非平穩(wěn)場景進(jìn)行優(yōu)化,TimesNet通過多周期分解具有更強(qiáng)的表達(dá)能力??梢?,不同的算法組合集成會產(chǎn)生不同的預(yù)測表現(xiàn),那么選擇什么模型能夠達(dá)到最佳效果,在選擇模型組合的過程中,又如何提高選擇效率,這些便是要重點(diǎn)關(guān)注和解決的問題。因此我們提出了PP-TS,通過啟發(fā)式搜索選擇模型集成,降低選擇模型組合次數(shù),比如:在8個基礎(chǔ)單模型的情況下,每個模型都有選擇和不被選擇兩種情況,總的集成組合有2^8種,通過啟發(fā)搜索,能夠?qū)⑺阉鞯拇螖?shù)壓縮到30次左右,同時保證了集成的模型能夠取得最佳精度。
PP-TS關(guān)鍵技術(shù)點(diǎn)解讀
能力更強(qiáng)的PP-TS,整體的技術(shù)框架圖,如下圖所示:

PP-TS主要從三個角度進(jìn)行了深入探索,主要包括:
基礎(chǔ)單模型:深度模型一般擬合能力強(qiáng),Transformer-based方法善于捕捉長期依賴,而機(jī)器學(xué)習(xí)方法具有更好的可解釋性,PP-TS選擇了前沿深度模型和傳統(tǒng)方法的結(jié)合,包含TimesNet, TiDE, PatchTST, DLinear, RLinear, NLinear, Nonstationary Transformer和XGBoost。
啟發(fā)式搜索:將單模型是否被選擇建模成0/1問題,通過遺傳算法,對選擇的組合進(jìn)行精度評估,通過選擇交叉變異進(jìn)化,篩選最優(yōu)組合。
模型集成:將被選擇的模型進(jìn)行集成,結(jié)果融合,得到精度最佳的方法。
如何定制個性化的PP-TS
在真實(shí)業(yè)務(wù)中,一般不建議直接使用通用版的PP-TS,而是需要針對業(yè)務(wù)場景中的數(shù)據(jù)類型進(jìn)行專門的優(yōu)化適配,以達(dá)到足夠高的精度和穩(wěn)定性,滿足真實(shí)業(yè)務(wù)需求。那么,如何打造個性化的PP-TS呢?下面讓我們一一道來。
創(chuàng)建PP-TS模型產(chǎn)線
飛槳AI套件PaddleX已上線AI Studio(星河社區(qū)),目前的入口在模型庫,大家可以在這里找到PP-TS,閱讀其介紹文檔,并最終創(chuàng)建屬于你自己的PP-TS模型產(chǎn)線。
AI Studio(星河社區(qū))模型庫鏈接如下:https://aistudio.baidu.com/aistudio/modelsoverview?supportPaddlex=true&sortBy=weight
準(zhǔn)備評估數(shù)據(jù)與效果驗(yàn)證
為了客觀地評價PP-TS的效果,建議大家從業(yè)務(wù)場景中準(zhǔn)備一定量的評估數(shù)據(jù)進(jìn)行定量的綜合評價。例如,可以準(zhǔn)備過去3個月的行業(yè)數(shù)據(jù),根據(jù)業(yè)務(wù)需求標(biāo)注所關(guān)注的字段及其真值。
在對通用的PP-TS效果進(jìn)行評估之后,其結(jié)果可以作為baseline指導(dǎo)后續(xù)針對業(yè)務(wù)場景的優(yōu)化工作。
One more thing,未來在飛槳AI套件PaddleX,大家不僅可以開發(fā)自己的模型,還可以聯(lián)創(chuàng)貢獻(xiàn),和平臺收益共享!
聯(lián)創(chuàng)模式不僅可以技術(shù)變現(xiàn),還可以讓個人開發(fā)者收獲滿滿的成就感,為企業(yè)開發(fā)者吸引流量和關(guān)注,真可謂好事成雙!而且,有了大量的用戶,就能夠收集到有價值的反饋,促進(jìn)貢獻(xiàn)者進(jìn)一步優(yōu)化模型,從而吸引更多的用戶,可謂雙螺旋上升~
為了保護(hù)貢獻(xiàn)者的知識產(chǎn)權(quán),我們會提供完善的加密鑒權(quán)機(jī)制,各位貢獻(xiàn)者只需要按照我們的文檔接入加密鑒權(quán)能力,就可以放心地貢獻(xiàn)模型啦!關(guān)于聯(lián)創(chuàng)的更多細(xì)節(jié),敬請關(guān)注飛槳AI套件PaddleX后續(xù)更新!
最后,再次邀請大家進(jìn)入PaddleX用戶交流群~共創(chuàng)繁榮AI技術(shù)生態(tài)~
您可在飛槳PaddlePaddle公眾號查看相關(guān)推文,微信添加運(yùn)營同學(xué),并回復(fù)【PaddleX】,運(yùn)營同學(xué)會邀請您加入官方交流群,先人一步體驗(yàn)PaddleX本地端,獲得更高效的問題答疑!
飛槳AI套件PaddleX中的PP-TS
https://aistudio.baidu.com/modelsdetail?modelId=339
PP-TS GitHub
https://github.com/PaddlePaddle/PaddleTS