精選14篇'時(shí)間序列異常檢測'頂會論文分享!附數(shù)據(jù)集工具下載
今天來聊聊一個(gè)在量化交易、網(wǎng)絡(luò)安全檢測、自動(dòng)駕駛汽車和大型工業(yè)設(shè)備的日常維護(hù)等領(lǐng)域都有重要作用的研究主題:時(shí)間序列異常檢測。
時(shí)間序列異常檢測是一種在時(shí)間序列數(shù)據(jù)中識別和標(biāo)識與預(yù)期模式、趨勢或行為不符的異常點(diǎn)或事件的技術(shù)。鑒于它如此廣泛的應(yīng)用范圍,不難看出時(shí)序異常檢測也是當(dāng)前數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)熱門研究方向。
在最近幾年中,時(shí)序異常檢測的發(fā)展非常活躍,例如Transformers在時(shí)間序列預(yù)測中的興起,以及時(shí)間序列嵌入方法的進(jìn)步,這些都為異常檢測和分類方面帶來了新的突破。
學(xué)姐這次也幫大家整理了今年最新以及一些非常經(jīng)典的時(shí)序異常檢測論文,另外還有時(shí)序異常檢測必備的工具和數(shù)據(jù)集,需要的同學(xué)關(guān)注看這里↓
掃碼添加小享,回復(fù)“時(shí)序異常檢測”
免費(fèi)領(lǐng)取論文+數(shù)據(jù)集+工具合集

論文合集
1.AnomalyBERT: Self-Supervised Transformer for Time Series Anomaly Detection using Data Degradation Scheme
用于時(shí)間序列異常檢測的預(yù)訓(xùn)練BERT
簡述:論文介紹了一種檢測多元時(shí)間序列異常的新方法。該方法通過創(chuàng)建一種數(shù)據(jù)退化方案,將輸入數(shù)據(jù)的一部分替換為合成的異常值。然后,使用基于Transformer的架構(gòu)來識別時(shí)間上下文并檢測不自然的序列。該模型能將多元數(shù)據(jù)點(diǎn)轉(zhuǎn)換為具有相對位置偏置的時(shí)間表示,并產(chǎn)生異常分?jǐn)?shù)。這種方法在五個(gè)現(xiàn)實(shí)基準(zhǔn)測試中超過了以前的最先進(jìn)方法,顯示出強(qiáng)大的檢測能力。

2.Unsupervised Model Selection for Time-Series Anomaly Detection
時(shí)間序列異常檢測的無監(jiān)督模型選擇
簡述:論文探討了如何在沒有標(biāo)簽的情況下選擇最準(zhǔn)確的時(shí)間序列異常檢測模型。作者提出了三種無監(jiān)督指標(biāo),包括預(yù)測誤差、模型中心度和注入合成異常上的性能,并發(fā)現(xiàn)這些指標(biāo)與標(biāo)準(zhǔn)監(jiān)督異常檢測性能指標(biāo)(如F1分?jǐn)?shù))高度相關(guān)。文章進(jìn)一步將多個(gè)不完美替代指標(biāo)組合的問題形式化為一個(gè)穩(wěn)健的排名聚合問題,并提供理論支持。大規(guī)模實(shí)驗(yàn)表明,所提出的無監(jiān)督方法與基于部分標(biāo)記數(shù)據(jù)的選擇方法同樣有效。

3.DCdetector: Dual Attention Contrastive Representation Learning for Time Series Anomaly Detection
用于時(shí)間序列異常檢測的雙注意力對比表示學(xué)習(xí)
簡述:DCdetector是一種用于時(shí)間序列異常檢測的模型。它通過雙注意力機(jī)制和對比學(xué)習(xí)來學(xué)習(xí)異常樣本的表示。這種模型能夠有效地發(fā)現(xiàn)時(shí)間序列中的異常樣本,并且具有較好的性能。與其他方法相比,DCdetector能夠更好地適應(yīng)各種時(shí)間序列異常檢測任務(wù),并且可以在不同的數(shù)據(jù)集上實(shí)現(xiàn)最先進(jìn)的結(jié)果。

4.Anomaly Transformer: Time Series Anomaly Detection with Association Discrepancy
使用關(guān)聯(lián)差異進(jìn)行時(shí)間序列異常檢測
簡述:時(shí)間序列異常檢測很難,需要模型找到可分辨的標(biāo)準(zhǔn)。之前的方法學(xué)習(xí)點(diǎn)和關(guān)聯(lián),但都不完全有效。最近,Transformer模型在統(tǒng)一學(xué)習(xí)點(diǎn)和關(guān)聯(lián)方面表現(xiàn)出色。作者發(fā)現(xiàn)每個(gè)時(shí)間點(diǎn)的自注意力可以展示與整個(gè)系列的豐富關(guān)聯(lián)。關(guān)鍵發(fā)現(xiàn)是異常是稀有的,因此從異常點(diǎn)建立到整個(gè)系列的關(guān)聯(lián)很困難,所以異常主要關(guān)聯(lián)到它們相鄰的時(shí)間點(diǎn)。這導(dǎo)致了一種基于關(guān)聯(lián)的內(nèi)在標(biāo)準(zhǔn),可以明確地區(qū)分正常和異常點(diǎn)。作者提出了“異常Transformer”,它在六個(gè)基準(zhǔn)上取得了最先進(jìn)的結(jié)果。

5.TranAD: Deep Transformer Networks for Anomaly Detection in Multivariate Time Series Data
用于多變量時(shí)間序列數(shù)據(jù)異常檢測的深度變換網(wǎng)絡(luò)
簡述:論文提出了TranAD,一個(gè)基于深度轉(zhuǎn)換器網(wǎng)絡(luò)的模型,用于異常檢測和診斷。它使用注意力序列編碼器,可以快速推斷,并利用更廣泛的時(shí)序趨勢知識。TranAD還使用關(guān)注得分進(jìn)行自我調(diào)節(jié),實(shí)現(xiàn)穩(wěn)健的多模式特征提取,并通過對抗訓(xùn)練獲得穩(wěn)定性。與現(xiàn)有基線方法相比,TranAD在檢測和診斷性能方面表現(xiàn)出色,同時(shí)減少了數(shù)據(jù)和訓(xùn)練時(shí)間。

6.Multivariate Time Series Anomaly Detection and Interpretation using Hierarchical Inter-Metric and Temporal Embedding
使用分層交互式度量和時(shí)間嵌入的多變量時(shí)間序列異常檢測和解釋
簡述:異常檢測對于監(jiān)控各種實(shí)體狀態(tài)非常重要,例如制造系統(tǒng)和互聯(lián)網(wǎng)服務(wù)。這些實(shí)體通常由多變量時(shí)間序列(MTS)表示。InterFusion是一種無監(jiān)督方法,可以同時(shí)建模MTS的跨度量和時(shí)間依賴關(guān)系。它通過分層變分自編碼器學(xué)習(xí)正常模式,并使用兩個(gè)隨機(jī)潛在變量來學(xué)習(xí)低維跨度量或時(shí)間嵌入。作者還提出了一種基于MCMC的方法,以獲得合理的嵌入和重構(gòu),以解釋MTS的異常部分。

7.Adaptive Memory Networks with Self-supervisedLearning for Unsupervised Anomaly Detection
基于自監(jiān)督學(xué)習(xí)和自適應(yīng)記憶網(wǎng)絡(luò)的時(shí)間序列異常檢測方法
簡述:AMSL是一種新的方法,通過結(jié)合自監(jiān)督學(xué)習(xí)和自適應(yīng)記憶融合來提高泛化能力。它使用卷積自編碼器結(jié)構(gòu),學(xué)習(xí)一般的正常模式和豐富的特征表示。實(shí)驗(yàn)表明,與其它最先進(jìn)的方法相比,AMSL的性能得到顯著提高,特別是在最大的CAP睡眠階段檢測數(shù)據(jù)集上。此外,AMSL對輸入噪聲也更具魯棒性。

8.GRAPH-AUGMENTED NORMALIZING FLOWS FOR ANOMALY DETECTION OF MULTIPLE TIME SERIES
用于多時(shí)間序列異常檢測的圖增強(qiáng)歸一化流
簡述:論文介紹了一種新的方法,用于檢測多個(gè)時(shí)間序列中的異常。該方法使用圖增強(qiáng)的歸一化流(GANF),它是一種無監(jiān)督的異常檢測方法。這種方法假設(shè)異常值出現(xiàn)在分布的低密度區(qū)域,并使用歸一化流進(jìn)行密度估計(jì)。此外,該方法通過在組成時(shí)間序列之間使用貝葉斯網(wǎng)絡(luò)來引入因果關(guān)系的建模。這種圖增強(qiáng)的歸一化流方法能夠有效地檢測異常,并識別時(shí)間序列分布的變化。

掃碼添加小享,回復(fù)“時(shí)序異常檢測”
免費(fèi)領(lǐng)取論文+數(shù)據(jù)集+工具合集

9.Calibrated One-class Classification for Unsupervised Time Series Anomaly Detection
用于無監(jiān)督時(shí)間序列異常檢測的校準(zhǔn)單類分類
簡述:論文提出了一種新的無監(jiān)督時(shí)間序列異常檢測方法,稱為校準(zhǔn)的單類分類。這種方法通過兩種方式進(jìn)行校準(zhǔn):一是自適應(yīng)地懲罰不確定的預(yù)測,以消除異常污染的影響,并強(qiáng)調(diào)模型有信心的預(yù)測;二是區(qū)分正常樣本和本地異常示例,以模擬真實(shí)時(shí)間序列的異常行為。這種方法能夠顯著改善正常建模,并在六個(gè)真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)中表現(xiàn)出優(yōu)于其他先進(jìn)競爭對手的性能,提高了6% - 31%的F1分?jǐn)?shù)。

10.Deep Learning for Time Series Anomaly Detection: A Survey
時(shí)間序列異常檢測的深度學(xué)習(xí)
簡述:論文是關(guān)于時(shí)間序列異常檢測的深度學(xué)習(xí)綜述。時(shí)間序列異常檢測在很多領(lǐng)域都有應(yīng)用,比如制造和醫(yī)療。深度學(xué)習(xí)模型被用來檢測時(shí)間序列中的異常模式。文章提供了一個(gè)分類法,根據(jù)不同的因素將異常檢測模型分為不同類別,并描述了每個(gè)類別的基本異常檢測技術(shù)、優(yōu)點(diǎn)和限制。最后,文章總結(jié)了采用深度異常檢測模型時(shí)面臨的開放問題和挑戰(zhàn)。

11.Revisiting Time Series Outlier Detection:Definitions and Benchmarks
重訪時(shí)間序列異常檢測:定義和基準(zhǔn)
簡述:論文重新審視了時(shí)間序列異常檢測,提出了新的分類法,將異常點(diǎn)分為點(diǎn)和模式兩類,并生成了相應(yīng)的合成數(shù)據(jù)集,以對現(xiàn)有算法進(jìn)行基準(zhǔn)測試。結(jié)果發(fā)現(xiàn),一些經(jīng)典算法在某些情況下可以比最近的深度學(xué)習(xí)算法表現(xiàn)更好。
12.Graph Neural Network-Based Anomaly Detection in Multivariate Time Series
基于圖神經(jīng)網(wǎng)絡(luò)的多元時(shí)間序列異常檢測
簡述:論文介紹了一種基于圖神經(jīng)網(wǎng)絡(luò)和結(jié)構(gòu)學(xué)習(xí)方法的高維時(shí)間序列異常檢測方法。它能夠捕捉傳感器之間的復(fù)雜關(guān)系,并使用注意力權(quán)重解釋檢測到的異常。實(shí)驗(yàn)表明,該方法比現(xiàn)有方法更準(zhǔn)確,可以更準(zhǔn)確地檢測異常,并準(zhǔn)確捕捉傳感器之間的相關(guān)性。此外,它還可以讓用戶推斷檢測到的異常的根本原因。

13.Time-Series Anomaly Detection Service at Microsoft
微軟的時(shí)間序列異常檢測服務(wù)
簡述:微軟開發(fā)了一個(gè)時(shí)間序列異常檢測服務(wù),幫助大公司實(shí)時(shí)監(jiān)控應(yīng)用程序和服務(wù)的各種指標(biāo),如頁面瀏覽量和收入。該服務(wù)由數(shù)據(jù)攝取、實(shí)驗(yàn)平臺和在線計(jì)算三個(gè)主要模塊組成,采用基于譜殘差和卷積神經(jīng)網(wǎng)絡(luò)的新型算法,旨在準(zhǔn)確、高效和通用。這項(xiàng)工作首次嘗試將SR模型應(yīng)用于時(shí)間序列異常檢測,并將SR和CNN相結(jié)合以提高性能。

14.Outlier Detection for Temporal Data: A Survey
時(shí)間數(shù)據(jù)的異常檢測:綜述
簡述:論文是對時(shí)間序列數(shù)據(jù)異常檢測的綜述,介紹了不同類型的異常定義、新技術(shù)以及特定定義和技術(shù)被廣泛使用的應(yīng)用場景。由于硬件和軟件技術(shù)的進(jìn)步,各種形式的時(shí)間數(shù)據(jù)采集和管理機(jī)制得以實(shí)現(xiàn),導(dǎo)致不同類型的數(shù)據(jù)集增長,例如數(shù)據(jù)流、時(shí)空數(shù)據(jù)、分布式流、時(shí)間網(wǎng)絡(luò)和時(shí)間序列數(shù)據(jù)。因此,需要對時(shí)間數(shù)據(jù)集上的異常檢測進(jìn)行有組織且詳細(xì)的研究。本文為各種形式時(shí)間數(shù)據(jù)的異常檢測提供了一個(gè)全面且結(jié)構(gòu)化的概述。

工具和數(shù)據(jù)集
TODS:TODS是一個(gè)用于多元時(shí)間序列數(shù)據(jù)上的離群點(diǎn)檢測的全棧自動(dòng)化機(jī)器學(xué)習(xí)系統(tǒng)。
skyline:Skyline是一個(gè)實(shí)時(shí)異常檢測系統(tǒng)。
banpei:Banpei是異常檢測的Python包。
telemanom:使用LSTM在多元時(shí)間序列數(shù)據(jù)中檢測異常的框架。
DeepADoTS:用于多狀態(tài)前沿深度學(xué)習(xí)方法的時(shí)間序列數(shù)據(jù)異常檢測基準(zhǔn)管道。
NAB:Numenta異?;鶞?zhǔn):NAB是為評估流式、實(shí)時(shí)應(yīng)用程序中的異常檢測算法而設(shè)計(jì)的新穎基準(zhǔn)。
CueObserve:SQL數(shù)據(jù)倉庫和數(shù)據(jù)庫上的異常檢測。
Chaos Genius:ML驅(qū)動(dòng)的分析引擎,用于異常/異常檢測和根本原因分析。
CRAN任務(wù)視圖:用R進(jìn)行異常檢測:這個(gè)CRAN任務(wù)視圖包含一個(gè)可以用于R的異常檢測的包列表。
AnomalyDetection:AnomalyDetection是一個(gè)開源的R包,用于從統(tǒng)計(jì)角度來看,在季節(jié)性和潛在趨勢存在的情況下檢測異常。
anomalize:'anomalize'包為檢測數(shù)據(jù)中的異常提供了一種“整潔”的工作流。
掃碼添加小享,回復(fù)“時(shí)序異常檢測”
免費(fèi)領(lǐng)取論文+數(shù)據(jù)集+工具合集
