論文解讀丨CIKM'22 MARINA:An MLP-Attention Model for Multivariate Time-Series Analysis

来源:https://www.cnblogs.com/huaweiyun/archive/2022/10/27/16832361.html
-Advertisement-
Play Games

摘要:華為雲資料庫創新Lab在論文《MARINA: An MLP-Attention Model for Multivariate Time-Series Analysis》中提出了華為自研的自回歸時序神經網路模型,可用於時序數據的預測以及異常檢測。 本文分享自華為雲社區《CIKM'22 MARIN ...


摘要:華為雲資料庫創新Lab在論文《MARINA: An MLP-Attention Model for Multivariate Time-Series Analysis》中提出了華為自研的自回歸時序神經網路模型,可用於時序數據的預測以及異常檢測。

本文分享自華為雲社區《CIKM'22 MARINA論文解讀》,作者: 雲資料庫創新Lab 。

華為雲資料庫創新Lab在論文《MARINA: An MLP-Attention Model for Multivariate Time-Series Analysis》中提出了華為自研的自回歸時序神經網路模型,可用於時序數據的預測以及異常檢測。本文發表在CIKM'22上,CIKM會議是由美國電腦協會(ACM)組織的、數據挖掘領域的頂級國際學術會議,該會議與2022年10月17日到21日在美國佐治亞州亞特蘭大召開。

論文鏈接:https://dl.acm.org/doi/pdf/10.1145/3511808.3557386

背景

近年來,隨著物聯網(IoT)以及智能運維(AIOps)等新興業務的興起,時序數據在數據分析領域逐漸成為了一種主要的數據類型。在IoT場景,一個系統的各個組件中會實時產生監控時序數據。例如工廠鍋爐的壓力,溫度感測器都會實時上傳對應的壓力溫度數據,飛機的高度,速度感測器也會記錄相應的時序數據。同時在AIOps場景,一個雲服務集群也會實時上傳虛擬機的CPU, MEM, disk usage等關鍵指標作為系統健康度,系統負載的評價標準。

一般來說時序數據具有以下兩個特點:體量巨大,信息密度低。以雲系統監控為例,一臺虛擬機的指標檢測數量一般在幾十的數量級,一個region的雲監控時間線上報量可以達到上億的級別。一星期的時序數據存儲量就可以超過10TB。另一方面,絕大部分雲監控數據都是穩定不變或者是小範圍變化的,只有極少數據是大範圍波動,甚至有異常的。因此從海量的時序數據中發掘有意義的信息是非常巨大的挑戰。

鑒於時序數據的特點,人工從大量時序數據中發掘有效信息是不可行的。近年來,工業界和高校都投入了很多人力去研究自動化的時序分析演算法。時序分析包含時序預測,異常檢測,分類,聚類,特征提取等多個方向。本文主要關註的是預測和異常檢測兩個方面。

問題描述

本文主要關註的是時序預測和異常檢測,下麵是對這兩個問題簡單的數學化描述。

多維時序預測:

多維異常檢測:

採用基於預測的異常檢測的好處是可以統一利用預測神經網路同時解決預測和異常檢測的問題。

問題思考

基於以上的問題定義後,本文專註於設計預測演算法。預測演算法需要考慮到以下三個要點才能做到預測準確:

時間相關性

時間相關性指多維時間序列中,同一維度的數據點前後時間的相關性,從巨集觀上體現在該維度的周期性和趨勢性。以下圖為例,下圖是加州灣區的三條道路擁堵程度的時序數據。可以清楚的看到,每一個維度都存在明顯的周期性,這種周期性即被歸為時間相關性。

空間相關性

空間相關性指的是多維時間序列中,不同維度之間的相關性。從上圖可以看到,維度1和維度3的擁堵程度尖峰的發生時間存在很強的相似性,這種相似性在本文中被歸為空間相關性。

平穩性

在工程實現中,平穩性一般指寬平穩或迴圈平穩,即分佈的均值以及自相關函數不隨時間變化或隨時間周期變化。平穩性是自回歸預測的潛在假設,當數據非平穩時,預測值可能發生巨大偏差。在時序數據中,非平穩數據是很常見的,例如下圖ETT數據集中,數據前後,均值發生較大變化,是典型非平穩數據。常見的預測演算法,例如ARIMA採取差分的方式迫使數據平穩。

演算法設計

歸一化方法設計

在設計演算法網路之前,首先需要保證網路輸入數據的平穩性,即需要限制數據輸入的波動範圍。ARIMA等演算法採取差分的方式做平穩性保證,然而,差分的方式會使雜訊疊加,增大雜訊干擾。本文提出利用動態歸一化(dynamic normalization)的方式對數據進行平穩性保證。

如上圖所示,一般的時序歸一化方法如上圖的上半部分所示,數據分為訓練集合測試集兩部分,在歸一化的過程中,首先計算訓練集的均值方差,並用該均值方差歸一化訓練集自身。在測試集上,則利用訓練集的均值方差歸一化測試集。這種做法存在的問題是,當數據非平穩時,測試集的值域可能合訓練集差距較大,導致測試集上的預測結果非常差。並且此種歸一化並未考慮到時序數據的特性,在測試集上,數據實際上是按照滑動視窗順序輸入神經網路進行預測的,滑動視窗之前的所有數據應該被視為已知並可用於幫助後續預測。

基於以上分析,我們提出動態歸一化策略。首先,在訓練集上,動態歸一化與傳統歸一化採用相同的策略,即訓練集計算整體均值方差並用它來歸一化自己。在測試集上,歸一化過程以網路輸入的滑動視窗為單位。如上圖下半部分所示,演算法維持一個動態的均值,方差,其初始值為訓練集的均值方差。每當一個滑動視窗的數據進入歸一化演算法,首先該演算法利用滑動視窗的數據更新當前的均值方差,並用該均值方差歸一化滑動視窗的預測輸入。該方法的好處是可以動態保證神經網路輸入數據的範圍,確保輸入數據的平穩性,同時不會引入多餘雜訊。

時間相關性學習模塊

本文的預測網路結構MARINA如上圖所示,整個網路結構分為三個模塊,時間相關性模塊,空間相關性模塊,輸出整形模塊。

在時間相關性學習中,一般的備選網路結構包含MLP,RNN (GRU, LSTM),TCN,attention等結構。經過在多個數據集上的多次實驗對比,我們選擇了最高效,預測準確率最高的MLP,即全連接神經網路。為了增加網路的深度以學習到更複雜的時序波形,我們採取了殘差連接的方式,把多個MLP模塊連接到了一起。具體每個模塊之間的傳播方式可參見文中的公式3,4,5。

空間相關性模塊

需要註意的是,時間相關性模塊中,數據點信息的傳播僅僅集中在了時間維度上,不同維度之間的信息並沒有進行交互。在多維時間序列中,不同維度的數據常常具有相關性,利用好這些相關性可以增加預測準確度。因此,在時間相關性模塊後,我們設計了空間相關性模塊,我們把時間相關性模塊的輸出中的每一維度視為視為圖中的一個節點,並送入self-attention網路中進行空間相關性學習。在圖學習中,信息在圖的每個節點中相互傳播,以達到學習不同維度相似性的目的。空間相關性模塊的傳播公式可以參考文中的公式6,7,8。

輸出整形模塊

預測輸出需要調整到用戶需要的長度,因此,在網路的尾部我們加入了一個輸出整形模塊,這個整形模塊由一個MLP模塊構成,對時間維度進行操作,把時間維度的長度整形到需要的長度。

實驗部分

在設計完了預處理演算法以及網路結構後,我們做了大量了的實驗來驗證我們演算法的效果。我們的實驗分為預測實驗,異常檢測實驗,消融性實驗,演算法效率實驗四部分。

預測實驗

預測實驗中,我們採用了ETT等三個數據集加上electricity數據集。

baseline我們採用了近5年中一些著名的預測演算法,例如LSTMa,Reformer, LogTrans, LSTNet, Informer, 以及HI (historical inertia)。其中需要註意的是,HI是發表在CIKM2021的一個對baseline的研究,它對時間序列不做任何操作,僅僅把輸入作為輸出(當輸出長度小於輸入時則需要截斷)。這樣的baseline的好處是不受任何參數影響,可以作為任意預測演算法有效性的基本驗證。

在實驗結果中,我們利用MSE, MAE兩個指標來評估演算法預測的準確度。預測長度我們測試了端序列預測24步到長序列預測960步。粗體代表最佳結果,下劃線數據代表第二好的結果。

從實驗結果可以看出,在所有指標上,MARINA的性能都超過了對比演算法。值得一提的是HI演算法的性能也超過了絕大部分對比演算法。對於這一現象,我們認為是由數據導致,ETT數據集普遍都由很輕的非平穩性,以上其他的對比演算法都沒有對非平穩數據做處理,導致無法獲得合理的預測值。

異常檢測實驗

異常檢測實驗中,我們採用了SMD, SMAP, MSL以及SMAP四個經典數據集。

對比演算法中同樣包含了近幾年提出的著名檢測演算法,包含AE, EncDec-AD, GANomaly, LSTM-NDT, DAGMM, LSTM-VAE, BeatGan, OmniAnomaly, DAEMON演算法。

在實驗結果中,我們利用F1-score, Precision, Recall三個異常檢測的準確度。

從實驗結果來看,MARINA在F1-score指標上可以擊敗所有的對比演算法。

消融性實驗

在消融性實驗中,我們考慮了歸一化策略,時間相關性模塊,空間相關性模塊對演算法預測效果的影響。

歸一化策略

在歸一化策略的消融性實驗中我們對比了演算法在ETTh1, ETTh2數據集上的預測結果。

從結果中可以看出,利用動態歸一化策略的預測結果均好於用普通靜態歸一化的預測結果。這種性能提升在ETTh2數據集上尤為明顯,原因是ETTh2數據集的非平穩性更加明顯。

時間相關性模塊

為了證實MLP模塊在時間相關性學習中的有效性,我們把MLP模塊替換成了LSTM, GRU, attention, TCN四種模塊,並與MLP做對比。

對比效果如上圖所示,其中LSTM和GRU的預測效果最差,attention, TCN效果相當,但都低於MLP的預測效果。

空間相關性模塊

空間相關性模塊的原理是讓信息在不同維度之間傳遞以學習不同維度之間的相關性。在對比實驗中,我們對比了其餘三種空間相關性模塊的實現方案:MLP網路,Mix-Hop網路,無空間相關性模塊。

從上圖的對比效果可以看出,MLP, Mix-Hop在空間相關性學習中甚至起到了反向效果,性能比沒有空間相關性模塊還差。self-attention網路相對於無空間相關性學習性能有一定提升。

演算法效率對比

在效率對比中,我們對比了MTGNN, LSTNet, Informer, Informer-, MARINA-, MARINA的訓練+預測時間。其中MARINA-是指去掉了圖學習模塊的MARINA。一般,在有空間相關性的多維時序數據中,圖學習才能起到顯著效果,在沒有明顯相關性的多維時序數據中,可以把圖學習去掉來減少演算法訓練,檢測時間。

從訓練+檢測時間對比中可以看出,MARINA相比於主流演算法消耗時間最少。在所有演算法中,Informer由於其超高的複雜度,訓練檢測時間最高可以達到MARINA的100倍。

總結

在本論文中,我們提出了MARINA神經網路結構,該結構可以用於預測以及異常檢測任務。通過充分的實驗,我們可以看出,在預測和異常檢測任務上,MARINA都能達到最優的效果,且在訓練檢測效率上,MARINA也相比對比演算法能達到最高效率。由於MARINA的高效,高準確率的特點,其十分適合於雲服務中海量監控時間線的場景。目前MARINA已經集成在了雲資料庫創新lab的時序分析演算法庫中。

展現領先科研實力,華為雲資料庫創新LAB三篇論文入選國際資料庫頂級會議VLDB’2022

華為雲資料庫創新lab官網https://www.huaweicloud.com/lab/clouddb/home.html

We Are Hiring:https://www.huaweicloud.com/lab/clouddb/career.html ,簡歷發送郵箱:[email protected]

華為雲資料庫創新Lab 時序資料庫openGemini正式開源,開源地址:https://github.com/openGemini,誠邀開源領域專家加入!

 

點擊關註,第一時間瞭解華為雲新鮮技術~


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 一:背景 1.講故事 前段時間有位朋友在微信上找到我,說他的程式偶發性崩潰,讓我幫忙看下怎麼回事,上面給的壓力比較大,對於這種偶發性崩潰,比較好的辦法就是利用 AEDebug 在程式崩潰的時候自動抽一管血出來,看看崩潰點是什麼,其實我的系列文章中,關於崩潰類的dump比較少,剛好補一篇上來,話不多說 ...
  • 各位好啊,我是會編程的蝸牛,作為java開發者,我們都是需要接觸Linux伺服器的,一般部署應用都是部署在Linux伺服器上的~ 但一般的伺服器要麼需要購買,要麼只是公司里的,那麼有沒有免費的Linux可以讓我們自己使用呢?答案是,有的。 我們可以在自己的電腦上安裝一個虛擬機,然後就可以在虛擬機裡面... ...
  • 合宙開發團隊10月11日的提交中開源了AIR32F103的PLL倍頻調節的代碼, 使得在 Linux 下通過 GCC Arm 工具鏈也能編譯運行216MHz. 示例中的 CoreMark_256MHz 項目, 可以將AIR32F103運行在最高256MHz主頻下, 運行CoreMark性能測試. 以... ...
  • 作用: 藉助於防火牆標記來分類報文,而後基於標記定義集群服務;可將多個不同的應用使用同一個集群服務進行調度 實現方法: 添加防火牆標記 基於標記定義集群服務 在lvs主機上添加防火牆標記: 將lvs的多個埠號通過防火牆貼上同樣的標簽,多個埠號對應一個服務。 iptables -t mangle ...
  • 記CentOS7的httpd源碼包安裝的實驗過程 註:以下純屬本人(小白)見解,如有錯誤請求各位大佬幫忙指正。新人寫博有啥錯誤也麻煩各位大佬給個指點。 作者:lonely-sail 相關下載: httpd依賴包:apr、apr-util(官網下載:http://apr.apache.org/)、pc ...
  • 架構圖: 多網段: 客戶機位於192.168.10.x/24網段 RS位於:10.0.0.x/24網段 VIP:位於172.16.0.x/24網關 通信過程: 客戶機(CIP) >lvs(VIP) >lvs(DIP) >RS(RIP) >客戶機(CIP) 說明: DR模式要求每個RS都擁有和lvs一 ...
  • 架構圖: 環境: 一臺:客戶端 eth0:僅主機 192.168.10.6/24 GW:192.168.10.200 一臺:ROUTER eth0 :NAT 10.0.0.200/24 eth1: 僅主機 192.168.10.200/24 啟用 IP_FORWARD 一臺:LVS eth0:NAT ...
  • 一、前言 作為全鏈路數字化技術與服務提供商,袋鼠雲提供了從數據湖、大數據基礎平臺、離線開發、實時開發、數據服務、數據治理、指標管理、客戶數據洞察、數據孿生可視化等全產品體系的服務。 圍繞著“行業應用”及“通用應用”,袋鼠雲聚焦數智提供全維數字解決方案,幫助企業實現降本增效、快捷轉型,迄今為止袋鼠雲已 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...