ARMR模型簡單實踐(1)

来源:https://www.cnblogs.com/cheflone/archive/2020/05/24/12952134.html
-Advertisement-
Play Games

1.概念簡述 (1)AR模型 AR 模型(auto regressive model)自回歸模型,模型參量法高解析度譜分析方法之一,也是現代譜估計中常用的模型。 用AR模型法求信具體作法是: ①選擇AR模型,在輸入是衝激函數或白雜訊的情況下,使其輸出等於所研究的信號,至少,應是對該信號的一個好的近似 ...


1.概念簡述

(1)AR模型

AR 模型(auto regressive model)自回歸模型,模型參量法高解析度譜分析方法之一,也是現代譜估計中常用的模型。 用AR模型法求信具體作法是: ①選擇AR模型,在輸入是衝激函數或白雜訊的情況下,使其輸出等於所研究的信號,至少,應是對該信號的一個好的近似。 ②利用已知的自相關函數或數據求模型的參 數。 ③利用求出的模型參數估計該信號的功率譜。  (2)MA模型 MA模型(moving average model)滑動平均模型,模型參量法譜分析方法之一,也是現代譜估中常用的模型。 用MA模型法求信號譜估計的具體作法是:①選擇MA模型,在輸入是衝激函數或白雜訊情況下,使其輸出等於所研究的信號,至少應是對該信號一個好的近似。②利用已知的自相關函數或數據求MA模型的參數。③利用求出的模型參數估計該信號的功率譜。 在ARMA參數譜估計中,大多數估計ARMA參數的兩步方法都首先估計AR參數,然後在這些AR參數基礎上,再估計MA參數,然後可求出ARMA參數的譜估計。所以MA模型參數估計常作為ARMA參數譜估計的過程來計算。   2.使用pythonADF檢驗

在ARMA/ARIMA這樣的自回歸模型中,模型對時間序列數據的平穩是有要求的,因此,需要對數據或者數據的n階差分進行平穩檢驗,而一種常見的方法就是ADF檢驗,即單位根檢驗。

平穩隨機過程

在數學中,平穩隨機過程(Stationary random process)或者嚴平穩隨機過程(Strictly-sense stationary random process),又稱狹義平穩過程,是在固定時間和位置的概率分佈與所有時間和位置的概率分佈相同的隨機過程:即隨機過程的統計特性不隨時間的推移而變化。這樣,數學期望和方差這些參數也不隨時間和位置變化。

平穩在理論上有嚴平穩和寬平穩兩種,在實際應用上寬平穩使用較多。寬平穩的數學定義為:

對於時間序列 ytyt,若對任意的t,k,mt,k,m,滿足:

$$E(y_t) = E(y_{t+m})\\

cov(y_t, y_{t+k}) = cov(y_{t+k}, y_{t+k+m})$$

則稱時間序列 ytyt 是寬平穩的。

平穩是自回歸模型ARMA的必要條件,因此對於時間序列,首先要保證應用自回歸的n階差分序列是平穩的。

(1)肉眼檢驗
def draw_rend(timerise, size):
    # print(timerise)
    f = plt.figure(facecolor='white')  # 畫圖板
    rol_mean = timerise.rolling(window=size).mean()  # 對數據時間移動平均計算
    rol_std = timerise.rolling(window=size).std()
    # rol_ = timerise.rolling(window=size).std()
    timerise.plot(color='c', label='原數據')
    rol_std.plot(color='red', label="移動方差")
    rol_mean.plot(color='blue', label="移動平均值")
    plt.title("願數據,均值,方差")
    plt.legend(loc='best')
    plt.show()

  

  該數據顯然是不平穩的,我們來看看一階差分:
def teststationayity(ts):
    dftest = adfuller(ts)  # 實例化檢驗得到數值源
    # print(dftest)
    dfoutput = pd.Series(dftest[0:4], index=['Test Statistic', 'p_value', '#Lags Used',
                                             'Number of Observation Uesd'])
    # print(dfoutput)
    #n階差分
    # _data=pd.Series(ts)
    # data=_data.diff(1)[1:]
    # # print(data)
    # data.plot()
    # plt.show()
    # plt.savefig('./diff_1.svg')

    for key, value in dftest[4].items():
        dfoutput['Critical Value({})'.format(key)] = value
    return dfoutput

  

一階差分後很明顯是不平穩的波動

(差分:差分的目的主要是消除一些波動 使數據趨於平穩
你說的沒錯 一階差分後的確就是增量 這還比較好解釋  而有時候一階差分都未必能達到平穩,此時還要做二階差分 這個就很難解釋意義了
所以對於多變數的時序 一般如果不平穩 我們會選擇檢驗他們是否同階單整然後在同階單整的情況下做協整分析  只要有協整關係 就可以用原始數據來建模  我的理解就是放寬了平穩的要求 畢竟經濟數據要平穩很多時候是難以達到的)

 

 

 

 

3.光看圖沒底兒,故而再瞅瞅單位根檢驗(adf):

(1)概念簡述:

ADF檢驗
在使用很多時間序列模型的時候,如 ARMA、ARIMA,都會要求時間序列是平穩的,所以一般在研究一段時間序列的時候,第一步都需要進行平穩性檢驗,除了用肉眼檢測的方法,另外比較常用的嚴格的統計檢驗方法就是ADF檢驗,也叫做單位根檢驗。

ADF檢驗全稱是 Augmented Dickey-Fuller test,顧名思義,ADF是 Dickey-Fuller檢驗的增廣形式。DF檢驗只能應用於一階情況,當序列存在高階的滯後相關時,可以使用ADF檢驗,所以說ADF是對DF檢驗的擴展。

單位根(unit root)
在做ADF檢驗,也就是單位根檢驗時,需要先明白一個概念,也就是要檢驗的對象——單位根。

當一個自回歸過程中: ,如果滯後項繫數b為1,就稱為單位根。當單位根存在時,自變數和因變數之間的關係具有欺騙性,因為殘差序列的任何誤差都不會隨著樣本量(即時期數)增大而衰減,也就是說模型中的殘差的影響是永久的。這種回歸又稱作偽回歸。如果單位根存在,這個過程就是一個隨機漫步(random walk)。

ADF檢驗的原理
ADF檢驗就是判斷序列是否存在單位根:如果序列平穩,就不存在單位根;否則,就會存在單位根。

所以,ADF檢驗的 H0 假設就是存在單位根,如果得到的顯著性檢驗統計量小於三個置信度(10%,5%,1%),則對應有(90%,95,99%)的把握來拒絕原假設。

ADF檢驗的python實現
ADF檢驗可以通過python中的 statsmodels 模塊,這個模塊提供了很多統計模型。

使用方法如下:

導入adfuller函數

from statsmodels.tsa.stattools import adfuller
adfuller函數的參數意義分別是:

x:一維的數據序列。
maxlag:最大滯後數目。
regression:回歸中的包含項(c:只有常數項,預設;ct:常數項和趨勢項;ctt:常數項,線性二次項;nc:沒有常數項和趨勢項)
autolag:自動選擇滯後數目(AIC:赤池信息準則,預設;BIC:貝葉斯信息準則;t-stat:基於maxlag,從maxlag開始並刪除一個滯後直到最後一個滯後長度基於 t-statistic 顯著性小於5%為止;None:使用maxlag指定的滯後)
store:True  False,預設。
regresults:True 完整的回歸結果將返回。False,預設。
返回值意義為:

adf:Test statistic,T檢驗,假設檢驗值。
pvalue:假設檢驗結果。
usedlag:使用的滯後階數。
nobs:用於ADF回歸和計算臨界值用到的觀測值數目。
icbest:如果autolag不是None的話,返回最大的信息準則值。
resstore:將結果合併為一個dummy。

 adf概念    refer    原文鏈接:https://blog.csdn.net/FrankieHello/java/article/details/86766625

 

 

 

 

(2)判斷

adfuller(dta)後我得到的return;

Test Statistic 0.815369
p_value 0.991880
#Lags Used 13.000000
Number of Observation Uesd 130.000000
Critical Value(1%) -3.481682
Critical Value(5%) -2.884042
Critical Value(10%) -2.578770
dtype: float64

如何確定該序列能否平穩呢?主要看:

1%、%5、%10不同程度拒絕原假設的統計值和ADF Test result的比較,ADF Test result同時小於1%、5%、10%即說明非常好地拒絕該假設,本數據中,adf結果(Test Statistic)為0.8, 大於三個level的統計值。

看P-value是否非常接近0.  本數據中,P-value 為 0.99,不夠接近0.

ADF檢驗的原假設是存在單位根,只要這個統計值是小於1%水平下的數字就可以極顯著的拒絕原假設,認為數據平穩。註意,ADF值一般是負的,也有正的,但是它只有小於1%水平下的才能認為是及其顯著的拒絕原假設。

對於ADF結果在1% 以上 5%以下的結果,也不能說不平穩,關鍵看檢驗要求是什麼樣子的。

但是對於本例,,數據是顯然不平穩的了。

 

 

2020-05-24 

 

 

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 若該文為原創文章,未經允許不得轉載原博主博客地址:https://blog.csdn.net/qq21497936原博主博客導航:https://blog.csdn.net/qq21497936/article/details/102478062本文章博客地址:https://blog.csdn.n ...
  • 整理出一篇Java進階架構師之路的核心知識,同時也是面試時面試官必問的知識點,篇章也是包括了很多知識點,其中包括了有基礎知識、Java集合、JVM、多線程併發、spring原理、微服務、Netty 與RPC 、Kafka、日記、設計模式、Java演算法、資料庫、Zookeeper、分散式緩存、數據結構 ...
  • 安裝配置jdk8 1. 官網下載,安裝jdk8安裝包(我這裡的版本是jdk 8u231 windows x64.exe),選擇安裝位置,我的安裝位置是 C:\environment\java\jdk1.8.0_231 .安裝完jdk後會跳出彈窗要jre,直接關閉,不用選下一步,因為我們前面的jdk安 ...
  • 本篇博客新開一個數據分析後的數據可視化的例子講解,每一篇博客是一個例子。 這節課學習如何繪製一個折線圖。題目如下: 代碼如下: 效果如下: ...
  • IDEA一些不錯的插件分享 目錄 IDEA一些不錯的插件分享 插件集合 CamelCase Translation LiveEdit MarkDown Navigator Jrebel CheckStyle IDEA Alibaba Java Coding Guidelines Ideavim Ma ...
  • hashCode() 和equals() 方法的重要性體現在什麼地方? Java中的HashMap使用hashCode()和equals()方法設置值,根據鍵獲取值的時候也會用到這兩個方法。 怎樣 設置 的值? hashCode()獲得 hash值。而hash值用來確定hashmap中內部 Node ...
  • 老孟導讀:今天分享一個類似“孔雀開屏”的動畫效果,打開新的頁面時,新的頁面從屏幕右上角以圓形逐漸打開到全屏。 先來看下具體的效果 不知道這種效果大家叫什麼名字?如果有更合適的名字可以在評論處告訴我,下麵來說下如何實現此效果。 在使用Navigator進入一個新的頁面時,通常用法如下: 就包含了切換頁 ...
  • 4.元組 元組的主要特性為: 1.元組在創建之後,具有不可以更改的特性,因此不能直接給元組的元素賦值 2.元組的元素類型可以為任意類型,如字典、字元串、列表等 3.元組常用於在程式的整個生命周期中都不變的場景中 4.1 常用方法 元組大小和內容在定義賦值之後,就不可更改,常用的方法如下所示: cou ...
一周排行
    -Advertisement-
    Play Games
  • JWT(JSON Web Token)是一種用於在網路應用之間傳遞信息的開放標準(RFC 7519)。它使用 JSON 對象在安全可靠的方式下傳遞信息,通常用於身份驗證和信息交換。 在Web API中,JWT通常用於對用戶進行身份驗證和授權。當用戶登錄成功後,伺服器會生成一個Token並返回給客戶端 ...
  • 老周在幾個世紀前曾寫過樹莓派相關的 iOT 水文,之所以沒寫 Nano Framework 相關的內容,是因為那時候這貨還不成熟,可玩性不高。不過,這貨現在已經相對完善,老周都把它用在項目上了——第一個是自製的智能插座,這個某寶上50多塊可以買到,搜“esp32 插座”就能找到。一種是 86 型盒子 ...
  • 引言 上一篇我們創建了一個Sample.Api項目和Sample.Repository,並且帶大家熟悉了一下Moq的概念,這一章我們來實戰一下在xUnit項目使用依賴註入。 Xunit.DependencyInjection Xunit.DependencyInjection 是一個用於 xUnit ...
  • 在 Avalonia 中,樣式是定義控制項外觀的一種方式,而控制項主題則是一組樣式和資源,用於定義應用程式的整體外觀和感覺。本文將深入探討這些概念,並提供示例代碼以幫助您更好地理解它們。 樣式是什麼? 樣式是一組屬性,用於定義控制項的外觀。它們可以包括背景色、邊框、字體樣式等。在 Avalonia 中,樣 ...
  • 在處理大型Excel工作簿時,有時候我們需要在工作表中凍結窗格,這樣可以在滾動查看數據的同時保持某些行或列固定不動。凍結窗格可以幫助我們更容易地導航和理解複雜的數據集。相反,當你不需要凍結窗格時,你可能需要解凍它們以獲得完整的視野。 下麵將介紹如何使用免費.NET庫通過C#實現凍結Excel視窗以鎖 ...
  • .NET 部署 IIS 的簡單步驟一: 下載 dotnet-hosting-x.y.z-win.exe ,下載地址:.NET Downloads (Linux, macOS, and Windows) (microsoft.com) .NET 部署 IIS 的簡單步驟二: 選擇對應的版本,點擊進入詳 ...
  • 拓展閱讀 資料庫設計工具-08-概覽 資料庫設計工具-08-powerdesigner 資料庫設計工具-09-mysql workbench 資料庫設計工具-10-dbdesign 資料庫設計工具-11-dbeaver 資料庫設計工具-12-pgmodeler 資料庫設計工具-13-erdplus ...
  • 初識STL STL,(Standard Template Library),即"標準模板庫",由惠普實驗室開發,STL中提供了非常多對信息學奧賽很有用的東西。 vector vetor是STL中的一個容器,可以看作一個不定長的數組,其基本形式為: vector<數據類型> 名字; 如: vector ...
  • 前言 最近自己做了個 Falsk 小項目,在部署上伺服器的時候,發現雖然不乏相關教程,但大多都是將自己項目代碼複製出來,不講核心邏輯,不太簡潔,於是將自己部署的經驗寫成內容分享出來。 uWSGI 簡介 uWSGI: 一種實現了多種協議(包括 uwsgi、http)並能提供伺服器搭建功能的 Pytho ...
  • 1 文本Embedding 將整個文本轉化為實數向量的技術。 Embedding優點是可將離散的詞語或句子轉化為連續的向量,就可用數學方法來處理詞語或句子,捕捉到文本的語義信息,文本和文本的關係信息。 ◉ 優質的Embedding通常會讓語義相似的文本在空間中彼此接近 ◉ 優質的Embedding相 ...