本文介紹基於R語言中的GD包,依據柵格影像數據,實現自變數最優離散化方法選取與執行,併進行地理探測器(Geodetector)操作的方法~ ...
本文介紹基於R語言中的GD
包,依據柵格影像數據,實現自變數最優離散化方法選取與執行,併進行地理探測器(Geodetector)操作的方法。
首先,在R語言中進行地理探測器操作,可通過geodetector
包、GD
包等2
個包實現。其中,geodetector
包是地理探測器模型的原作者團隊開發的,其需要保證輸入的自變數數據已經全部為類別數據;其具體操作方法大家可以參考地理探測器R語言實現:geodetector。而GD
包則是另一位學者開發的,其可自動實現自變數數據的最優離散化方法選取與執行;本文介紹的就是基於GD
包實現地理探測器的具體操作。此外,如果希望基於Excel實現地理探測器,大家可以參考地理探測器Geodetector下載、使用、結果分析方法。
1 包的安裝與導入
首先,我們可以先到GD
包在R語言中的官方網站,大致瞭解一下該包的簡要介紹、開發團隊等基本信息。
隨後,我們開始GD
包的下載與安裝。輸入如下所示的代碼,即可開始包的下載與安裝過程。
install.packages("GD")
輸入代碼後,按下回車
鍵,運行代碼;如下圖所示。在安裝GD
包時,會自動將其所需依賴的其他包(如果在此之前沒有配置過)都一併配置好,非常方便。
接下來,輸入如下的代碼,將GD
包導入。
library("GD")
輸入代碼後,按下回車
鍵,運行代碼;如下圖所示。
2 數據讀取與預處理
接下來,我們需要讀取柵格圖像數據,並將其轉為GD
包可以識別的數據框(Data Frames
)格式。
其中,讀取柵格數據的方法,大家參考基於R語言的raster包讀取遙感影像即可;關於數據格式的轉換,大家參考地理探測器R語言實現:geodetector即可。這一部分的內容本文就不再贅述。
3 地理探測器執行
接下來,我們就可以開始地理探測器的具體分析;強烈建議大家基於GD
包中的gdm()
函數,實現一步到位的地理探測器分析操作。
首先,如果大家輸入數據中的自變數數據具有連續變數,需要將其轉換為類別變數;gdm()
函數可以實現連續變數的離散化方式尋優與自動執行。其中,我們可以選擇的離散化方式包括相等間隔法、自然間斷點法、分位數分類法、幾何間隔法與標準差法等5
種不同的方法,分別對應以下第一句代碼中的"equal"
、"natural"
、"quantile"
、"geometric"
與"sd"
等5
個選項。此外,我們還可以依據數據的特征,對自變數離散化的類別數量加以限定,具體代碼如下所示。
discmethod <- c("equal", "natural", "quantile", "geometric", "sd")
discitv <- c(4:10)
其中,上述第一句代碼表示,我們後續將從相等間隔法、自然間斷點法、分位數分類法、幾何間隔法與標準差法等5
種不同的方法中,找到每一個連續變數對應的最優離散化方法;第二句代碼則表示,在後續尋找最優離散化方法的同時,還需要對每一個變數的分類數量加以尋優——c(4:10)
就表示我們分別將每一個連續變數分為4
類、5
類、6
類,以此類推,一直到10
類,從其中找到最優結果對應的類別數量。
接下來,我們即可調用gdm()
函數,執行地理探測器分析的具體操作;其中,my_gd
為保存地理探測器結果的變數;函數的第一個參數,表示因變數與自變數的關係,~
前的變數即為因變數,~
後的變數即為自變數,多個自變數之間通過+
相連接;第二個參數表示自變數中的連續變數,程式將自動對這些連續變數加以離散化方法尋優與執行;第三個參數表示存儲自變數與因變數數據的數據框(Data Frames
)格式的變數;最後兩個變數,即為前面我們選擇的離散化方法與類別數量。
my_gd <- gdm(A_LCCS0 ~ C_SlopeS0 + D_AspectS0 + DEM_Reclass + F_LCS0,
continuous_variable = c("C_SlopeS0", "D_AspectS0"),
data = tif_frame,
discmethod = discmethod,
discitv = discitv)
這裡需要註意,如果大家不是通過腳本運行的R語言,而是每次寫一句代碼然後按下回車
鍵運行一下,那麼上述代碼中的換行就需要通過同時按下Shift
鍵與回車
鍵實現。輸入上述代碼後,如下圖所示。
隨後,即可運行代碼。稍等片刻(具體時長與數據量有關),即可得到地理探測器的結果my_gd
。這一變數的具體結構、內容如下圖所示。
我們可以輸入如下的代碼,將變數my_gd
列印出來。
my_gd
所得結果如下圖所示。
可以看到,my_gd
變數包含了每一個連續變數在離散化後,對應的最優離散化方法與類別數量,以及地理探測器的各個分析結果。具體結果的含義與研讀方法,大家參考地理探測器Geodetector下載、使用、結果分析方法,以及地理探測器R語言實現:geodetector這兩篇文章即可,這裡就不再贅述。
此外,我們可以通過如下的代碼,將上述結果加以可視化。
plot(my_gd)
運行上述代碼,結果如下圖所示。
此時,在RStudio軟體的右下方“Plots”中,即可看到可視化結果,如下圖所示。其中,我們可以通過下圖中紅色方框內的箭頭,實現不同圖片的切換顯示。
上述結果包含7
張圖像,其分別與上上圖中的7
項輸出內容對應——第一張圖是最優離散化方法的選取過程,第二張圖則是所選出的最優離散化方法對應的分類情況;後5
張圖就是地理探測器的分析結果圖,即上上圖中最後5
個plot
分別對應的結果。
至此,我們就完成了基於R語言中的GD
包,依據多張柵格圖像數據,實現類別變數的自動離散化,併進行地理探測器(Geodetector)操作的完整流程。