本文介紹基於R語言中的geodetector包,依據多張柵格圖像數據,實現地理探測器(Geodetector)操作的詳細方法~ ...
本文介紹基於R語言中的geodetector
包,依據多張柵格圖像數據,實現地理探測器(Geodetector)操作的詳細方法。
需要說明的是,在R語言中進行地理探測器操作,可以分別通過geodetector
包、GD
包等2
個包實現。其中,geodetector
包是地理探測器模型的原作者團隊早先開發的,其需要保證輸入的自變數數據已經全部為類別數據;而GD
包則是另外一位學者開發的,其可以自動實現自變數數據的最優離散化方法選取與執行——即我們可以直接把自變數帶入這一包中,無需額外進行數據的離散化。本文介紹的是基於前者,即geodetector
包實現地理探測器的具體操作;基於後者的方法,我們將在後期的博客中介紹。此外,如果希望基於Excel實現地理探測器,大家可以參考地理探測器Geodetector下載、使用、結果分析方法這篇文章。
1 包的配置與導入
首先,我們可以先到geodetector
包在R語言中的官方網站,大致瞭解一下該包的簡要介紹、開發團隊、其他依賴包等基本信息;如下圖所示。
隨後,我們開始geodetector
包的下載與安裝。輸入如下所示的代碼,即可開始包的下載與安裝過程。
install.packages("geodetector")
輸入代碼後,按下回車
鍵,運行代碼;如下圖所示。
隨後,將自動下載並配置geodetector
包;此外,在安裝geodetector
包時,會自動將其所需依賴的其他包(如果在此之前沒有配置過)都一併配置好,非常方便。
接下來,輸入如下的代碼,將geodetector
包導入。
library(geodetector)
此時,在RStudio右下方的“Packages”中,可以看到geodetector
包處於選中的狀態,表明其已經配置成功,且完成導入。
2 柵格數據讀取與預處理
接下來,我們首先依據基於R語言的raster包讀取遙感影像中提到的方法,讀取柵格數據。因為我們是要基於柵格數據完成地理探測器的分析,因此很顯然是需要批量導入多張柵格數據的。
讀取柵格數據完畢後,我們通過如下代碼,基於getValues()
函數,從原本的RasterStack
格式的數據中,將柵格數據的像元數值提取出來;隨後,基於View()
函數顯示出這一變數。
tif_file_all_matrix <- getValues(tif_file_all)
View(tif_file_all_matrix)
運行上述代碼,將在RStudio的左上方看到變數tif_file_all_matrix
的數據情況,如下圖所示。可以看到,此時tif_file_all_matrix
變數是一個3
列、6377265
行的矩陣(Matrix
)數據;其中,每一列表示每一個圖層的數據,每一行則是每一個圖層在同一空間位置上各自像元的數值。此外,每一列的名稱即為其所對應的圖層的名稱。
從上圖可以看出,每一列數據中都有很多無效值(NA值),即原本柵格圖像中的無效值(NoData值);由於在後期的地理探測器分析過程中,出現無效值會影響我們分析的結果,因此我們需要通過na.omit()
函數將無效值去除。na.omit()
是一個非常方便的函數,其可以將Matrix
數據中存在NA值的行直接去除(只要這一行中存在至少一個NA,就將這一行去除)。
tif_matrix = na.omit(tif_file_all_matrix)
View(tif_matrix)
隨後,我們再看得到的新變數,可以看到存在NA值的行都不復存在了;如下圖所示。
接下來,由於geodetector
包實現地理探測器操作時,需要保證輸入數據為數據框(Data Frames
)格式,因此我們需要將Matrix
轉為Data Frames
;通過as.data.frame()
函數即可實現這樣的轉換。
tif_frame <- as.data.frame(tif_matrix)
View(tif_frame)
運行上述代碼,可以看到已經獲取到Data Frames
格式的變數tif_frame
了;當然,從外觀上看,其和Matrix
格式的變數tif_matrix
其實長得是一樣的。
完成上述數據預處理操作,我們即可開始地理探測器操作。需要註意的是,本文開頭也提到了,基於geodetector
包實現地理探測器操作時,如果輸入的自變數數據是連續數據,我們需要手動將連續數據轉為類別數據。這一步驟可以通過ArcGIS的重分類等工具來實現,這裡就不再贅述。
3 地理探測器分析
完成上述數據預處理操作,我們即可開始地理探測器的各項具體操作。需要註意的是,本文主要對分析的具體方法加以介紹;至於分析結果的詳細研讀方法,大家參考文章地理探測器Geodetector下載、使用、結果分析方法即可,我們這裡只做簡單的介紹。
3.1 分異及因數探測
首先,我們進行分異及因數探測。在geodetector
包中,我們可以基於factor_detector()
函數實現這一操作。其中,"A_LCCS0"
是本文中的因變數,"DEM_Reclass"
與"F_LCS0"
則是本文中的自變數;tif_frame
則是Data Frames
格式變數的名稱。
在這裡需要註意,如果大家只需要分析一個自變數與因變數的影響關係,用下方第一句代碼所示的格式即可;如果需要分析多個自變數與因變數的影響關係,則需要用下方第二句代碼所示的格式,將多個自變數的名稱通過c()
函數,組成一個向量(Vector
)格式的變數即可。
factor_detector("A_LCCS0", "F_LCS0", tif_frame)
factor_detector("A_LCCS0", c("DEM_Reclass", "F_LCS0"), tif_frame)
我們首先以上述第一句代碼為例來運行,運行後稍等片刻(具體時長與數據量的大小有關),將會得到如下所示的分異及因數探測結果。
其次,再運行上述第二句代碼,得到如下所示的結果。
可以看到,factor_detector()
函數將會給出每一個自變數對於因變數的q
值與p
值。
3.2 交互作用探測
接下來,我們執行交互作用探測;這一操作通過interaction_detector()
函數來執行即可。由於交互作用探測是需要對多個不同的自變數加以組合,所以很顯然這一操作在只有一個自變數的情況下是沒有辦法執行的;因此我們需要用前述第二種代碼格式,即通過c()
函數,將多個自變數的名稱組成一個向量(Vector
)格式的變數後加以執行。
interaction_detector("DEM_Reclass", c("F_LCS0", "K_NDVI"), tif_frame)
運行上述代碼,稍等片刻後將出現如下所示的結果。
可以看到,interaction_detector()
函數將會給出每一種自變數組合方式對應的q
值。但是這裡有一個問題——上述結果只能看到不同組合對應的q
值變化,但是似乎看不出這種組合方式到底屬於非線性減弱、單因數非線性減弱、雙因數增強、獨立、非線性增強中的哪一種情況。
3.3 風險區探測
接下來,我們執行風險區探測;這一操作通過risk_detector()
函數來實現即可,同樣是具有一個自變數和多個自變數的情況。我們這裡就直接以多個自變數的情況來展示代碼與結果了。
risk_detector("A_LCCS0", c("DEM_Reclass", "F_LCS0"), tif_frame)
運行上述代碼,稍等片刻後將出現如下所示的結果。
可以看到,risk_detector()
函數首先將會給出每一種自變數的不同分級中,對應的因變數平均值——這裡自變數的分級指的就是重分類後其的每一個分類;其次,其將給出每一種自變數的分級與分級對應的平均值之間,是否具有顯著性差異。
3.4 生態探測
接下來,我們執行生態探測;這一操作通過ecological_detecto()
函數來實現即可。由於生態探測是需要判斷多個不同的自變數中,兩兩之間是否具有顯著差異,所以很顯然這一操作同樣在只有一個自變數的情況下是沒有辦法執行的;因此我們需要用前述第二種代碼格式,即通過c()
函數,將多個自變數的名稱組成一個向量(Vector
)格式的變數後加以執行。
ecological_detector("A_LCCS0", c("DEM_Reclass", "F_LCS0"), tif_frame)
運行上述代碼,稍等片刻後將出現如下所示的結果。
至此,我們就完成了基於R語言中的geodetector
包,基於多張柵格圖像數據,實現地理探測器(Geodetector)操作的完整流程。