RDA 代表什么的縮寫?( 二 )


(1)執行物種spe1與環境變量env1的線性回歸(由于此處示例中僅存在一個環境解釋變量,故此回歸為一元線性回歸;當存在多解釋變量時,即為多元線性回歸),將回歸模型擬合的物種豐度值存儲在擬合值矩陣,物種豐度的殘差存儲在殘差矩陣 。見下圖1中所示的過程 。
(2)如此對物種組成矩陣中的所有物種重復相同的操作,最終獲得包含所有物種豐度擬合值及殘差的兩個矩陣 。見下圖2中所示的兩個矩陣 。(1)(2)過程即形象化地展示了RDA中的回歸細節部分 。
(3)回歸過程執行完畢后,使用PCA,在擬合值矩陣中提取約束的排序軸,并在殘差值矩陣中提取非約束的軸 。見下圖2中所示的過程,在該示例中,由于僅有一個解釋變量(環境變量env1),因此僅得到一個約束的排序軸(排序圖中的垂直軸是第一個非約束軸) 。
RDA排序結果產生的約束軸的數量為min[p, m, n - 1];如果同時獲得非約束排序結果(即PCA),則非約束軸數量為min[p, n - 1] 。其中,p為響應變量數量;m為定量解釋變量數量以及定性解釋變量(因子變量)的因子水平的自由度(即該變量因子水平數減1);n為排序對象數量 。
從上述解釋計算RDA的步驟中即可看出,RDA的排序軸實際上是解釋變量的線性組合(即線性模型擬合值的排序) 。換句話說,RDA的目的是尋找能最大程度解釋響應變量矩陣變差的一些列的解釋變量的線性組合,因此RDA是被解釋變量約束的排序 。約束排序與非約束排序的區別很明顯:約束排序過程中解釋變量矩陣控制排序軸的權重(特征根)、正交性和方向 。在RDA中,排序軸解釋或模擬(從統計意義上講)依賴矩陣(響應變量)的變差,并可以檢驗響應變量矩陣Y與解釋變量矩陣X的線性相關顯著性;非約束排序PCA分析則不存在這種情況 。盡管在非約束模型中,可以通過在排序后被動地加入解釋變量以達到解釋排序軸的目的( 詳見前文 ),但此舉與約束排序相比具有本質區別 。
在群落分析中,對于非約束排序模型(如 PCA ),我們感興趣的信息主要是排序圖中樣方和物種變量得分的相對位置、部分排序軸的相對重要性(根據特征值判斷)以及排序軸的生態解釋等;而對于約束排序模型(如RDA),我們通常更關注環境變量對物種組成的影響(即環境變量所能解釋的變差,以及 解釋程度的顯著性 )、哪些環境變量對于群落結構的解釋更為重要( 變量選擇 )以及獲知各變量或變量集解釋的變差(變差分解)等 。這些相關的延伸(也很重要)內容不在本文中介紹,若有需要可點擊對應鏈接閱讀 。
通常情況下我們在執行RDA時(如使用R語言vegan包的rda()函數運行RDA),能夠同時獲得約束軸(即解釋變量能夠解釋的部分,以約束軸呈現)和非約束軸(即解釋變量未能解釋的部分,多元回歸的殘差部分,該部分以非約束軸呈現)兩部分信息,原始響應變量矩陣的總變差為約束軸解釋變差和非約束軸解釋變差的加和 。
同前述非約束排序 PCA ,在RDA概念中,變差=方差 。
約束模型解釋變差反映了響應變量變化量的多少與解釋變量有關,如果用比例表示,其值相當于多元回歸的R2,這個解釋比例值也稱作雙多元冗余統計(Bimultivariate redundancy statistic) 。然而,類似于多元回歸的未校正R2,RDA的R2也是有偏差的,需要進行校正 。
同時,并非每一個約束軸都是合理有效的,還需依據置換的原理檢驗各約束軸的顯著性,對約束軸進行取舍( 詳見前文 ) 。因此,與非約束模型 PCA 等的非約束軸等不同,RDA約束軸的評判方法比較嚴格,若約束軸未通過檢驗,則不應被選擇 。(PCA只是探索性分析方法,非約束軸的選擇并無嚴格的標準;RDA已經涉及了統計檢驗的過程,顯著性通過p值衡量)
如上所述,也就是約束軸未能解釋的,多元回歸的殘差部分,額外以非約束PCA軸作為呈現 。對RDA進行解讀時,最好同時結合約束軸和非約束軸中的信息,盡管非約束部分嚴格來講不屬于RDA范疇,但很多情形中仍具參考價值 。
群落分析中,常通過RDA描述環境變量(解釋變量)解釋樣方物種組成(響應變量)的差異 。如果約束軸解釋的變差大于非約束軸解釋的變差,表明響應數據的大部分變化量均可通過解釋變量作出解釋,群落物種組成分布真實地由給定環境因子所影響(對于RDA結果,即二者呈現出較好的線性梯度);如果約束軸解釋變差低于非約束軸解釋變差,或者約束軸解釋變差僅占總變差的較小比例,此時應謹慎對待,因為模型并未顯示出給定環境因子能夠對群落物種的組成作出有效的解釋 。

推薦閱讀