maxent模型的結(jié)果是什么,物種對(duì)環(huán)境的適宜性?
? ? ? ?最近在學(xué)習(xí)對(duì)物種分布的相關(guān)預(yù)測(cè),接觸到一個(gè)模型maxent,它被作為物種分布模型、生態(tài)位模型、或者棲息地模型的一種??吹骄W(wǎng)上有許多關(guān)于這個(gè)模型的下載安裝和使用教程,但是看的許多論文里都是直接運(yùn)行后,使用它的結(jié)果,進(jìn)行等級(jí)劃分后得到物種的適宜性等級(jí)。但是模型得出的值是什么,沒(méi)有人做出解釋。但是,我認(rèn)為使用一個(gè)模型,你必須要知道你得出的結(jié)果是什么,這是很重要的。先看結(jié)果是什么,再?zèng)Q定要不要使用這個(gè)模型。如果你正準(zhǔn)備學(xué)習(xí)maxent物種分布模型,我建議你先看看這篇文章,再?zèng)Q定要不要學(xué)習(xí)。
?熵和最大熵原理
熵(entropy)起源于熱力學(xué),后來(lái)由Shannon引用到信息論中,表示的是隨機(jī)變量的不確定性,熵越大,不確定性就越強(qiáng),包含的可能性就更多。

最大熵原理:在1957年由Jaynes提出。在滿足已知約束條件的集合中選擇熵最大的模型。最大熵原理指出,對(duì)一個(gè)隨機(jī)事件的概率分布進(jìn)行預(yù)測(cè)時(shí),預(yù)測(cè)應(yīng)當(dāng)滿足全部已知的約束,而對(duì)未知的情況不要做任何主觀假設(shè)。在這種情況下,概率分布最均勻,預(yù)測(cè)的風(fēng)險(xiǎn)最小,因此得到的概率分布的熵是最大的。
maxent物種分布建模的方法
空間X:感興趣準(zhǔn)備研究的地理區(qū)域。
樣本:X中觀察到的一組存在點(diǎn)x1,x2,…,xn 。
PHILLIPS(maxent模型的作者)進(jìn)行建模時(shí)不是直接使用點(diǎn),而是采樣點(diǎn)所在柵格,每個(gè)柵格作為一個(gè)位置,但是PHILLIPS考慮的位置并不是指經(jīng)緯度,就是指這么一個(gè)位置,用的單詞是site。或者有的人稱作cell。
如果y=1表示物種存在,根據(jù)樣本(x1,x2,…,xn)(樣本是存在點(diǎn)y=1的位置),得到其經(jīng)驗(yàn)分布函數(shù)(empirical distribution function)為:
其中#{.}表示結(jié)合{.}中的元素個(gè)數(shù)。

根據(jù)貝葉斯定理,如果要得到位置條件下物種出現(xiàn)的概率:

對(duì)于所有位置來(lái)說(shuō)P(x)=1/|X|。P(y=1)是整個(gè)研究區(qū)域中物種的總體發(fā)生率(overall prevalence),這個(gè)值并不好得到,而且使用僅存在數(shù)據(jù)無(wú)法進(jìn)行估計(jì)。但是P(x)和P(y=1)都是一個(gè)數(shù),根據(jù)上式,得到位置條件下物種存在的概率P(y=1│x)是與π(x)成正比的,這里PHILLIPS選擇利用最大熵模型直接對(duì)π(x)進(jìn)行估計(jì),得到一個(gè)近似與P(y=1│x)成正比的分布,也能一定程度反映物種在位置條件下出現(xiàn)的情況,它被解釋為相對(duì)發(fā)生率。
估計(jì)方法:
給定一組特征f1,f2,…,fn,特征向量為環(huán)境變量或環(huán)境變量更高級(jí)的組合(MEROW?et al, 2013)(linear線性, product乘積, quadratic平方, hinge鉸鏈, threshold閾值 and categorical分類)
每個(gè)特征fj在x的值為fj(x),在經(jīng)驗(yàn)分布下的期望為:

尋找一個(gè)分布P,讓每一個(gè)特征fj在下的期望P[fj]與在經(jīng)驗(yàn)分布下的期望相等。在許多滿足條件的分布中,選擇熵最大的分布。

(DELLA PIETRA et al, 1997)證明了所求最大熵分布應(yīng)該是下面這種吉布斯(Gibbs)分布的形式:

? ? ? ? λ是n個(gè)系數(shù)或者特征權(quán)重的向量,f表示n個(gè)特征向量。

? ? ? ?是一個(gè)歸一化指數(shù)(a normalizing constant),確保的和為1。
相對(duì)熵(Relative Entropy)可以衡量?jī)蓚€(gè)隨機(jī)分布之間的距離。當(dāng)兩個(gè)隨機(jī)分布相同時(shí),它們的相對(duì)熵為零;當(dāng)兩個(gè)隨機(jī)分布的差別增大時(shí),它們的相對(duì)熵也會(huì)增大。

? ? ? ? 最小化經(jīng)驗(yàn)分布與所求分布之間的相對(duì)熵,讓這兩個(gè)分布很接近。
因?yàn)榻?jīng)驗(yàn)分布不是真實(shí)分布只會(huì)接近于真實(shí)分布,讓P[fj]= 可能在訓(xùn)練時(shí)導(dǎo)致過(guò)度擬合,考慮放松約束讓P[fj]無(wú)限接近于 。后用順序更新算法、正則化等來(lái)求解最大熵分布,這里暫時(shí)先不考慮求解過(guò)程的問(wèn)題??傊詈笄蟪隽艘粋€(gè)近似與位置條件下出現(xiàn)物種的概率P(y=1|x)成正比的分布:,這就是maxent模型的原始輸出結(jié)果,而且注意到這個(gè)分布和環(huán)境特征向量是相關(guān)的,可以根據(jù)環(huán)境條件往外推,但是這太難解釋了。
根據(jù)現(xiàn)在了解的情況,看看maxent物種分布模型輸出的結(jié)果是什么。
maxent物種分布模型的輸出結(jié)果
Maxent物種分布模型有四種輸出形式(PHILLIPS?et al):
原始輸出raw,求出的maxent指數(shù)分布模型本身,反映了相對(duì)發(fā)生率,給每個(gè)訓(xùn)練位置分配一個(gè)概率,總和為1。當(dāng)訓(xùn)練范圍很大時(shí),得到每個(gè)位置的訓(xùn)練概率都很小。原始輸出并不直觀,訓(xùn)練模型中沒(méi)有使用地點(diǎn),得到的概率很難解釋。
cumulative是累計(jì)輸出,小于等于該位置原始輸出raw的累計(jì)百分比,值位于0—100之間。
比如一組數(shù)據(jù):0.1、0.1、0.1、0.2、0.5
F(0.1)=P(x<=0.1)=(0.1+0.1+0.1)*100=30
F(0.2)=P(x<=0.2)=(0.1+0.1+0.1+0.2)*100=50
F(0.5)=P(x<=0.5)=(0.1+0.1+0.1+0.2+0.5)*100=100
Logistic輸出:使用公式 1/(1+exp(-entropy- raw output)) 計(jì)算每個(gè)位置的存在概率。
C-log-log輸出:使用公式 1-exp(-exp(entropy + raw output)) 計(jì)算每個(gè)位置的存在概率。
這兩種輸出結(jié)果,都用來(lái)估計(jì)環(huán)境條件z下的物種存在概率。P(y=1|z)
Logistic 利用貝葉斯推導(dǎo)后,求聯(lián)合分布的相對(duì)熵,用邏輯回歸模型。
貝葉斯部分:
C-log-log輸出主要利用inhomogeneous Poisson process(不均勻泊松分布)得出。

總結(jié)
其實(shí)maxent物種分布模型的原始輸出結(jié)果raw,在每個(gè)位置的相對(duì)發(fā)生率已經(jīng)可以一定程度上反映物種存在的相對(duì)豐度,且與其它輸出類型是單調(diào)相關(guān)的,它們得出的結(jié)果大小排序是一樣的。但是原始輸出做出的地圖,往往不符合對(duì)生態(tài)學(xué)家對(duì)研究物種潛在分布的直覺(jué)。Maxent的默認(rèn)輸出一般是后兩種存在概率。(ELITH?et al, 2011)
簡(jiǎn)單來(lái)說(shuō),如果位置x下出現(xiàn)物種的概率為P(y=1|x),PHILLIPS的maxent物種分布模型的原始輸出是一個(gè)近似與P(y=1|x)成正比的輸出結(jié)果,這個(gè)相對(duì)發(fā)生率雖然也能反映物種在位置條件下發(fā)生的情況,但它的生態(tài)學(xué)意義不明顯,而且不好解釋。后兩種輸出將其轉(zhuǎn)換成在環(huán)境條件z下出現(xiàn)物種出現(xiàn)的概率P(y=1|z),這才是生態(tài)學(xué)中關(guān)注的問(wèn)題,可以反映物種對(duì)環(huán)境的適宜性。