空間內(nèi)插方法分類
1.1 空間內(nèi)插方法比較
論文鏈接:空間內(nèi)插方法比較 - 百度文庫 (baidu.com)
(1)空間內(nèi)插目標:
ü 缺值估計:估計某一點缺失的觀測數(shù)據(jù)以提高數(shù)據(jù)密度;
ü 內(nèi)插等值線:以等值線的形式直觀地顯示數(shù)據(jù)的空間分布;
ü 數(shù)據(jù)格網(wǎng)化:把無規(guī)則分布的空間數(shù)據(jù)內(nèi)插為規(guī)則分布的空間數(shù)據(jù)集,如規(guī)則矩形格網(wǎng)、三角網(wǎng)等。
(2)相關方法介紹如下
1.1.1 幾何方法
是最簡單的空間內(nèi)插方法。幾何方法基于“地理學第一定律”的基本假設,即鄰近的區(qū)域比距離遠的區(qū)域更相似。
優(yōu)點:是計算開銷少,具有普適性,不需要根據(jù)數(shù)據(jù)的特點對方法加以調(diào)整。當樣本數(shù)據(jù)的密度足夠大時,幾何方法一般能達到滿意的精度。
問題是:無法對誤差進行理論估計。最常用的幾何方法有泰森多邊形(最近距離法)和反距離加權方法。
(1)泰森多邊(最近距離法)
泰森多邊形用于生成“領地”或控制區(qū)域。實際上,盡管泰森多邊形產(chǎn)生于氣候?qū)W領域,它卻特別適合于專題數(shù)據(jù)的內(nèi)插,因為它生成專題與專題之間明顯的邊界,不會有不同級別之間的中間現(xiàn)象。
泰森多邊形的算法:未采樣點的值等于與它距離最近的采樣點的值。
(2)反距離加權方法
反距離加權法是最常用的空間內(nèi)插方法之一。它認為與未采樣點距離最近的若千個點對未采樣點值的貢獻最大,其貢獻與距離成反比。
1.1.2 統(tǒng)計方法
常用方法:趨勢面、多元回歸方法;
其基本假設是,一系列空間數(shù)據(jù)相互相關,預測值的趨勢和周期是與它相關的其它變量的函數(shù)。
統(tǒng)計方法的優(yōu)點是計算開銷不大,有一定的理論基礎,能夠?qū)φ`差作出整體上的估計。但是,數(shù)據(jù)采樣的時候要注意,如果采樣過程不能反映出表面變化的重要因素,如周期性和趨勢,則內(nèi)插一定不能取得好的效果上。
1.1.2.1 趨勢面
趨勢面法可通過全局多項式插值法將由數(shù)學函數(shù)(多項式)定義的平滑表面與輸入采樣點進行擬合。趨勢表面會逐漸變化,并捕捉數(shù)據(jù)中的粗尺度模式。
在概念上,趨勢插值法類似于取一張紙將其插入各凸起點之間(凸起到一定高度)。下圖展示的是從平緩山丘采集而來的一組高程采樣點。使用的紙張為洋紅色。
? ? ? ? ? ? ? ? ? ?
平整的紙張無法完全覆蓋包含山谷的地表。但如果將紙張略微彎曲,覆蓋效果將會好一些。為數(shù)學公式添加一個項也可以達到類似的效果,即平面的彎曲。平面(紙張無彎曲)是一個一階多項式(線性)。二階多項式(二次)允許一次彎曲,三階多項式(三次)允許兩次彎曲,依此類推。使用此工具最多允許12次彎曲(十二階多項式)。下圖在概念上展示出一個與山谷擬合的二階多項式。
?
紙張幾乎無法穿過各實際測量點,從而使趨勢插值法成為不精確的插值器。有些測量點位于紙張上方,而其他點則位于紙張下方。但是,如果將測量點高出紙張的距離相加,并將測量點低于紙張的距離也相加,得到的這兩個和值應該相近。以洋紅色表示的表面是通過最小二乘回歸擬合得到的結(jié)果。該生成表面將使凸起點與紙張之間的平方差最小化。
1.1.2.2 多元回歸
在各種統(tǒng)計方法中,使用較多的是回歸分析,其特點是不需要分布的先驗知識(不需要知道分布趨勢是啥)多元回歸在數(shù)學形式上與趨勢面很相似,但是它們又有著顯著的不同。
在趨勢面方法中,模型的擬合嚴格地遵從自常數(shù)、一次、二次、立方等的順序,主要的問題是確定模型的次數(shù),因此,趨勢面分析有內(nèi)在的多重共線性問題:
而在多元回歸中,盡管也存在多重共線性,但它并非內(nèi)在的,可以通過逐步回歸解決,因此,相對于趨勢面的選擇次數(shù),多元回歸的核心問題是選擇變量主成分分析等方法有助于選擇變量和區(qū)分模型。
1.1.3 空間統(tǒng)計方法
空間統(tǒng)計方法以Kriging及其各種變種(Cokriging等)為代表,其基本假設是建立在空間相關的先驗模型之上的。
先驗分布(知識):根據(jù)一般的經(jīng)驗認為隨機變量應該滿足的分布。先驗分布是你瞎猜參數(shù)服從啥分布。
假定空間隨機變量具有二階平穩(wěn)(一階矩是均值,二階中心距是方差),或者是服從空間統(tǒng)計的本征假設。
則它具有這樣的性質(zhì):距離較近的采樣點比距離遠的采樣點更相似,相似的程度、或空間協(xié)方差(在概率論和統(tǒng)計學中,協(xié)方差是一種兩個變量如何相關變化的度量,而協(xié)方差函數(shù)或核函數(shù),描述一個隨機過程或隨機場中的空間上的協(xié)方差)的大小,是通過點對的平均方差度量的。
空間統(tǒng)計內(nèi)插的最大優(yōu)點:是以空間統(tǒng)計學作為其堅實的理論基礎,可以克服內(nèi)插中誤差難以分析的問題,能夠?qū)φ`差做出逐點的理論估計;它也不會產(chǎn)生回歸分析的邊界效應(一般來說,邊界是眾多信息匯聚的地方,它具有異質(zhì)性,是變化的所在,容易產(chǎn)生特殊的現(xiàn)象,受到人們的關注,這就是通常所說的邊界效應)。
缺點:復雜,計算量大,尤其是變異函數(shù)(變異函數(shù)是方差除以距離的函數(shù))是幾個標準變異函數(shù)模型的組合時,計算量很大;另一個缺點是變異函數(shù)需要根據(jù)經(jīng)驗人為選定。
1.1.3.1 Kriging
Kriging模型是一種通過已知試驗點信息來預測未知試驗點上響應的無偏估計模型,無偏估計是用樣本統(tǒng)計量來估計總體參數(shù)時的一種無偏推斷。估計量的數(shù)學期望等于被估計參數(shù)的真實值,則稱此估計量為被估計參數(shù)的無偏估計,即具有無偏性,是一種用于評價估計量優(yōu)良性的準則。
內(nèi)插的第一步是根據(jù)樣本找到適合的變異函數(shù)理論模型。最常用的變異函數(shù)模型有:nugget、球面、指數(shù)、高斯、阻尼正弦、冪和線形模型其中,前幾種模型在一定的范圍內(nèi)達到極大方差,而線形模型的方差增長沒有極限。
變異函數(shù)的形式是內(nèi)插質(zhì)量的關鍵。需要注意的是,由于不同的區(qū)域有不同的空間模式,因而也就有不同的變異函數(shù)。而空間內(nèi)插都有一個隱含的假定,即空間是連續(xù)的,因此,在選擇變異函數(shù)模型之前,檢查數(shù)據(jù)以確定空間連續(xù)性是十分必要的。
1.1.3.2 Cokriging
內(nèi)插的基本原理與Kriging相同,但它通過考慮一個以上變量而優(yōu)化估計;內(nèi)插由于考慮了變量之間的關系而得到改善。
Cokriging內(nèi)插包括以下過程:
1、確定多個觀測值之間空間相關的特征;
2、借助于變異函數(shù)和交叉變異函數(shù)(cross variogram),對相關建模;
3、利用這些函數(shù)估計內(nèi)插值。
1.1.4 函數(shù)方法
傅里葉級數(shù)、樣條函數(shù)、雙線性內(nèi)插、立方卷積法等。
是使用函數(shù)逼近曲面的一種方法。函數(shù)方法在空間內(nèi)插領域大多用于一些特殊場合,如利用高密度的高程數(shù)據(jù)產(chǎn)生等高線、為提高格網(wǎng)數(shù)據(jù)的空間分辨率而內(nèi)插數(shù)據(jù)等。對于利用有限的觀測數(shù)據(jù)進行缺值預測和內(nèi)插格網(wǎng),函數(shù)方法多不適合,因為它難以滿足內(nèi)插的精度,也難以估計誤差。
函數(shù)方法的特點:不需要對空間結(jié)構的預先估計、不需要做統(tǒng)計假設。
缺點:難以對誤差進行估計,點稀時效果不好。
1.1.4.1 傅里葉級數(shù)
適合周期性數(shù)據(jù)序列。
1.1.4.2 樣條函數(shù)
適合于非常平滑的表面,一般要求有連續(xù)的一階和二階導數(shù):它適合于根據(jù)很密的點內(nèi)插等值線,特別是從不規(guī)則三角網(wǎng)(TIN)內(nèi)插等值線。樣條函數(shù)的缺點是難以對誤差進行估計,點稀時效果不好。
樣條函數(shù)的種類很多,最常用的有B樣條、張力樣條1和薄盤樣條等。
1.1.4.3 雙線性內(nèi)插
雙線性內(nèi)插法是使用鄰近4個點的像元值,按照其距內(nèi)插點的距離賦予不同的權重,進行線性內(nèi)插。該方法具有平均化的低通濾波效果,邊緣受到平滑作用,而產(chǎn)生一個比較連貫的輸出圖像,其缺點是破壞了原來的像元值,在后來的波譜識別分類分析中,會引起一些問題。
雙線性內(nèi)插和立方卷積法都主要用于網(wǎng)格數(shù)據(jù)的內(nèi)插,一般很少用于根據(jù)離散數(shù)據(jù)內(nèi)插空間分布。它使用與待估計網(wǎng)格距離最近的4個網(wǎng)格值,線性內(nèi)插獲得新的網(wǎng)格值。
雙線性內(nèi)插方法的優(yōu)點:數(shù)據(jù)重采樣后的結(jié)果較為平滑,沒有階躍效應,同時具有較高的精度。
缺點:網(wǎng)格被平均化低頻濾波的效果;邊緣被平滑,有些極值丟失了。
1.1.4.4 立方卷積法
立方卷積插值又叫雙三次插值,是對雙線性插值的改進,是一種較為復雜的插值方式,它不僅考慮到周圍四個直接相鄰像素點灰度值的影響,還考慮到它們灰度值變化率的影響,此法利用待采樣點附近16個像素點的灰度值作三次插值進行計算,還用到三次多項式S(w)。
優(yōu)點:采樣結(jié)果的統(tǒng)計信息(均值和方差)與原數(shù)據(jù)的相似程度比其他采樣方法高。
缺點:數(shù)據(jù)值被改變,顯著改變了網(wǎng)格尺寸。
1.1.5 隨機模擬方法
隨機模擬是指把某一現(xiàn)實的或抽象的系統(tǒng)的某種特征或部分狀態(tài),用另一系統(tǒng)(稱為模擬模型)來代替或模擬。為了解決某問題,把它變成一個概率模型的求解問題,然后產(chǎn)生符合模型的大量隨機數(shù),對產(chǎn)生的隨機數(shù)進行分析從而求解問題,這種方法叫做隨機模擬方法。
常用的隨機模擬方法有高斯過程、馬爾科夫過程、蒙特卡羅方法、人工神經(jīng)網(wǎng)絡方法等。
其基本假設與空間統(tǒng)計方法不同,隨機模擬認為地理空間具有非平穩(wěn)性(在空間分析中,觀測數(shù)據(jù)一般按照給定的地理位置作為采樣單元進行采樣,隨著地理位置的變化,變量間的關系或者結(jié)構會發(fā)生改變),是空間異質(zhì)的。它通過空間分布現(xiàn)象的可選的、等概率的、數(shù)值表達來對空間不確定性建模。對應不確定性,可以接受可選的多個答案。與空間統(tǒng)計方法不同,隨機模擬方法不是產(chǎn)生唯一的估計結(jié)果,它產(chǎn)生一系列可選的結(jié)果,它們都與實際數(shù)據(jù)一致,而且相關模型將它們聯(lián)系起來。
(1)優(yōu)點:定義了各種隨機變量之間的空間相關,這類相關可以根據(jù)相鄰數(shù)據(jù)把高度不確定性的先驗分布更新為低不確定性的后驗分布。
先驗分布:這個對先驗信息進行加工獲得的分布今后稱為先驗分布。先驗信息,即是抽樣(試驗)之前有關統(tǒng)計問題的一些信息。一般來說,先驗信息來源于經(jīng)驗和歷史資料。先驗信息在日常生活和工作中是很重要的。
舉例:一位常飲牛奶加茶的婦女聲稱,她能辨別先倒進杯子里的是茶還是牛奶。對此做了10次試驗,她都正確地說出了。
(2)缺點:建模困難,計算量大。
1.1.5.1 蒙特卡羅方法
蒙特卡羅方法是一類基于概率的方法的統(tǒng)稱,不是特指一種方法。
蒙特卡羅方法也成統(tǒng)計模擬方法,是指使用隨機數(shù)(或者更常見的偽隨機數(shù))來解決很多計算問題的方法。他的工作原理就是兩件事:不斷抽樣、逐漸逼近。
1.1.5.2 高斯過程回歸
高斯過程是概率論和數(shù)理統(tǒng)計中隨機過程的一種,是多元高斯分布的擴展,被應用于機器學習、信號處理等領域。
在概率論和統(tǒng)計學中,高斯過程(Gaussian process,GP)是觀測值出現(xiàn)在一個連續(xù)域(例如時間和空間)的隨機過程。在高斯過程中,連續(xù)輸入空間中每一點都是與一個正態(tài)分布的隨機變量相關聯(lián)。高斯過程的分布是所有(無限多個)隨機變量的聯(lián)合分布,或者說是多個正態(tài)分布的集合。正因如此,它是連續(xù)域(例如時間和空間)上的函數(shù)分布。
高斯分布(正態(tài)分布)是一個常見的連續(xù)概率分布。正態(tài)分布的數(shù)學期望值或期望值等于位置參數(shù),決定了分布的位置。
一個均值函數(shù)和協(xié)方差函數(shù)可以定義一個高斯過程,并且一個高斯過程的有限維度的子集都服從一個多元高斯分布。
?
同時,高斯過程的協(xié)方差函數(shù)就是其核函數(shù)。605項目下圖所示:
?
核函數(shù)是高斯過程的核心,它決定了一個高斯過程的性質(zhì)。核函數(shù)在高斯過程中起衡量任意兩個點之間的“距離”的作用。不同的核函數(shù)有不同的衡量方法,得到的高斯過程的性質(zhì)也不一樣。最常用的一個核函數(shù)為高斯核函數(shù),也就是徑向基函數(shù)RBF。
1.1.6 確定性模擬
假設變量的空間分布受物理定律控制,因此,可以使用物理模型或半經(jīng)驗、半物理的模型模擬空間分布。對于這一類內(nèi)插,常常是使用有限的觀測值獲得一些必須的經(jīng)驗參數(shù),再把這些參數(shù)代入到物理模型之中。
優(yōu)點即它的確定性,它不依賴或很少依賴觀測樣本。但空間準確性有待商榷。
1.1.7 綜合方法
是以上幾種方法的綜合,并分別用統(tǒng)計方法、譜函數(shù)、人工神經(jīng)網(wǎng)絡和隨機過程建模描述相應的成分。
本文比較了主要的空間內(nèi)插方法,分析了各種方法的假設、適用范圍、算法和優(yōu)缺點,并且重點介紹了空間統(tǒng)計方法。必須指出,對于眾多的空間內(nèi)插方法而言,沒有絕對最優(yōu)的空間內(nèi)插方法,只有特定條件下的最優(yōu)方法。因此,必須依據(jù)數(shù)據(jù)的內(nèi)在特征,依據(jù)對數(shù)據(jù)的空間探索分析,經(jīng)過反復實驗選擇最優(yōu)的空間內(nèi)插方法。同時,應對內(nèi)插結(jié)果做嚴格的檢驗。



