RegEM程序包的使用注意事項
由于GNSS觀測時受到接收機故障或者環(huán)境因素的干擾會使得在數據解算中出現異常,導致獲得的GNSS時間序列出現缺失。若缺失數據比例過大,則在時間域上對坐標序列建模時必然影響參數(尤其是測站速度)估計的精度;而在頻率域上對其進行譜分析時,則會導致混頻現象。因此,在對GPS時間序列進行分析之前,必須要進行數據預處理,其中一個非常重要的過程就是插值,通過對缺失數據插補以獲得均勻采樣的時間序列 (Griffiths and Ray, 2015)。本文使用氣象學中廣泛使用的方法調整最大似然法(Regularized EM algorithm, RegEM)用于插值缺失的數據。該方法最早由Schneider (2001)提出,該方法以嶺回歸方法實現回歸正則化及參數估計,利用交叉檢驗實現給定精度的時空矩陣插值。
程序包可以在github下載:https://github.com/tapios/RegEM
程序的輸入:2-D數組,其中行為觀測時段,列為站點。而且缺失數據需要用NaN替代,具體數據格式如下:
而且同一行不能全是NaN,即出現如下的情況:
本人設置的程序基本輸入格式
由于我們讀取的GNSS代碼缺失數據,其觀測時間不是連續(xù)的,這意味著在繪制的時間序列上是沒有辦法看出缺失值的,我們需要將時間均一化。

下面我提供一個可以計算每日時間采樣的程序:
輸入起始的年和結束的年,即可得到每日采樣的時間序列。比如為2006-2020,得到的時間序列為:
接著將對應時間采樣的數據賦值到均勻采樣的時間序列中,不對應的數據賦值為NaN。接著就可以作為RegEM的輸入數據。

標簽: