文獻閱讀之地球化學(xué)大數(shù)據(jù)處理(三)
本次閱讀的文獻為EPSL在2020年刊發(fā)的研究論文“Chemical evolution of the continental crust from a data-driven inversion of terrigenous sediment compositions”。文章主要內(nèi)容為從陸源沉積物成分數(shù)據(jù)驅(qū)動反演大陸地殼的化學(xué)演化。

一 方法簡述
方法基于三端元混合模型。假設(shè)大部分大陸地殼來源于鎂鐵質(zhì)、長英質(zhì)和超鎂鐵質(zhì)巖石的混合物(超鎂鐵質(zhì)巖石在2.5 Ga之前主要以komatiite的形式存在)。
首先,使用火成巖數(shù)據(jù)庫來計算這三個端元的組成(時間序列)。
然后,使用測量的沉積物中的元素比率,使用馬爾可夫鏈蒙特卡羅(MCMC)反演方法,計算出這三種端元以何種比例混合最能解釋地質(zhì)觀測結(jié)果。圖一為重建過程的概述。

輸入是兩個數(shù)據(jù)庫:沉積數(shù)據(jù)庫(A)和OrIgn火成數(shù)據(jù)庫(B) ?;鸪蓭r數(shù)據(jù)庫中的巖石首先根據(jù)其主要元素化學(xué)成分分類為長英質(zhì)、鎂鐵質(zhì)和科馬替巖。計算了這些“端部成員”隨時間的平均組成(D;藍色=長英質(zhì),黃色=鎂鐵質(zhì);綠色=鐵鎂鐵質(zhì))。使用局部異常值因子過濾(LOF)沉積數(shù)據(jù)中的異常值(C),然后使用bootstrap技術(shù)外推到連續(xù)時間序列(E)。在每個時間步長,MCMC技術(shù)用于尋找哪種火成端元混合物(D)最能解釋所觀察到的沉積成分(C)(圖F)。這導(dǎo)致了隨時間變化的最佳端元混合物的最終時間序列(G)。為了找到最適合重建端部混合物的地球化學(xué)比率組合,采用了詳盡的網(wǎng)格搜索技術(shù)。

二 端元元素組成時間序列
2.1 火成巖數(shù)據(jù)來源和異常值處理(得到三個端元)
使用Keller和Schoene(2012)的火成巖數(shù)據(jù)庫,刪除了所有主要元素濃度總和小于98%或大于102%的記錄。對于幾種元素,更正單位。
在計算現(xiàn)代鎂鐵質(zhì)端元時,從數(shù)據(jù)庫中排除了所有年齡小于200 Myr的巖石(排除MORB)。為了避免丟失樣本,添加來自PetDB數(shù)據(jù)庫查詢生成的單獨數(shù)據(jù)集的數(shù)據(jù)。該查詢包括來自大型火成巖省份、火山弧、造山帶、火山田和火山省份的樣本,所有樣本的年代均小于200百萬年。
2.2 三個端元時間序列
由于數(shù)據(jù)庫komatiitite數(shù)量有限,認為komatiitic端元組成隨時間變化是恒定的。
針對長英質(zhì)和鎂鐵質(zhì)的時間序列,使用了一個具有高斯核的移動平均模型。使每個端元中每個元素的濃度表示為時間的平滑函數(shù)。
首先,我們通過標準的k倍交叉驗證方法優(yōu)化帶寬值(高斯函數(shù)中的σ),滑動步寬為10Ma,得到元素的時間序列。
然后,使用類似的高斯移動平均模型來計算涉及的比值的擬合,我們使用bootstrap算法來估計置信區(qū)間。
最終,得到三個端元元素和元素比值的時間序列。
三 沉積物元素比例時間序列
3.1 沉積巖數(shù)據(jù)來源
根據(jù)已發(fā)表的文獻數(shù)據(jù)匯編的陸源沉積物數(shù)據(jù)庫,其中包含頁巖、黃土和雜巖樣品的測量結(jié)果。
3.2 沉積巖比值選擇
不是所有的比率都非常適合重建大陸地殼的化學(xué)演化。
合適的元素應(yīng)
(i)具有較低的水溶性,以使其受風(fēng)化影響最小
(ii)不集中在特別耐腐蝕或致密的礦物中,以使它們在運輸過程中不會分餾
(iii)在所考慮的火成巖端部中的濃度范圍很廣

在現(xiàn)代地球上,具有低表觀溶解度(從低到高)的元素是Fe3+、Th、Al、Sc、REEs、Co、Mn3+、4+、Pb、Be、Sn、Zr、Nb、Y、Ti、Ga、Hf、In、Ta、Zn、Cu、Cr3+和Ge。
在太古代海洋中,F(xiàn)e和Mn主要以可溶性Fe2+和Mn2+氧化態(tài)存在,因此是不可靠的替代物。
最相容的元素是最能判斷科馬提巖和鎂鐵質(zhì)巖石的貢獻,即Sc、Cr、Co、Ni和鉑族元素(Ru、Rh、Pd、Os、Ir、Pt–“PGE”)。PGE集中在微量礦物中,并可分離為重礦物,且很大部分PGE通過地外來源輸送到沉積物中——因此不適合。
最不相容的元素是最能判斷長英質(zhì)巖石的貢獻,大離子親石元素(K、Rb、Cs、Sr、Ba、Pb和Eu2+)高度不相容,但通常也相當(dāng)可溶——因此不適合。
不相容且在海水中溶解度低的元素是高場強元素(Zr、Hf、Nb、Ta、Ti)、稀土元素、Y和Th。
在稀土元素中,我們使用不溶性輕稀土元素La和Ce。在太古代,Ce以Ce3+的形式存在,其溶解度可能與不溶性La3+相似。在現(xiàn)代條件下,Ce可以被氧化為4+,而4+的可溶性甚至更低。
考慮到所有的標準,最可靠和鑒別的不溶性元素應(yīng)該是Sc、Cr、Co、Ni(相容),Pb、Zr、Hf、Nb、Ta、Ti、Al、La、Ce、Yb、Y和Th(不相容)。
另一個問題是搬運過程中的礦物分餾問題。上面確定的一些元素集中在蝕變礦物中(例如粘土中的Al),一些元素則集中在大型碎屑礦物中(如鋯石中的Zr和Hf)。前人發(fā)現(xiàn)礦物分餾的影響相對較小。因此可用。

將所選的16個元素組合兩兩組成比值有許多可能。
為了客觀地排列哪些元素比值的組合最有用,將反演算法應(yīng)用于三種合成沉積成分(比例分別為15/27/58%和15/70/15%的科馬替巖/鎂鐵質(zhì)/長英質(zhì),28%的鎂鐵質(zhì)和72%的現(xiàn)代端部長英質(zhì)混合物)。
然后,對合成數(shù)據(jù)進行MCMC反演,并否定那些不能恢復(fù)原始輸入的比率組合。接下來,從三種情況中獲得最大預(yù)測不確定性,并使用它對比值組合進行排名,將不確定性最低的組合列為最佳組合。
最終確定最佳的8個比值(Al2O3/La、Ce/Y、Co/Ni、Cr/Yb、Hf/TiO2、Nb/Pb、Sc/Zr和Ta/Th)。
3.3 異常值處理
礦物可以被蝕變為新的蝕變階段,流體流動元素可以被浸出,大的和/或高密度的礦物可以被隔離到粗粒沉積物中。成巖作用可以進一步改變沉積物中流體流動元素的濃度。所有這些過程都會改變元素比例,使沉積物的最終成分不再代表其初始來源。
為了減少這些影響,對沉積物數(shù)據(jù)庫進行過濾,以算法識別其成分明顯被二次過程改造的樣本。
因此,設(shè)計了一種基于局部異常因子(LOF)算法(本質(zhì)上是聚類分析)的超維密度濾波器,以消除明顯受二次改造影響的樣本。將9.5%的樣品標記為異常值
3.4 沉積巖元素和比率的時間序列
使用400 Myr的內(nèi)核帶寬。對沉積物應(yīng)用與對端部成員濃度相同的自舉程序,我們將代理比率的最佳擬合和95%置信區(qū)間計算為時間的光滑函數(shù)。圖二。

四 馬爾可夫鏈蒙特卡羅反演
使用上面估計的數(shù)量,我們計算了在每個年齡,長英質(zhì)、鎂鐵質(zhì)和科馬提質(zhì)端部的混合物最能再現(xiàn)沉積物代理比值數(shù)據(jù)。
這是通過最小化計算的沉積成分和觀測到的沉積成分之間的不匹配來實現(xiàn)的。
對于每個地質(zhì)時間,執(zhí)行Metropolis Hastings算法的150萬次迭代。我們在每次迭代時記錄馬爾可夫鏈狀態(tài),并跟蹤具有最低 (最佳擬合)的狀態(tài)。馬爾可夫鏈狀態(tài)的前五分之一(300000次迭代)被丟棄(以允許老化),其余的用于計算端成員的置信區(qū)間。
從沉積數(shù)據(jù)可用的最早時間(通常在3.5 Ga左右,但這取決于所使用的比率)開始,以10 Myr的時間步長運行該程序。
最終得到大陸地殼的化學(xué)演化反演結(jié)果。圖三。

五 討論
重建結(jié)果表明,沉積數(shù)據(jù)與上層大陸地殼一致,上層大陸地殼含有大于50%的3.5 Ga長英質(zhì)物質(zhì)。
文章證明,曾經(jīng)作為主要鎂鐵質(zhì)地殼證據(jù)的測量結(jié)果與太古代的長英質(zhì)上大陸地殼一致。如果早太古代地球上已經(jīng)形成了俯沖和可能的板塊構(gòu)造,那么對上地殼的如此大的長英質(zhì)貢獻就可以得到最好的解釋。
本研究得出的結(jié)論依賴于幾種統(tǒng)計工具的使用,這些工具
(1)檢測因化學(xué)和物理風(fēng)化過程而嚴重受損的沉積樣品,應(yīng)用最近鄰濾波算法
(2)通過使用非參數(shù)移動平均模型描繪沉積物中的代理比率隨時間的演變,并使用bootstrap方法評估不確定性
(3)使用MCMC方法評估三種端部巖石類型(鎂鐵質(zhì)、長英質(zhì)和超鎂鐵質(zhì))的貢獻,以量化最佳擬合參數(shù)的不確定性
(4)客觀地確定哪種元素比例最適合重建三個末端成員在時間上的比例。
因此,這項工作強調(diào)了數(shù)據(jù)驅(qū)動的先進定量和統(tǒng)計方法在元素地球化學(xué)領(lǐng)域的價值
參考內(nèi)容:
原文鏈接:
https://www.sciencedirect.com/science/article/pii/S0012821X20300339#fg0020
馬爾可夫鏈蒙特卡羅算法:
https://www.cnblogs.com/pinard/p/6625739.html
https://zhuanlan.zhihu.com/p/564865749