文獻閱讀之地球化學(xué)大數(shù)據(jù)處理(一)
本次閱讀的文獻為Nature子刊Nature Communications以Article形式刊發(fā)的中科院海洋大科學(xué)研究中心孫衛(wèi)東課題組的研究論文“Continuous plate subduction marked by the rise of alkali magmatism 2.1 billion years ago”。該文第一作者為劉鶴,通訊作者為孫衛(wèi)東。

內(nèi)容概要:
在漫長的地質(zhì)歷史時期中, 地球的板塊俯沖樣式隨著地幔溫度的降低發(fā)生過重要的轉(zhuǎn)變. 在地球的早期, 其構(gòu)造樣式以滯留蓋型(stagnant-lid)垂向構(gòu)造體制為主, 后經(jīng)過短暫的、間歇性的俯沖(episodic subduction)樣式, 隨著地幔溫度的逐漸降低,過渡到本文現(xiàn)在所看到的持續(xù)性的俯沖(continuous subduction), 表現(xiàn)為大洋板塊沿匯聚型板塊邊界持續(xù)性地再循環(huán)至地幔中。
?因為板塊俯沖會將冷的大洋板塊俯沖循環(huán)至熱的地幔中, 那么如果板塊俯沖樣式在地質(zhì)歷史時期的某一時刻從間歇性俯沖轉(zhuǎn)變?yōu)槌掷m(xù)性俯沖, 其中一個重要結(jié)果就是會加速地幔的降溫. 該研究將所有顯生宙(<5.4億年以前)和太古宙(>25億年前)的基性巖(巖漿巖中的SiO2含量為45%~52%)分成兩組, 分別分析Nb-SiO2, TiO2-SiO2, P2O5- SiO2的相關(guān)性. 結(jié)果發(fā)現(xiàn),顯生宙的基性巖中的Nb, Ti, P元素平均含量與SiO2含量呈負相關(guān)關(guān)系, 而太古宙的基性巖卻并非如此。作者分析, 造成顯生宙Nb, Ti, P與SiO2負相關(guān)的主要原因是在當今地球上同時具有陸內(nèi)玄武巖和弧玄武巖. 顯生宙陸內(nèi)玄武巖以堿性玄武巖為主, 其Nb, Ti, P等元素含量較高, SiO2含量較低(多數(shù)<49 wt%), 如中國東部大陸上和南美洲阿根廷境內(nèi)大量形成的新生代玄武巖. 而弧玄武巖的Nb, Ti, P元素含量較低但SiO2含量相對偏高(多數(shù)>49 wt%), 如南美洲智利、俄羅斯堪察加半島、千島島弧、日本群島和琉球群島上形成的玄武巖. 因此, 如果將顯生宙形成的陸內(nèi)和弧玄武巖全部納為一個整體, 則會看到Nb, Ti, P元素的平均含量與SiO2的含量呈負相關(guān)的現(xiàn)象.
然而, 顯生宙形成的陸內(nèi)堿性玄武巖在太古宙十分少見, 太古宙陸內(nèi)玄武巖以拉斑玄武巖(一種Nb, Ti, P和K, Na等堿性元素的含量較低, SiO2含量較高的玄武巖)為主. 太古宙基性巖的Nb, Ti, P元素的平均含量與SiO2并無負相關(guān)關(guān)系.
Liu等人計算了地質(zhì)歷史時期堿性玄武巖的比例隨時間的變化, 巖石數(shù)據(jù)庫中, 太古宙的堿性玄武巖占全部基性巖的比例僅為5%左右, 而顯生宙堿性玄武巖的比例則達到40%以上(不包括大洋巖漿巖). 為了進一步精確限定堿性玄武巖大量增加的時間, 追蹤地幔溫度降低的歷史, Liu等人統(tǒng)計了全球35億年以來形成的基性巖的地球化學(xué)數(shù)據(jù), 根據(jù)堿性玄武巖富含Nb, Ti, P元素的特點, 基于MATLAB程序設(shè)計計算出堿性玄武巖的比例是在21億年前開始大幅度增加的. 堿性玄武巖的大量形成代表了地幔溫度加速降低事件的發(fā)生, Liu等人將其原因解釋為持續(xù)性板塊俯沖作用的開始.
Liu等人提出的開始于21億年以前的持續(xù)性板塊俯沖作用剛好與21~18億年前的其他板塊俯沖證據(jù), 如高壓低溫變質(zhì)巖和蛇綠巖, 及全球性碰撞造山作用的開始相吻合, 持續(xù)性的板塊匯聚作用最終導(dǎo)致了地質(zhì)歷史時期第一個超大陸——Columbia超大陸的形成. 板塊構(gòu)造學(xué)說自20世紀60年代確立以來, 經(jīng)歷了半個多世紀的發(fā)展. 但是板塊構(gòu)造的起始時間與樣式轉(zhuǎn)變時間等問題, 至今仍未得到解決. Liu等人的研究成果為板塊構(gòu)造樣式的轉(zhuǎn)變時間及其對地幔熱狀態(tài)的影響等問題提供了重要的證據(jù).
此外, 地幔橄欖巖高溫高壓熔融實驗揭示了堿性玄武巖熔體是碳酸鹽化橄欖巖部分熔融的產(chǎn)物, 而導(dǎo)致地幔橄欖巖發(fā)生碳酸鹽化交代作用的是俯沖大洋板片攜帶的海洋沉積碳酸鹽進入深部地幔的結(jié)果. 因此, Liu等人揭示的21億年前開始堿性玄武巖大量出現(xiàn)的另一個重要意義是,給出了海底沉積碳酸鹽隨大洋板塊持續(xù)俯沖大規(guī)模再循環(huán)進入地幔深部的起始時代.

這里重點學(xué)習(xí)了作者考慮數(shù)據(jù)的角度和處理數(shù)據(jù)的手法
數(shù)據(jù)來源:
文章從地球化學(xué)數(shù)據(jù)庫EarthChem(http://portal.earthchem.org/)匯編了以往研究的地球化學(xué)數(shù)據(jù),對全球巖漿活動的長期變化和板塊構(gòu)造的樣式變化進行了統(tǒng)計分析。
盡管前寒武紀的數(shù)據(jù)量遠小于顯生宙的數(shù)據(jù)量,但出版物的收集對于不同年齡段來說是一個相對平衡的過程。具體而言,該數(shù)據(jù)庫不會任意生成特定年齡巖石的采樣偏差。因此,認為地球化學(xué)數(shù)據(jù)庫中火成巖的地球化學(xué)數(shù)據(jù)代表了整個地球歷史上的全球巖漿活動。
數(shù)據(jù)整理
作者從地球化學(xué)數(shù)據(jù)庫下載了火成巖的所有地球化學(xué)數(shù)據(jù),包括整個巖石的主要和微量元素濃度、年齡和地理坐標。這些巖石樣本來自世界各地不同的大陸和島弧。省略了缺乏SiO2濃度的樣品。下載數(shù)據(jù)集中的巖石巖性包括鎂鐵質(zhì)(45–52 wt%SiO2)、中間質(zhì)(52–63 wt%SiO2)和長英質(zhì)巖石(>63?SiO2的重量百分比),在本文中只使用了弧鎂鐵質(zhì)巖石和大陸鎂鐵質(zhì)巖石(45–52 wt%SiO2)。
結(jié)合實際情況排除特定數(shù)據(jù):
海洋高原、海底和島嶼的巖石→以平衡這些地質(zhì)環(huán)境與前寒武紀的海洋巖石,由于板塊俯沖,這些巖石幾乎沒有保存下來
3.5Ga以上的巖石→3.5Ga之前的板塊構(gòu)造機制仍然有爭議
大陸洪流玄武巖等巖石→其構(gòu)造環(huán)境與俯沖無關(guān)
科馬提巖、煌斑巖和碳酸巖→經(jīng)常引起地質(zhì)學(xué)家和地球化學(xué)家的興趣,可能被過度采樣
粗玄巖/輝綠巖巖脈→因為大多數(shù)都經(jīng)歷了嚴重的地殼污染,會導(dǎo)致不相容元素增加
?
最終為包含55107個年齡為 3.5-0?Ga鎂鐵質(zhì)火成巖全巖地球化學(xué)數(shù)據(jù)的數(shù)據(jù)集,進行隨后的統(tǒng)計分析。
數(shù)據(jù)處理:
作者從南美洲安第斯山脈南部和東亞提取了兩組年齡在5 Ma以下的火成巖,以表征俯沖帶中元素的地球化學(xué)行為。選擇這種年輕巖石的原因是,它們目前的位置最能代表它們形成的地質(zhì)環(huán)境。這些巖石也根據(jù)其位置被細分為弧巖石群和陸內(nèi)巖石群。例如,在東亞,堪察加半島、千島群島、日本群島、琉球群島和伊豆-博寧-馬里亞納島弧的巖石被歸類為弧巖石群,而中國東部的巖石則被歸類為陸內(nèi)巖石群。
采用基于MATLAB (R2014a)編碼的Bootstrap重采樣方法計算SiO2在45 ~ 52 wt%范圍內(nèi)對應(yīng)的平均元素濃度,應(yīng)用中心移動平均平滑來確定平均值。
注:Bootstrap是一種基于重采樣的統(tǒng)計方法,它可以通過對原始數(shù)據(jù)樣本進行有放回的重新采樣,生成新的數(shù)據(jù)樣本,從而得到原始樣本的分布情況和相關(guān)統(tǒng)計指標。
?
樣本窗口的寬度設(shè)置為2 wt% SiO2,而步寬設(shè)置為1 wt% SiO2。
將Bootstrap重新采樣的子集執(zhí)行了10,000次迭代。通過計算這10000個重采樣子集的平均值和標準差,得到每1 wt% SiO2的平均值和相應(yīng)的標準誤差。Nb-SiO2、TiO2-SiO2和P-SiO2組合成分趨勢圖分別如圖1和圖2所示。因此,在當前地幔熱狀態(tài)下,弧-陸構(gòu)造體系中低硅基性巖的平均HFSE和P含量在統(tǒng)計上高于高硅基性巖。


由圖可知顯生宙(Phanerozoic eon)低硅基性巖石(45-49 wt% SiO2)中HFSE和P的平均濃度遠高于高硅基性巖石(49-52 wt% SiO2),而太古代低硅基性巖石中HFSE和P的平均濃度略低。因此,定義了一種新的用于監(jiān)測基性巖石HFSE-SiO2(或P-SiO2)組成趨勢的地球化學(xué)式Diff (HFSE):
式中,ω(HFSE)low-Si為SiO2含量為45-49 wt%巖石中HFSE(或P)的平均值,ω(HFSE)high-Si為SiO2含量為49-52 wt%巖石中HFSE(或P)的平均值。
基于MATLAB編碼計算3.0 ~ 0 Ga隨時間變化的Diff (HFSE)。得到每個0.2 Ga時間段的Diff (HFSE) (圖3)
?

誤差條表示通過蒙特卡羅方法估計的Diff(HFSE)的標準偏差(1 s.d.)。
由于某些時間間隔的樣本數(shù)量有限,本文使用移動平均方法來計算特定年齡的值。樣本窗口寬度設(shè)置為0.5 Ga,以包含足夠數(shù)量的樣本用于計算,而移動步寬設(shè)置為0.1 Ga。
例如,1.5 Ga的Diff (Nb)由形成于1.5 ~ 2.0 Ga之間的巖石計算,1.4 Ga的Diff (Nb)由形成于1.4 ~ 1.9 Ga之間的巖石計算。本文將樣本窗口的下界設(shè)置為該窗口的年齡,因為本文所關(guān)心的是由于年輕樣本而產(chǎn)生變化。
?基于MATLAB (R2014a)函數(shù),通過Bootstrap重采樣計算ω(HFSE)low-Si和ω(HFSE)high-Si的均值和標準誤差。通過蒙特卡羅模擬,估計了Diff(HFSE)和相應(yīng)的標準差。根據(jù)中心極限定理,無論數(shù)據(jù)集的分布如何,隨機采樣子集的均值自然會趨向于高斯分布。本文為每0.1 Ga的ω(HFSE)low-Si和ω(HFSE)high-Si均值創(chuàng)建了兩個合成的高斯分布數(shù)據(jù)集。將合成數(shù)據(jù)集的均值和標準差分別設(shè)為ω(HFSE)low-Si或ω(HFSE)high-Si的均值和相應(yīng)的標準誤差。每個合成數(shù)據(jù)集包含1萬個模擬數(shù)據(jù),由式(1)得到1萬個模擬的Diff (HFSE)s,最后以0.1 Ga為間隔,估計3.0 ~ 0 Ga所有年齡的Diff (HFSE)s的均值和標準差(1σ)。
有鑒于此,本文從地球化學(xué)數(shù)據(jù)庫中提取了顯生宙和太古代基性巖石的相關(guān)地球化學(xué)數(shù)據(jù),并研究了它們的Nb-SiO2、TiO2-SiO2和P-SiO2組合趨勢。結(jié)果表明:顯生宙基性巖石中Nb、Ti、P的平均濃度均隨SiO2濃度從45 wt%增加至52 wt%而降低(圖3;同樣,低硅基性巖中HFSE和P的平均濃度在統(tǒng)計學(xué)上高于高硅基性巖,這與南安第斯山脈和東亞的情況非常相似(圖1和圖2)。很可能是這些陸內(nèi)地區(qū)廣泛的顯生宙大陸堿玄武巖以及大陸裂谷顯著提高了低硅基性巖中HFSE和P的平均濃度。太古宙基性巖的Nb-SiO2、Ti-SiO2和P-SiO2組合組成趨勢與顯生宙基性巖的組合組成趨勢存在顯著差異(圖4)。這里低硅基性巖石的平均HFSE和P濃度與高硅基性巖石的平均HFSE和P濃度大致相等。


思考:
1.對于從數(shù)據(jù)庫中搜索的數(shù)據(jù),首先要從異常值的篩查(例如SiO2范圍,巖石類別),缺失值的處理,過采樣問題等方面考慮,保證數(shù)據(jù)質(zhì)量的可靠性
2.要根據(jù)自己研究的具體內(nèi)容,來舍棄一些可能影響統(tǒng)計規(guī)律的數(shù)據(jù),如本文從構(gòu)造環(huán)境、巖石類型、過采樣等方面舍棄一些數(shù)據(jù),但要保證有理有據(jù)。
3.對于不服從正態(tài)分布或者不清楚數(shù)據(jù)分布的情況下,要使用諸如Bootstrap重采樣、蒙特卡羅模擬等方式獲取平均值、方差等數(shù)據(jù)特征(這里需要特別學(xué)習(xí))。
4.對于時間序列的處理
5.大膽建立模型,本文作者大膽假設(shè)Diff作為評價標準,并應(yīng)用在全部基性巖時取得了非常良好的效果。
原文鏈接:
https://www.nature.com/articles/s41467-019-11329-z#Sec1
參考內(nèi)容:
http://www.coms.ac.cn/kxyj/kyjz/201907/t20190731_508005.html
https://www.163.com/dy/article/EPUHOIB3053206RJ.html
https://zhuanlan.zhihu.com/p/265162051
https://baijiahao.baidu.com/s?id=1762071136603329090&wfr=spider&for=pc