R語言分析蛋白質(zhì)組學(xué)數(shù)據(jù):飛行時間質(zhì)譜(MALDI-TOF)法、峰值檢測、多光譜比較
全文鏈接:http://tecdat.cn/?p=30051
原文出處:拓端數(shù)據(jù)部落公眾號
蛋白質(zhì)組學(xué)
?研究生物體產(chǎn)生的全部蛋白質(zhì)。
? Foci:鑒定、結(jié)構(gòu)測定、生物標(biāo)志物、通路、表達(dá)。
基質(zhì)輔助激光解吸飛行時間質(zhì)譜(MALDI-TOF)法示例頻譜

研究動機(jī)
只有相對較少的開源軟件解決方案可用,而R平臺則很少。
? 處理技術(shù)和生物復(fù)制的必要性。
? 相對強(qiáng)度的定量令人不滿意
? 研究光譜校準(zhǔn)對臨床預(yù)后的影響。
? 模塊化且易于定制的分析程序

示例數(shù)據(jù)
血清肽多姆分析顯示血小板因子 4 是與胰腺癌相關(guān)的潛在鑒別肽
G.M. Fiedler, A.B. Leichtle, J. Kase et al Clin Cancer Res June 1, 2009 15:3812-3819
“兩個顯著峰(m/z 3884;5959)對區(qū)分患者和健康對照的敏感性為86.3%,特異性為97.6%。"
“基于MALDI-TOOF MS的血清肽球分析允許發(fā)現(xiàn)和驗證血小板因子4 [m / z 3884,7767;S.G.]作為胰腺癌的新鑒別標(biāo)志物。
動手操作:文件導(dǎo)入
> spectra[[1]]
?

動手操作:畫圖
> abline(v=3884, col="blue")

動手操作:畫圖m/z 3884
> plot(spectra[[1]]
?

動手操作:方差穩(wěn)定和平滑?
> spea <- lapply(sptra, transfensty, fun=moAvg)

動手實踐:基線校正
> plot(spea[[1]]
> lines(b, col="red");

動手操作:基線校正 – SNIP?
> bl <- estiline(specta[[1]]
?

動手操作:基線校正 – SNIP?
> speca <- lapply(spe, remoeline)
> lines(specra[[1]])


實踐:峰值檢測
?

> peas[[1]]
?

> top <- intnsity(p) %in% sort(int
> labePeak
?

單光譜工作流程
> peaks <- lapply(spetra, detecPeaks)
多光譜比較


最受歡迎的見解
1.R語言分布式滯后非線性模型(DLNM)空氣污染研究溫度對死亡率影響建模
2.R語言分布滯后線性和非線性模型(DLNM)分析空氣污染(臭氧)、溫度對死亡率時間序列數(shù)據(jù)
3.R語言群組變量選擇、組懲罰GROUP LASSO套索模型預(yù)測分析新生兒出生體重風(fēng)險因素數(shù)據(jù)和交叉驗證、可視化
4.R語言邏輯回歸、隨機(jī)森林、SVM支持向量機(jī)預(yù)測FRAMINGHAM心臟病風(fēng)險和模型診斷可視化
5.R語言非線性混合效應(yīng) NLME模型(固定效應(yīng)&隨機(jī)效應(yīng))對抗哮喘藥物茶堿動力學(xué)研究
6.R語言使用限制平均生存時間RMST比較兩條生存曲線分析肝硬化患者
7.分類回歸決策樹交互式修剪和更美觀地可視化分析細(xì)胞圖像分割數(shù)據(jù)集
8.PYTHON深度學(xué)習(xí)實現(xiàn)自編碼器AUTOENCODER神經(jīng)網(wǎng)絡(luò)異常檢測心電圖ECG時間序列
9.R語言如何在生存分析與Cox回歸中計算IDI,NRI指標(biāo)