最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

純生信,6張圖8分+!cfDNA甲基化+生信分析挖掘生物標(biāo)志物+機(jī)器學(xué)習(xí)算法構(gòu)建分類器

2023-07-27 19:00 作者:生信鳥  | 我要投稿

目前中科院認(rèn)可的期刊越來越少,數(shù)據(jù)挖掘的不夠充分是達(dá)不到優(yōu)質(zhì)期刊的門檻兒的。今天教大家純生信分析方法挖掘生物標(biāo)志如何發(fā)高分。

小谷今天又找到一篇挖掘生物標(biāo)志的高分文章,該文使用了基因組學(xué)、生物信息學(xué)和統(tǒng)計(jì)學(xué)分析以及機(jī)器學(xué)習(xí)分析的方法?(ps:之前已經(jīng)小谷介紹過一篇聯(lián)合分析的,今天又來啦!)。今天這篇沒有取交集的操作,非常硬核的生信挖掘,只是使用機(jī)器學(xué)習(xí)算法構(gòu)建了個分類器,用的數(shù)據(jù)集不多,為新的藥物研發(fā)以及轉(zhuǎn)移性疾病的臨床治療等方面提供了有力支持。


題目:cfDNA甲基化作為SWOG S1314肌層浸潤性膀胱癌患者新輔助化療反應(yīng)的預(yù)測生物標(biāo)志物

雜志:European Urology Oncology

影響因子:IF=8.208

發(fā)表時間:2023年4月


研究背景

新輔助化療(Neoadjuvant chemotherapy, NAC)是肌層浸潤性膀胱癌(Muscle invasive Bladder Cancer, MIBC)的標(biāo)準(zhǔn)治療。然而,治療強(qiáng)度大,總體效益小,因此需要有效的生物標(biāo)志物來確定收益。


數(shù)據(jù)來源


研究思路

作者首先72 名患者中采集了血液樣本,通過Infinium MethylationEPIC BeadChip平臺進(jìn)行DNA甲基化水平分析,并結(jié)合隨機(jī)森林模型(Random Forest, RF)和Elastic Net進(jìn)行分類器構(gòu)建。通過在基線信息中添加治療數(shù)據(jù)來構(gòu)建mR-score(methylation-based response score),預(yù)測NAC的響應(yīng)概率,并確定了一種結(jié)合mR-score和循環(huán)膀胱DNA fraction的風(fēng)險分層模型,以預(yù)測NAC響應(yīng)。



主要結(jié)果

1.樣本采集流程以及患者特征作者使用S1314中73名患者的pre-NAC blood,這些患者在試驗(yàn)中接受了基于順鉑NAC,隨后進(jìn)行了膀胱切除術(shù)以確定他們在試驗(yàn)中的病理反應(yīng)如圖1所示。圖1也總結(jié)了臨床病理特征。所有特征(性別、年齡、臨床分期、體能狀態(tài)和cfDNA(cell-free DNA)濃度)均與病理反應(yīng)顯著相關(guān)。

圖1 樣本采集流程圖和患者特征

? ? ? ???

2.使用mR-score評估NAC反應(yīng)生物標(biāo)志物

作者選擇DML(differentially methylated loci)在DMR(differentially methylated regions)中的NR中甲基化程度較低的DML作為機(jī)器學(xué)習(xí)的starting point。使用NR(less methylated in NR, lmNR)DML中甲基化程度較低的前500個,我們發(fā)現(xiàn)t分布隨機(jī)鄰域嵌入(t-distributed stochastic neighbor embedding, tSNE)圖將Rs聚集在遠(yuǎn)離NR的位置(圖2A)。隨后使用重采樣程序來計(jì)算每個樣本的mR-scores。該mR-scores通過比較Rs和NRs之間的甲基化特征進(jìn)行訓(xùn)練,旨在預(yù)測NRs的概率。因此,高mR-scores與無反應(yīng)相關(guān),而低mR-scores與反應(yīng)相關(guān)。作者首先創(chuàng)建了十個隨機(jī)選擇的62個樣本訓(xùn)練集,其中不包含感興趣的患者。在訓(xùn)練集中選擇DML并用于訓(xùn)練RF模型。每個訓(xùn)練模型都提供一個預(yù)測分?jǐn)?shù),每個患者的mR-scores被確定為十個訓(xùn)練模型的預(yù)測分?jǐn)?shù)的中值。使用RF模型預(yù)測R與NR,獲得了接受者操作特征(ROC)曲線下面積(AUC)為0.636。還觀察到漸進(jìn)相關(guān)性,中位mR-scores在CR中最低,在PR中較高,在NR中最高(圖2B)。進(jìn)一步觀察到兩種化療方案具有相似的預(yù)測能力(圖2C)作者還使用了ElasticNet(機(jī)器學(xué)習(xí)算法模型),構(gòu)建分類器并獲得相似的結(jié)果。在mR-scores和基于彈性網(wǎng)絡(luò)的預(yù)測分?jǐn)?shù)之間觀察到很強(qiáng)的相關(guān)性(圖2D)

圖2 mR-scores評估NAC 反應(yīng)結(jié)果


3.治療中期的?mR-scores與反應(yīng)相關(guān)作者對57個治療樣本的cfDNA甲基化數(shù)據(jù)進(jìn)行了分析,并使用在72個預(yù)處理樣本上訓(xùn)練過的RF模型分配了mR-scores。治療中期mR-scores的表現(xiàn)略好,AUC為0.720。治療前和治療中mR-scores之間也存在顯著相關(guān)性(圖3A)。同樣,根據(jù)mR-scores觀察到對兩種化療方案的相似預(yù)測能力(圖3B)。

圖3治療中期的mR-score結(jié)


4. 使用循環(huán)膀胱 DNA fraction和 mR-scores預(yù)測 NAC 反應(yīng)的組合風(fēng)險分層模型作者用基于組織特異性甲基化模式估計(jì)cfDNA(circulating tumor DNA)組織來源相對流行率的方法(ps:他人的研究基礎(chǔ))計(jì)算循環(huán)膀胱DNA fraction,并可以作為膀胱ctDNA的替代指標(biāo)。比較來自CR、PR和NR的樣本中的循環(huán)膀胱DNA fraction時,觀察到循環(huán)膀胱DNA ?fraction逐漸增加(圖4A)。在Rs中,84%的循環(huán)膀胱DNA<1.11%,結(jié)果表明低循環(huán)膀胱DNA對識別NACRs具有高敏感性。觀察到循環(huán)膀胱DNA fraction與治療前mR-scores之間沒有線性相關(guān)性(圖4B)。鑒于這兩個候選生物標(biāo)志物相互獨(dú)立,作者提出并測試了一種風(fēng)險分層模型,該模型結(jié)合了治療前循環(huán)膀胱DNA fraction和mR-scores,然后結(jié)合治療中的mR-scores對中度風(fēng)險患者進(jìn)行分層,之后作者選擇Youden指數(shù)作為這三項(xiàng)指標(biāo)的臨界值,并根據(jù)患者相對于這些臨界值的測試值將患者分配到風(fēng)險組(圖4C-E)。在該隊(duì)列中,所提出的模型的總體預(yù)測準(zhǔn)確性為79%。? ? ? ? ?

圖4 ?循環(huán)膀胱DNA fraction和mR-score預(yù)測NAC反應(yīng)的風(fēng)險分層模型

? ? ? ? ?

文章小結(jié)

這篇文章篇幅不長,研究的點(diǎn)很好,主要亮點(diǎn)就是給出血漿cfDNA甲基化法的應(yīng)用案例,為新的藥物研發(fā)以及轉(zhuǎn)移性疾病的臨床治療等方面提供了有力支持。?(ps:在他人的研究基礎(chǔ)上找出研究方向)。有一個好的研究目標(biāo)非常重要,機(jī)器學(xué)習(xí)算法構(gòu)建分類器也是常規(guī)操作了。(ps:未來小谷還會推送相關(guān)的文章趕快關(guān)注小谷吧!)

純生信,6張圖8分+!cfDNA甲基化+生信分析挖掘生物標(biāo)志物+機(jī)器學(xué)習(xí)算法構(gòu)建分類器的評論 (共 條)

分享到微博請遵守國家法律
扶余县| 集安市| 昌邑市| 右玉县| 裕民县| 虞城县| 东辽县| 嘉义县| 明光市| 青河县| 德令哈市| 桃源县| 台南县| 咸宁市| 抚松县| 福鼎市| 富民县| 黑山县| 钟山县| 长沙市| 青海省| 长阳| 阿城市| 互助| 克什克腾旗| 镶黄旗| 福泉市| 噶尔县| 武安市| 赣榆县| 隆德县| 栾川县| 长宁县| 东源县| 陕西省| 榆中县| 华坪县| 马关县| 安化县| 射阳县| 句容市|