最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

一區(qū)10分+的免疫疾病分型,老司機(jī)親自教你怎樣開(kāi)機(jī)器學(xué)習(xí)的快車(chē)!

2023-11-17 15:08 作者:爾云間  | 我要投稿

有沒(méi)有小伙伴發(fā)現(xiàn),不論何時(shí)搜索新文章,放眼望去十之七八都是關(guān)于腫瘤免疫相關(guān)的文獻(xiàn),這種火熱程度讓小云看了也有點(diǎn)慌呀。前些天有師妹問(wèn)我除了腫瘤還有啥方向推薦做生信分析,其實(shí)像阿爾茲海默癥、亨廷頓舞蹈癥這樣的遺傳類(lèi)疾病和一些免疫性疾病等等也是生信可攻的方向,還有一些更罕見(jiàn)的疾病簡(jiǎn)直太適合生信爆冷啦~~ 對(duì)系統(tǒng)性紅斑狼瘡這樣自身免疫性炎癥疾病,囿于遺傳或環(huán)境因素難以進(jìn)行有效臨床治療和研究。本文針對(duì)這一點(diǎn),結(jié)合大量的bulk轉(zhuǎn)錄組測(cè)序和微陣列數(shù)據(jù),利用機(jī)器學(xué)習(xí)算法進(jìn)行內(nèi)源性的分類(lèi)并驗(yàn)證??磥?lái)機(jī)器學(xué)習(xí)還是猛啊,搭配bulk轉(zhuǎn)錄組也能發(fā)表10分+一區(qū),當(dāng)然選對(duì)研究對(duì)象也很重要呢!如果對(duì)這類(lèi)疾病的分析沒(méi)有思路,那可千萬(wàn)不要錯(cuò)過(guò)今天小云分享的文獻(xiàn)喲!

(PS:沒(méi)有思路、不知道怎么創(chuàng)新的寶子們,記得來(lái)找小云哦,超多個(gè)性化思路等你來(lái)拿?。?/p>

題目:轉(zhuǎn)錄組學(xué)特征分析揭示具有臨床意義的SLE分子內(nèi)分型

雜志:Genome?Medicine

影響因子:IF=12.3

發(fā)表時(shí)間:2023年10月

研究背景

缺乏典型的疾病模式是了解系統(tǒng)性紅斑狼瘡(SLE, lupus)發(fā)病機(jī)制和開(kāi)發(fā)更有效治療方法的主要限制因素。人們一直在努力確定SLE的分子內(nèi)型,即由不同的病理生物學(xué)功能、生物標(biāo)志物或其他疾病機(jī)制定義的患者亞群。內(nèi)源性類(lèi)型的確定已經(jīng)被用于癌癥和過(guò)敏性疾病的治療,而在其他自身免疫性疾病中剛剛進(jìn)行概念化。已有研究發(fā)現(xiàn)狼瘡的異質(zhì)性可以在外周血中的基因表達(dá)水平上表現(xiàn)出來(lái),這表明分子譜分析可以作為識(shí)別具有臨床意義的特定狼瘡內(nèi)型的基礎(chǔ)。 迄今已有幾個(gè)研究小組報(bào)道了基于轉(zhuǎn)錄組學(xué)的SLE亞分類(lèi),但總的來(lái)說(shuō),這些研究都是針對(duì)有限數(shù)量的患者進(jìn)行的單中心研究,并且尚未形成公認(rèn)的亞群的廣泛共識(shí)。此外,這些研究沒(méi)有考慮基因表達(dá)的混雜變量,如祖先或藥物,也沒(méi)有將研究結(jié)果轉(zhuǎn)化為臨床護(hù)理或臨床試驗(yàn)設(shè)計(jì)。

數(shù)據(jù)來(lái)源

研究思路

采用信息性基因模塊的基因集變異分析(GSVA),使用包含2183例患者的5個(gè)數(shù)據(jù)集,確定了8種SLE內(nèi)型。對(duì)17個(gè)數(shù)據(jù)集的3166個(gè)樣本的擴(kuò)展分析顯示,每種內(nèi)型都有獨(dú)特的基因富集模式,但并非所有內(nèi)型都在所有數(shù)據(jù)集中觀察到。結(jié)合機(jī)器學(xué)習(xí)算法對(duì)2183名患者進(jìn)行了訓(xùn)練,并對(duì)983名未用于開(kāi)發(fā)模型的患者進(jìn)行了測(cè)試,結(jié)果表明,ML算法可以有效地分類(lèi)為8種內(nèi)源性類(lèi)型之一。SHapley加性解釋(SHAP)顯示了一組獨(dú)特的特征,這些特征對(duì)將單個(gè)樣品分類(lèi)為每種內(nèi)質(zhì)型有影響。計(jì)算每位患者的復(fù)合分子評(píng)分,并與標(biāo)準(zhǔn)實(shí)驗(yàn)室測(cè)量結(jié)果顯著相關(guān)。臨床特征的顯著差異與不同的內(nèi)質(zhì)型相關(guān),轉(zhuǎn)錄譜受干擾最小的內(nèi)質(zhì)型表現(xiàn)出較低的疾病嚴(yán)重程度。在隨后的52周內(nèi),使用標(biāo)準(zhǔn)護(hù)理藥物和特定內(nèi)型的患者更有可能對(duì)一項(xiàng)臨床試驗(yàn)(tabalumab)中測(cè)試的研究產(chǎn)品產(chǎn)生臨床反應(yīng),而更異常的內(nèi)型患者更有可能經(jīng)歷嚴(yán)重的急性發(fā)作。。 ?

主要結(jié)果

1.?5個(gè)典型狼瘡數(shù)據(jù)集中分子內(nèi)型的鑒定

通過(guò)32個(gè)免疫細(xì)胞/炎癥通路基因模塊的GSVA富集評(píng)分的k-均值聚類(lèi),在來(lái)自ILL臨床試驗(yàn)(GSE88884 ILL-1和ILL-2)的合并數(shù)據(jù)集中,在1620名活躍的女性狼瘡患者中鑒定出6個(gè)分子亞群(內(nèi)型)(圖1A),內(nèi)皮型標(biāo)記為Z1-Z6。與對(duì)照相比,根據(jù)其GSVA富集評(píng)分,特征被認(rèn)為異常富集或表達(dá)。例如,在非狼瘡對(duì)照組中,IFN、漿細(xì)胞和腫瘤壞死因子(TNF)等模塊的GSVA評(píng)分小于零,而B(niǎo)細(xì)胞、T細(xì)胞和T細(xì)胞鏈(TCRA、TCRB)等模塊的GSVA評(píng)分大于零。在狼瘡患者樣本中,Z1內(nèi)型表現(xiàn)出異常富集的基因模塊(特征)數(shù)量最少,而Z6內(nèi)型最多。 接下來(lái)作者將這種內(nèi)分型方法擴(kuò)展到其他不相關(guān)的數(shù)據(jù)集,確定能否檢測(cè)到相同或額外的內(nèi)分型。在3個(gè)數(shù)據(jù)集中,266名成年狼瘡患者的隊(duì)列中確定6種內(nèi)型,137名兒童狼瘡患者的隊(duì)列中確定5種內(nèi)型,160名其他成年狼瘡患者的隊(duì)列中確定4種內(nèi)型(圖1B-D)。。 余弦相似性分析表明,有幾種SLE內(nèi)型在所有數(shù)據(jù)集中都是可重復(fù)的,而其他的僅在一些數(shù)據(jù)集中發(fā)現(xiàn)(圖1E)。通過(guò)余弦相似度可以識(shí)別出總共11種內(nèi)型。但是對(duì)單個(gè)內(nèi)膜型GSVA平均分?jǐn)?shù)的分層聚類(lèi)表明,在8個(gè)子集之后,在非常小的統(tǒng)計(jì)空間內(nèi)出現(xiàn)包含很少成員的另3個(gè)子集(圖1F)??傊@些分析保守地確定了8種SLE內(nèi)型的最佳數(shù)量。從5個(gè)數(shù)據(jù)集中鑒定出的8種內(nèi)型的K-means聚類(lèi)以及主成分分析(PCA)和t分布隨機(jī)鄰居嵌入(t-SNE)顯示子集的良好分離。

圖1??利用5個(gè)數(shù)據(jù)集確定狼瘡內(nèi)型的最佳數(shù)量

1.?ML將SLE樣本劃分為內(nèi)型

為了在3166例SLE患者的完整隊(duì)列中確定狼瘡的8種內(nèi)源性類(lèi)型,作者將17個(gè)數(shù)據(jù)集中26/32個(gè)可測(cè)量特征的GSVA富集評(píng)分連接起來(lái),并采用k-means (k=8)管道,將所有樣本分為a-h的8種內(nèi)源性類(lèi)型(圖2和3A)。這些結(jié)果成為后續(xù)機(jī)器學(xué)習(xí)的分類(lèi)標(biāo)簽。 然后使用來(lái)自5個(gè)訓(xùn)練/內(nèi)部驗(yàn)證數(shù)據(jù)集的GSVA評(píng)分(n=2183)來(lái)生成ML模型,將來(lái)自2183個(gè)樣本的訓(xùn)練數(shù)據(jù)進(jìn)一步劃分為訓(xùn)練集(80%)和驗(yàn)證集(20%)。采用多種算法進(jìn)行一次多類(lèi)分類(lèi),預(yù)測(cè)內(nèi)型隸屬度并進(jìn)行內(nèi)部驗(yàn)證。對(duì)來(lái)自另外12個(gè)獨(dú)立數(shù)據(jù)集的983例患者樣本的基因表達(dá)譜進(jìn)行測(cè)試和外部驗(yàn)證,生成RF、SVM、logistic回歸(LR)和梯度增強(qiáng)(GB)模型的受試者工作特征(ROC)曲線(xiàn),并顯示出較高的預(yù)測(cè)能力(圖3B, C)。使用RF分類(lèi)器(在多類(lèi)和二元分析中都有效)將983例患者從測(cè)試集中分類(lèi)為8種內(nèi)型(圖3D)。另外作者還分析了隨機(jī)刪除特征時(shí)的模型性能,發(fā)現(xiàn)需要所有26個(gè)特征才能通過(guò)k-means最優(yōu)地識(shí)別8種內(nèi)型。此外,RF分類(lèi)器在兩性的隊(duì)列中觀察到所有的內(nèi)源性類(lèi)型。

圖3?機(jī)器學(xué)習(xí)算法可以高精度地預(yù)測(cè)狼瘡內(nèi)源性隸屬度

1.?復(fù)合度量LuCIS的開(kāi)發(fā)

作者將基因表達(dá)譜的信息減少到臨床指標(biāo),稱(chēng)為L(zhǎng)uCIS,以數(shù)字顯示分子異常的范圍。采用RPLR模型根據(jù)二值化GSVA富集評(píng)分計(jì)算每位患者的LuCIS值(圖4A)。然后將這些評(píng)分與8種狼瘡內(nèi)源性類(lèi)型中每個(gè)患者的位置進(jìn)行比較,并顯示每種內(nèi)源性類(lèi)型的LuCIS值增加(圖4B)。 作者計(jì)算了5個(gè)數(shù)據(jù)集中健康的非狼瘡對(duì)照組的得分 (圖4C)。發(fā)現(xiàn)最不正常的狼瘡內(nèi)型的平均LuCIS值與非狼瘡對(duì)照組沒(méi)有顯著差異,這表明LuCIS識(shí)別出最不正常的內(nèi)型與正常轉(zhuǎn)錄譜的相似性。

圖4?LuCIS總結(jié)了個(gè)體狼瘡患者分子異常的嚴(yán)重程度

1.?使用SHAP確定內(nèi)分型最重要的特征

作者使用ML對(duì)樣本進(jìn)行一對(duì)一的分類(lèi),然后使用SHAP計(jì)算每個(gè)特征對(duì)每個(gè)內(nèi)型的貢獻(xiàn)。8種內(nèi)型患者的平均絕對(duì)SHAP值揭示了對(duì)該模型有貢獻(xiàn)的前20個(gè)特征,其中主要組織相容性復(fù)合體II (MHCII)和IFN是總體上最具影響力的。抗炎、粒細(xì)胞和中性粒細(xì)胞是最顯著的內(nèi)源性H型 (圖3A),而缺乏單核細(xì)胞、抗炎和IFN的富集對(duì)最不受干擾的內(nèi)源性A型影響最大。 作者采用了七種二元分類(lèi)闡明8種內(nèi)質(zhì)型的具體特征,每種分類(lèi)將7種轉(zhuǎn)錄干擾較多的內(nèi)質(zhì)型(B-H)中的1種與最不異常的內(nèi)質(zhì)型(A)進(jìn)行比較,所有分類(lèi)器都表現(xiàn)良好。然后使用射頻分類(lèi)器的SHAP分析來(lái)描繪個(gè)體內(nèi)型與最正常狼瘡內(nèi)型(內(nèi)型A)的特征,數(shù)據(jù)顯示為區(qū)分內(nèi)型的特征,不同的特征模式區(qū)分了大多數(shù)內(nèi)型(圖5)。例如免疫異常最多的內(nèi)皮型(H)表現(xiàn)出單核細(xì)胞、中性粒細(xì)胞、TNF和IFN信號(hào)的高貢獻(xiàn)(圖5),而T細(xì)胞信號(hào)對(duì)內(nèi)皮型B的貢獻(xiàn)最大(圖5)。SHAP依賴(lài)圖詳細(xì)描述了個(gè)體特征對(duì)模型預(yù)測(cè)的各種影響,使用基尼指數(shù)(與RF分類(lèi)器公用的另一個(gè)特征重要性度量)也確認(rèn)這些結(jié)果。

圖5??SHAP分析揭示了7種異常狼瘡內(nèi)型中轉(zhuǎn)錄擾動(dòng)最顯著的特征

1.?臨床資料不確定分子內(nèi)型

作者使用k-means對(duì)ILL-2狼瘡患者的臨床元數(shù)據(jù),僅基于臨床特征確定了6個(gè)子集。另外六個(gè)子集也通過(guò)單獨(dú)使用變分自編碼器來(lái)識(shí)別,以確定深度學(xué)習(xí)算法是否能夠替代識(shí)別內(nèi)型。臨床k均值子集主要由祖先決定,而臨床自編碼器子集是祖先異質(zhì)性的。通過(guò)調(diào)整后的Rand指數(shù),臨床確定的亞群與分子內(nèi)型以及彼此存在顯著差異。作者使用了ML分類(lèi)器,使用相同的臨床數(shù)據(jù)作為特征,以確定它們是否可以預(yù)測(cè)內(nèi)分型隸屬關(guān)系,平均RF分類(lèi)器精度為32%,進(jìn)一步表明臨床特征不足以識(shí)別內(nèi)分型。

2.?SLE內(nèi)型的臨床特征

作者探究?jī)?nèi)分型成員是否與SLE的各種臨床特征相關(guān),在圖1A中識(shí)別的子集/內(nèi)型被重新分配到一個(gè)字母分類(lèi)(a-h),基于余弦相似度與最終的8個(gè)內(nèi)型(圖6)。相關(guān)元數(shù)據(jù)分析顯示,在SLEDAI、自身抗體滴度、淋巴細(xì)胞減少和血清補(bǔ)體水平方面,不同內(nèi)型患者存在顯著差異。亞群A (Z1,異常程度最低)的SLEDAI最低,自身抗體滴度最低,補(bǔ)體水平最高,而內(nèi)型E (Z3),D/G (Z4),F(xiàn)/H (Z5)和G/H (Z6)表現(xiàn)出更多的異常臨床特征(圖6A)。綜上,內(nèi)型A (Z1)表現(xiàn)出最低的疾病活動(dòng)性,E (Z3)表現(xiàn)出最大的疾病活性,其次是F/G (Z6)。與更多疾病活性相關(guān)的內(nèi)皮型的特征是漿細(xì)胞、髓細(xì)胞、中性粒細(xì)胞、炎性細(xì)胞因子和淋巴細(xì)胞減少癥的各種特征富集組合(圖第1A段)。 與其他亞組患者相比,A (Z1)組接受標(biāo)準(zhǔn)護(hù)理(SoC)藥物治療的患者在隨后的52周內(nèi)發(fā)生嚴(yán)重斑塊的頻率較低(圖6B)。內(nèi)型成員與祖先(非洲人、歐洲人或西班牙人)(圖6C)和藥物使用(口服類(lèi)固醇、硫唑嘌呤或甲氨蝶呤)之間也存在顯著關(guān)系(圖6D)。在血管炎、脫發(fā)、白細(xì)胞減少、關(guān)節(jié)炎、粘膜潰瘍、伴隨的器官系統(tǒng)和SLEDAI結(jié)構(gòu)域的總體數(shù)量等內(nèi)分型中發(fā)現(xiàn)了更細(xì)微但顯著的差異。

1.?內(nèi)源型和血統(tǒng)與SoC治療的關(guān)系

作者進(jìn)一步探究祖先和藥物使用的亞群成員存在差異的關(guān)系(圖6C-D)。當(dāng)僅聚集GSE88884的EA患者時(shí)(n=1118),觀察到的相同的六種內(nèi)型。在AA人群中也看到了類(lèi)似的結(jié)果。當(dāng)僅聚集NAA/西班牙裔患者時(shí)(n=232),從整個(gè)隊(duì)列中確定了6個(gè)內(nèi)分型中的5個(gè)。因此在每個(gè)祖先組中觀察到大多數(shù)內(nèi)型,但內(nèi)型分布因祖先而異。 作者使用免疫抑制劑分層的患者中重復(fù)了這些分析,并比較了整個(gè)原型隊(duì)列(所有活躍的女性)中患者與內(nèi)型的分布。霉酚酸鹽或甲氨蝶呤聯(lián)合類(lèi)固醇治療似乎會(huì)最大程度減少內(nèi)分型G/H (Z6)。甲氨蝶呤類(lèi)固醇治療似乎也減少了E內(nèi)型(Z3)。受干擾最小的內(nèi)型A (Z1)患者的分布也隨著類(lèi)固醇和免疫抑制劑的治療而增加。綜上表明,在接受免疫抑制藥物治療的患者中,某些內(nèi)型不能被發(fā)現(xiàn)/被減少(通過(guò)余弦相似性),這意味著治療可以抑制特定內(nèi)型的出現(xiàn)。此外,治療可能對(duì)每種內(nèi)型的部分患者有所效果。

2.?分子內(nèi)分型在確定患者治療反應(yīng)可能性中的應(yīng)用

作者將k-means聚類(lèi)管道應(yīng)用于GSE88884 ILL-2的患者,并確定了6種與聯(lián)合試驗(yàn)數(shù)據(jù)集相似的內(nèi)分型(圖7A)。根據(jù)余弦相似度將內(nèi)型重新分配到A-H(圖7B)。通過(guò)SRI-5、更標(biāo)準(zhǔn)的SRI-4兩個(gè)指標(biāo)檢查了對(duì)他貝蘆單抗tabalumab的臨床反應(yīng) (圖7C, D)。通過(guò)SRI-5 (B [V2], F/H [V5]和G [V6])確定了三個(gè)反應(yīng)組,通過(guò)SRI-4 (B [V2])確定了一個(gè)反應(yīng)組。免疫活性最低的內(nèi)型(A [V1])在兩種指標(biāo)下都沒(méi)有反應(yīng)。臨床上,反應(yīng)性?xún)?nèi)型在基線(xiàn)時(shí)以淋巴細(xì)胞減少為特征,包括更多服用硫唑嘌呤的患者、更多NAA/西班牙裔患者和更少的EA患者。在隨后的52周SoC治療中,反應(yīng)性?xún)?nèi)啡肽型患者出現(xiàn)嚴(yán)重急性發(fā)作的可能性也趨于增加。

圖7??內(nèi)分型對(duì)更可能對(duì)治療有反應(yīng)的患者進(jìn)行分層

1.?LuCIS在確定耀斑和治療反應(yīng)可能性方面的應(yīng)用

最后作者確定了LuCIS值與臨床特征之間是否存在關(guān)系。首先檢查了GSE88884中LuCIS與抗dsDNA滴度、SLEDAI、血清C3和血清C4之間的相關(guān)性(圖8A-D)。LuCIS與抗dsDNA滴度或SLEDAI之間存在正相關(guān)性,而與C3或C4之間存在負(fù)相關(guān)性。接下來(lái)使用LuCIS值定義的分組來(lái)預(yù)測(cè)ILL-2試驗(yàn)中斑塊發(fā)生的可能性或?qū)Ψe極治療的反應(yīng)。根據(jù)患者的LuCIS值將患者分配到六分位,以反映聚類(lèi)管道識(shí)別的組數(shù)。在ILL-2試驗(yàn)的事后分析中,LuCIS定義得到的亞群與嚴(yán)重斑塊的可能性(圖8E)和對(duì)研究產(chǎn)品的反應(yīng)相關(guān)(圖8F, G)。

文章小結(jié)

作者依據(jù)32個(gè)免疫和炎癥相關(guān)特來(lái)識(shí)別狼瘡患者的分子內(nèi)型,利用轉(zhuǎn)錄組學(xué)數(shù)據(jù)、機(jī)器學(xué)習(xí)(ML)和當(dāng)代生物信息學(xué),并開(kāi)發(fā)了狼瘡細(xì)胞和免疫評(píng)分(LuCIS)系統(tǒng),以估計(jì)患者的狼瘡相關(guān)免疫活性。這應(yīng)該是第一個(gè)基于轉(zhuǎn)錄組學(xué)的分子內(nèi)分型方法,具有分期和預(yù)后意義,有助于促進(jìn)個(gè)性化醫(yī)療~ 如果你還苦惱于生信分析沒(méi)有思路,或者嫌分析方法太過(guò)簡(jiǎn)單、太過(guò)老套,想要?jiǎng)?chuàng)新思路的,或者對(duì)單細(xì)胞分析、多組學(xué)聯(lián)合分析等方向感興趣的小伙伴快來(lái)聯(lián)系小云吧!

一區(qū)10分+的免疫疾病分型,老司機(jī)親自教你怎樣開(kāi)機(jī)器學(xué)習(xí)的快車(chē)!的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
友谊县| 磐安县| 诏安县| 习水县| 抚顺县| 浠水县| 远安县| 张家港市| 郎溪县| 惠来县| 梨树县| 三明市| 嵊泗县| 容城县| 太谷县| 张掖市| 海口市| 平原县| 灯塔市| 耿马| 彭山县| 如东县| 威远县| 涿鹿县| 广南县| 新巴尔虎右旗| 临泉县| 广南县| 望都县| 涞源县| 海南省| 博客| 和硕县| 阳高县| 满城县| 周至县| 贵德县| 镇康县| 泸定县| 梁平县| 成都市|