爾云間生信代碼|基于癌癥分類(lèi)預(yù)測(cè)的標(biāo)志物特征提取的SVM-RFE分析代碼
科研有捷徑,輸入代碼,一鍵獲取科研成果!就是這么省事,來(lái)具體看下有多方便!
搜索http://985.so/a9kb查看全部代碼(目前共計(jì)50+持續(xù)新增中),也可以點(diǎn)擊右側(cè)【目錄】,可以看到更多有趣的代碼;真香提示:文末可以知道如何獲取代碼~?
支持向量機(jī)遞歸特征消除(簡(jiǎn)稱(chēng)SVM-RFE)是一種基于Embedded方法。廣泛用于模式識(shí)別,機(jī)器學(xué)習(xí)等領(lǐng)域,SVM-RFE采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,同時(shí)最小化經(jīng)驗(yàn)誤差,以此提高學(xué)習(xí)的性能。而SVM-RFE是一個(gè)基于SVM的最大間隔原理的序列后向選擇算法。它通過(guò)模型訓(xùn)練樣本,然后對(duì)每個(gè)特征進(jìn)行得分進(jìn)行排序,去掉最小特征得分的特征,然后用剩余的特征再次訓(xùn)練模型,進(jìn)行下一次迭代,最后選出需要的特征數(shù)。因此,本代碼SVM-RFE就是在癌癥分類(lèi)預(yù)測(cè)時(shí)用于標(biāo)志物特征提取。
設(shè)置參數(shù)少,只需要輸入有分類(lèi)信息的基因表達(dá)數(shù)據(jù),代碼將自行執(zhí)行序列后向選擇算法,對(duì)每個(gè)特征進(jìn)行得分進(jìn)行排序并輸出格式為CSV表格,同時(shí)還可以繪制特征的真實(shí)值和錯(cuò)誤率變化曲線(xiàn)圖。
使用方法:
Rscript?SVMRFE.R????-input=?
參數(shù)說(shuō)明:
USAGE:
SVMRFE.R?-input=<input>
PARAMETERS:
-input???the?expression?data,the?first?column?is?sample?name,the?second??column?is?group,the?third?column?is?gene?symbol,input?txt?format.
操作步驟:
1、打開(kāi)命令行界面,輸入“Rscript?SVMRFE.R”調(diào)閱幫助文檔,確定該程序所需的輸入文件。
2、用戶(hù)根據(jù)幫助文檔中的參數(shù)說(shuō)明內(nèi)容,對(duì)參數(shù)進(jìn)行設(shè)置。這里,必須輸入?yún)?shù)有1個(gè),分別是-input,表示表達(dá)數(shù)據(jù),第一列是樣本名稱(chēng),第二列是分組,第三列是基因符號(hào),輸入txt格式。
3、完成參數(shù)提交后,按下回車(chē)鍵,整個(gè)程序即正式開(kāi)始進(jìn)入執(zhí)行。每步執(zhí)行內(nèi)容都會(huì)給出提示。程序執(zhí)行完畢后,界面會(huì)顯示”P(pán)rogram?execution?is?completed<span data-raw-text="" "="" data-textnode-index-1661239480900="84" data-index-1661239480900="781" class="character" style="margin: 0px; padding: 0px;">"結(jié)束語(yǔ)。
流程圖:

結(jié)果展示:

svm-accuracy
該圖表示每個(gè)基因預(yù)測(cè)真實(shí)值變化曲線(xiàn)

svm-error.
該圖表示每個(gè)基因預(yù)測(cè)錯(cuò)誤值變化曲線(xiàn)

feature_svm.
該表格表示每個(gè)基因的權(quán)重得分
如需代碼及示例數(shù)據(jù)等文件,請(qǐng)掃碼聊天框回復(fù) “B38”領(lǐng)??!
寫(xiě)在文末:
如果您近期想做生信方面的文章而苦于沒(méi)有思路,或者不知道如何來(lái)入手生信分析,或者兌具體的某一個(gè)圖有作圖需求,都可以?huà)叽a咨詢(xún)小云,我們有專(zhuān)業(yè)的技術(shù)團(tuán)隊(duì),生信熱點(diǎn)思路設(shè)計(jì)、生信分析、熱點(diǎn)方向生信挖掘等,如有需要,可掃碼下方二維碼了解詳情:? 作者:爾云間 https://www.bilibili.com/read/cv18127077 出處:bilibili
