云平臺(tái) | 歐易云ROC分析曲線
背景知識(shí)介紹
根據(jù)特征數(shù)據(jù)豐度,如差異物種或生物標(biāo)記物等,將數(shù)據(jù)拆分為訓(xùn)練集及驗(yàn)證集,先對(duì)訓(xùn)練集構(gòu)建隨機(jī)森林模型,再用此模型預(yù)測(cè)驗(yàn)證集,構(gòu)建ROC曲線。
ROC曲線的橫坐標(biāo)是false positive rate(FPR),縱坐標(biāo)是true positive rate(TPR)。用于展示構(gòu)建的分類器模型在驗(yàn)證集上的表現(xiàn),從而評(píng)估該模型的效能。
歐易云平臺(tái)-ROC分析曲線
2.1 ROC分析曲線小工具。
將特征數(shù)據(jù)表文件(包括微生物豐度表,基因表達(dá)譜,臨床數(shù)據(jù)表)結(jié)合分組文件,可以對(duì)單一特征或復(fù)合特征繪制對(duì)應(yīng)的ROC曲線??蛇x擇進(jìn)行10折交叉驗(yàn)證,后對(duì)10折進(jìn)行平均處理得最終ROC曲線。具體輸入文件格式,請(qǐng)參考頁面右側(cè)的使用說明。
圖1 | 特征數(shù)據(jù)表文件示例
(行名為單個(gè)特征,列名為樣本名)
2.2繪圖特征選擇。
選擇復(fù)合特征,則構(gòu)建單個(gè)模型,該模型構(gòu)建基于數(shù)據(jù)表中的全部特征,因此結(jié)果中含有單個(gè)ROC曲線。若選擇單特征繪圖,則針對(duì)數(shù)據(jù)表內(nèi)每個(gè)特征構(gòu)建模型,且繪制對(duì)應(yīng)的ROC曲線。
2.3 其他常用參數(shù)選擇。
用戶可以自行選擇是否進(jìn)行10折交叉驗(yàn)證。同時(shí)提供了多種繪圖相關(guān)參數(shù),包括選擇是否在ROC結(jié)果圖中展示具體的AUC值。字體類型選擇。若選擇進(jìn)行了10折交叉驗(yàn)證,則可選擇在結(jié)果圖上展示全部10折交叉驗(yàn)證結(jié)果與標(biāo)準(zhǔn)差。同時(shí)參考線與ROC曲線的顏色也支持用戶自定義。
2.4 結(jié)果說明。
ROC曲線橫坐標(biāo)為假陽性率,縱坐標(biāo)為真陽性率,藍(lán)色曲線為10折后取的平均曲線,AUC為曲線下面積,陰影部分為上下1個(gè)標(biāo)準(zhǔn)差。AUC值越接近1代表模型效能越好。越接近于0.5,則代表該模型真實(shí)性較低,更趨近與隨機(jī)分類。
歡迎百度搜索歐易生物——訪問歐易生物官網(wǎng)——了解云平臺(tái)技術(shù)
猜你想看
1、超強(qiáng)攻略!歐易云平臺(tái)miRanda靶基因預(yù)測(cè)繪圖工具你值得擁有!
2、誰不愛?一個(gè)運(yùn)行更快的云平臺(tái)
3、鼠標(biāo)一點(diǎn),輕松完成各種常見序列處理!
4、技術(shù)指南 | CUT&Tag技術(shù)大放送,Q&A助力了解詳情
原創(chuàng)聲明:本文由歐易生物(OEBIOTECH)學(xué)術(shù)團(tuán)隊(duì)報(bào)道,本文著作權(quán)歸文章作者所有。歡迎個(gè)人轉(zhuǎn)發(fā)及分享,未經(jīng)作者的允許禁止轉(zhuǎn)載。