探“云”指南:免費(fèi)快捷LEfSe在線分析小工具操作指南!
在微生物多樣性分析中,LEfSe分析自“出生”以來就備受青睞,LEfSe能用于從高維數(shù)據(jù)中尋找組間差異的biomarker,讓您能夠識別不同豐度的特征以及相關(guān)聯(lián)的類別。您是否正遇到這樣的難題呢?快來歐易云平臺,我們已經(jīng)為您準(zhǔn)備好免費(fèi)便捷的LEfSe在線分析小工具,心動(dòng)不如行動(dòng),馬上試試吧!
功能介紹
LEfSe分析即LDA Effect Size分析,是一種用于發(fā)現(xiàn)和解釋高維度數(shù)據(jù)生物標(biāo)識(基因、通路和分類單元等)的分析工具,可以進(jìn)行兩個(gè)或多個(gè)分組的比較,它強(qiáng)調(diào)統(tǒng)計(jì)意義和生物相關(guān)性,能夠在組與組之間尋找具有統(tǒng)計(jì)學(xué)差異的生物標(biāo)識(Biomarker)。
原理介紹
A.首先在多組樣本中采用的非參數(shù)因子Kruskal-Wallis秩和檢驗(yàn)檢測不同分組間豐度差異顯著的物種;
B.再利用Wilcoxon秩和檢驗(yàn)檢查在顯著差異物種在分組亞組之間是否都趨同于同一分類 (如果存在分組亞組時(shí));
C.最后用線性判別分析(LDA)對數(shù)據(jù)進(jìn)行降維和評估差異顯著的物種的影響力(即LDA score)(也可以利用支持向量機(jī)分析)。
文件要求
(請嚴(yán)格按照示例文件格式進(jìn)行上傳)
01
層次豐度文件
第一列為物種名,隨后為樣本分析名,各列對應(yīng)值為物種在樣本中的相對豐度,每組必須有生物學(xué)重復(fù),且不少于3個(gè)樣本(支持txt、xls、xlsx、csv 格式)。
圖1 | 層次豐度文件格式示例圖
02
樣本分組信息文件
第一列為樣本分析名,第二列為樣本的分組名稱,每組必須有生物學(xué)重復(fù),且不少于3個(gè)樣本(支持txt、xls、xlsx、csv 格式)。
圖2 | 樣本分組信息文件格式示例圖
03
特征表
(1) Biomarker : Biomarker 名稱
(2) Logarithm value?: 組間最大平均豐度的log10值,如果平均豐度小于10則按10來計(jì)算
(3) Groups : 組名
(4) LDA_value : LDA值
(5) p-value :??Kruskal-Wallis 秩和檢驗(yàn)p值,若不是?Biomarker則用“-”表示
每組必須有生物學(xué)重復(fù),且不少于3個(gè)樣本(支持txt、xls、xlsx、csv格式,但可能會(huì)存在輸入文件編碼格式的問題)。
圖3 | 特征表格式示例圖
參數(shù)調(diào)整
01
主要參數(shù)
圖4 | 主要參數(shù)
02
常用參數(shù)
圖5 | 常用參數(shù)
作圖步驟
01
上傳文件
①請于主要參數(shù)中的層次豐度文件、樣本與分組對應(yīng)文件處上傳您所要進(jìn)行分析的文件,如果此文件未上傳,您將無法得出結(jié)果。上傳成功后,將會(huì)于“選擇文件”后顯示您上傳的文件名;
此處為上傳成功示例:
圖6 | 層次豐度文件與樣本與分組對應(yīng)文件上傳成功示例
②如果您需上傳特征表重新繪圖,則可在步驟①后,調(diào)整特征表格式于常用參數(shù)中的是否需要上傳特征表重新畫圖處上傳。上傳成功后,將會(huì)于“選擇文件”后顯示您上傳的文件名。請您注意:如果上傳LEfSe_table.res.xls表,則會(huì)直接根據(jù)該特征表繪圖,如果未上傳此表,則會(huì)根據(jù)您上傳的層次豐度文件與樣本與分組對應(yīng)文件重新計(jì)算。
此處為上傳成功示例:
圖7 | 特征表上傳成功示例
02
調(diào)整其他參數(shù)
常用參數(shù)中的其他參數(shù)均為默認(rèn)數(shù)值,您可根據(jù)自己的需求進(jìn)行修改,點(diǎn)擊“重置”則包括文件在內(nèi)的所有參數(shù)全部清空。
①Kruskal-Wallis檢驗(yàn)過濾閾值:α=0.05是指檢驗(yàn)水準(zhǔn),若P<0.05則認(rèn)為差異顯著,默認(rèn)預(yù)設(shè)值為0.05,只有P值小于0.05才會(huì)在圖中展示;
②Wilcoxon檢驗(yàn)過濾閾值:α=0.05是指檢驗(yàn)水準(zhǔn),若P<0.05則認(rèn)為差異顯著,默認(rèn)預(yù)設(shè)值為0.05,只有P值小于0.05才會(huì)在圖中展示;
③LDA_score過濾閾值:默認(rèn)預(yù)設(shè)值為2.0,只有LDA值的絕對值大于2才會(huì)在圖中展示;
④柱狀圖標(biāo)題、柱狀圖標(biāo)題字號、柱狀圖Biomarker字號、柱狀圖圖例字號、柱狀圖圖例與畫框的距離、柱狀圖寬度、柱狀圖左空間、柱狀圖右空間:柱狀圖標(biāo)題可按需填寫或空白,柱狀圖圖例與畫框的距離一般取值范圍為0~3,主要兼容分組數(shù)太多導(dǎo)致圖例畫不全的問題。其他參數(shù)可接受默認(rèn)設(shè)置或自定義輸入;
⑤進(jìn)化分支圖標(biāo)題、進(jìn)化分支圖標(biāo)題字號、進(jìn)化分支圖圖片高度、進(jìn)化分支圖圖片寬度、進(jìn)化分支圖Biomarker圖例字號、進(jìn)化分支圖分組圖例字號、進(jìn)化分支圖左空間、進(jìn)化分支圖右空間:可接受默認(rèn)設(shè)置或自定義輸入;
⑥進(jìn)化分支圖起始層級-繪圖、進(jìn)化分支圖終止層級-繪圖:進(jìn)化分支圖中由內(nèi)至外輻射的圓圈代表了由門至屬(或種)的分類級別。默認(rèn)起始層級為“門”,在最內(nèi)側(cè),默認(rèn)終止層級為“科”,在最外側(cè),可接受默認(rèn)設(shè)置或在下拉菜單中進(jìn)行其他選擇。
圖8 | 進(jìn)化分支圖起始、終止層級-繪圖均選擇默認(rèn)結(jié)果示例
圖9 | 進(jìn)化分支圖起始層級-繪圖改為“目”結(jié)果示例
⑦進(jìn)化分支圖起始層級-圖例、進(jìn)化分支圖終止層級-圖例:進(jìn)化分支圖的圖例默認(rèn)起始層級為“綱”,默認(rèn)終止層級為“科”,可接受默認(rèn)設(shè)置或在下拉菜單中進(jìn)行其他選擇。
⑧輸出文件類型:默認(rèn)為pdf類型,其他類型有png,svg,可接受默認(rèn)設(shè)置或在下拉菜單中進(jìn)行其他選擇。如果您選擇png,點(diǎn)擊“結(jié)果下載”,所得文件中圖片僅有png格式;如果您選擇pdf,點(diǎn)擊“結(jié)果下載”,所得文件中圖片包含pdf、png兩種格式;如果您選擇svg,點(diǎn)擊“結(jié)果下載”,所得文件中圖片包含svg、png兩種格式。不論您選擇何種輸出文件類型,都會(huì)有png格式的圖片直接顯示在右側(cè)工作區(qū);
⑨DPI:圖片的分辨率,默認(rèn)為300,可接受默認(rèn)設(shè)置或自定義輸入;
⑩過濾Ambiguous_taxa:是否過濾輸入文件中包含Ambiguous_taxa的記錄,默認(rèn)為“否,可接受默認(rèn)設(shè)置或在下拉菜單中選擇“是”。
03
最終提交
所有參數(shù)設(shè)置成功后點(diǎn)擊“提交”,在主要參數(shù)界面或常用參數(shù)界面點(diǎn)擊等效,您只需在任意界面點(diǎn)擊一次即可,右側(cè)工作區(qū)將提示您所需時(shí)間。
如圖所示區(qū)域:
圖10 | 工具預(yù)估耗時(shí)提示處
結(jié)果分析
(圖片展示情況為使用示例文件以及其他參數(shù)選擇默認(rèn))
01
結(jié)果展示及下載
分析結(jié)果圖將會(huì)在此處展示,您可以點(diǎn)擊左上角的“結(jié)果下載”將結(jié)果保存至本地。
圖11 | 結(jié)果展示處
結(jié)果下載成功示例:點(diǎn)擊“結(jié)果下載”您將會(huì)得到如下壓縮包,您所得壓縮包名稱與下面示例名稱不同為正?,F(xiàn)象。
圖12 | 結(jié)果下載成功示例
解壓縮后得到以下文件:如果您如果需要上傳特征表重新畫圖,請?jiān)诖颂幭螺dLEfSe_table.res.xls文件,其他步驟請參考上述5、作圖步驟→5.1、上傳文件→②。
圖13 | 結(jié)果文件夾內(nèi)容示例
02
結(jié)果說明
①LDA值分布柱狀圖:
展示了LDA score大于設(shè)定值有差異的物種,即具有統(tǒng)計(jì)學(xué)差異的biomaker。實(shí)際顯示的是不同組中豐度有顯著差異的物種,柱狀圖的長度代表顯著差異物種的影響大小。請您注意:柱狀圖圖例分組個(gè)數(shù)有可能少于實(shí)際樣本分組個(gè)數(shù),這是由于柱狀圖中實(shí)際顯示的是Biomarker高豐度的組,低豐度的組不顯示,屬于正?,F(xiàn)象。?
圖14 | LDA值分布柱狀圖結(jié)果示例
②進(jìn)化分支圖:
由內(nèi)至外輻射的圓圈代表了由門至屬(或種)的分類級別。在不同分類級別上的每一個(gè)小圓圈代表該水平下的一個(gè)分類,小圓圈直徑大小與相對豐度大小呈正比。圖中英文字母表示的物種名稱在右側(cè)圖例中進(jìn)行展示。
著色原則:無顯著差異的物種統(tǒng)一著色為黃色,差異物種 Biomarker跟隨組進(jìn)行著色,紅色節(jié)點(diǎn)表示在紅色組別中起到重要作用的微生物類群,綠色節(jié)點(diǎn)表示在綠色組別中起到重要作用的微生物類群,其它圈顏色意義類同。
圖15 | 進(jìn)化分支圖結(jié)果示例
歷史記錄
點(diǎn)擊云平臺界面右上角的“登錄”,您可以進(jìn)行免費(fèi)注冊,用您注冊的賬號登錄歐易云平臺個(gè)人中心,在此之后使用云平臺所有的小工具將會(huì)存有記錄。您可以點(diǎn)擊下圖中的“歷史記錄”查看使用LEfSe分析小工具的使用記錄,或點(diǎn)擊右上角“個(gè)人中心”查看所有小工具任務(wù)記錄。
圖16 | 歷史記錄示例
常見FAQ
請問我已經(jīng)有特征表,還需要上傳層次豐度文件與樣本與分組對應(yīng)文件嗎?您好,首先感謝您的咨詢。如果您已有特征表,仍需上傳層次豐度文件與樣本與分組對應(yīng)文件,這是小工具默認(rèn)步驟。但是如果您上傳特征表,則會(huì)直接根據(jù)特征表直接畫圖,如果不上傳此表,則根據(jù)層次豐度文件與樣本與分組對應(yīng)文件進(jìn)行繪圖。
請問用特征表進(jìn)行繪圖和用層次豐度文件以及樣本與分組對應(yīng)文件繪圖,結(jié)果有差別嗎?
您好,首先感謝您的咨詢。這兩種方法的結(jié)果沒有差別。如果您上傳特征表進(jìn)行繪圖,工具耗費(fèi)時(shí)間將會(huì)有所縮短。
以上就是LEfSe分析小工具的使用方法,歐易云平臺還有更多精彩等您解鎖,總有一款滿足您的期待……
如果你還在為不知如何繪制SCI圖表而憂愁,還在為畢業(yè)論文制圖效率低下美觀度不滿意而焦心,或者想要找到一個(gè)高效制圖的集中地……
詳細(xì)技術(shù)請?jiān)L問歐易生物官網(wǎng)
?
百度搜索歐易生物(oebiotech)
?
了解更多多組學(xué)技術(shù)