有我在,別害怕!利用DNAMAN進(jìn)行核酸比對(duì)的教程來(lái)啦~
爾云間? 一個(gè)專門(mén)做科研的團(tuán)隊(duì)
? ?
歡迎點(diǎn)贊+收藏+關(guān)注

DNAman是一款專業(yè)的分子生物學(xué)軟件,可以用于DNA序列分析、比對(duì)、修剪、重組、克隆等操作。
首先導(dǎo)入比對(duì)序列,小果還是用上次做進(jìn)化樹(shù)用到的序列:通過(guò)NCBIhttps://www.ncbi.nlm.nih.gov/獲取尼羅羅非魚(yú)(Oreochromis niloticus)、斑點(diǎn)雀鱔(Lepisosteus oculatus)、青鳉(Oryzias latipes)、紅鰭東方鲀(Takifugu rubripes)、斑馬魚(yú)(Danio rerio)、小鼠(Mus musculus)和人(Homo sapiens)的SOCS1基因fasta序列。
打開(kāi)DNAman9軟件,選擇“Sequence”菜單下的“Align sequences”選項(xiàng)。
在“Align sequences”窗口中,點(diǎn)擊“Mutiple?Sequence?Alignment”按鈕

?

注意最下方導(dǎo)入的序列是DNA序列還是蛋白序列,勾選相應(yīng)的即可,點(diǎn)擊右側(cè)File導(dǎo)入fasta序列,下一步

繼續(xù)下一頁(yè),在這個(gè)界面一般默認(rèn)即可

?

???* K-tuple的大小一般設(shè)置在2-6之間,具體取決于序列的長(zhǎng)度和變異性。通常情況下,較短的K-tuple能夠更好地捕捉序列中的局部相似性,但可能會(huì)在比對(duì)過(guò)程中產(chǎn)生誤配。而較長(zhǎng)的K-tuple則能夠更好地區(qū)分序列的差異,但可能會(huì)錯(cuò)過(guò)一些相似性區(qū)域。
?????*Gap penalty和gap extension penalty:這兩個(gè)參數(shù)控制空位的罰分,即空位出現(xiàn)的懲罰程度。一般情況下,gap penalty的值應(yīng)該比gap extension penalty高,因?yàn)樵趯?shí)際生物序列中,空位出現(xiàn)的概率較低。建議初始值分別設(shè)置為10和0。
???* delay divergent seqs%"是多序列比對(duì)中的一個(gè)參數(shù),其作用是控制在比對(duì)過(guò)程中跳過(guò)高度分歧的序列,以減少這些序列對(duì)比對(duì)結(jié)果的影響。
完成以后等待結(jié)果,在這個(gè)窗口中,可以查看序列的比對(duì)結(jié)果,包括比對(duì)得分、相似性矩陣、序列的同源性等信息。
可以使用“File”菜單下的“Save as”選項(xiàng)將比對(duì)結(jié)果保存為文本文件,也可以選中結(jié)果后使用“Edit”菜單下的“Copy”選項(xiàng)將比對(duì)結(jié)果復(fù)制到剪貼板中,以便于在其他軟件中進(jìn)行分析和處理。

到這里核酸比對(duì)就結(jié)束啦,可以看到保守性比較較高的區(qū)域都用相同的色彩標(biāo)記出來(lái)了,移動(dòng)上方的紅色框線可以查看不同區(qū)域。
?
如果你還在為生信分析苦惱,苦苦學(xué)習(xí)卻不得要領(lǐng),一定要試一下這個(gè)線上平臺(tái),什么circos圖、小提琴圖、曼哈頓圖只要上傳數(shù)據(jù)統(tǒng)統(tǒng)不在話下!
?
生信人R語(yǔ)言學(xué)習(xí)必備
立刻擁有一個(gè)Rstudio賬號(hào)
開(kāi)啟升級(jí)模式吧
(56線程,256G內(nèi)存,個(gè)人存儲(chǔ)1T)
往期代碼:
【1】lncRNA的拷貝數(shù)變異下游相關(guān)分析
【2】R可視化:ggstatsplot包—科研界的美圖秀秀
【3】隨機(jī)森林算法用于分類預(yù)測(cè)和篩選診斷標(biāo)志物
【4】基于本地Java版GSEA的輸出結(jié)果整合多個(gè)通路到一張圖
【5】基于嶺回歸模型和基因表達(dá)矩陣估算樣本對(duì)藥物反應(yīng)的敏感性
【6】基于R包NMF對(duì)樣本進(jìn)行分型分析
【7】DALEX包用于探索、解釋和評(píng)估模型;分析不同特征變量對(duì)響應(yīng)變量的影響
【8】根據(jù)腫瘤突變負(fù)荷TMB進(jìn)行KM生存分析尋找最佳的cutoff
【9】基于單樣本富集分析算法評(píng)估組織中的免疫細(xì)胞浸潤(rùn)水平
【10】代碼分享│什么?你還在用散點(diǎn)圖來(lái)可視化數(shù)據(jù)之間的相關(guān)性
【11】代碼分享│診斷列線圖、校準(zhǔn)曲線、決策曲線和臨床影響曲線的構(gòu)建
【12】代碼分享│你了解基因的動(dòng)態(tài)變化模式嗎
【13】代碼分享│生物信息分析之SCI熱門(mén)圖表-復(fù)雜熱圖
【14】代碼分享│生物信息分析之SCI熱門(mén)圖表-火山圖
【15】代碼分享│生物信息分析之SCI熱門(mén)圖表-箱型圖和小提琴圖
【16】代碼分享│深度學(xué)習(xí)-人工神經(jīng)網(wǎng)絡(luò)(ANN)的構(gòu)建
【17】代碼分享│R可視化:高分文章繪圖之基于RCircos包的多類型圈圖繪制
【18】代碼分享│R可視化:基因與功能之間的關(guān)系--GO功能富集網(wǎng)絡(luò)圖繪制
【19】代碼分享│生物信息分析之SCI熱門(mén)圖表—KM曲線和tROC曲線
【20】代碼分享│R可視化:腫瘤預(yù)后模型之Cox回歸分析后用R語(yǔ)言繪制森林圖
【21】代碼分享│生物信息分析之SCI熱門(mén)圖表—相關(guān)性熱圖和散點(diǎn)圖
【22】代碼分享│生信分析之R語(yǔ)言分析相關(guān)性及可視化的N種風(fēng)格
【23】代碼分享│TCGA數(shù)據(jù)獲取有困難,不會(huì)預(yù)處理,學(xué)習(xí)起來(lái)
【24】代碼分享│機(jī)器學(xué)習(xí)-支持向量機(jī)遞歸特征消除(SVM-RFE)的構(gòu)建
【25】代碼分享│R可視化:對(duì)兩個(gè)矩陣進(jìn)行相關(guān)性可視化分析
【26】GEO數(shù)據(jù)庫(kù)多數(shù)據(jù)集差異分析整合利器RRA,再也不用糾結(jié)去除批次效應(yīng)
【27】你與生信大佬的距離,只差2分鐘搞定預(yù)后模型構(gòu)建和性能評(píng)估
【28】9+SCI純生信,模型構(gòu)建中的“流量明星”,你不得不知的LASSO
【29】手把手教你畫(huà)美觀大氣的lasso回歸模型圖,為你的SCI增磚添瓦
【30】R可視化:clusterProfiler包做組間比較GO富集圖
【31】代碼分享|R可視化:復(fù)雜熱圖繪制技巧之熱圖中添加柱狀圖
【32】代碼分享——基于基因突變信息分析腫瘤突變負(fù)荷
【33】代碼分享│富集不到想要的通路?別放棄呀,試試GSEA
【34】代碼分享│還在用PCA做降維聚類嗎?最強(qiáng)降維模型tSNE--你值得擁有
【35】代碼分享│GSVA:原來(lái)功能通路也能做差異分析!
【36】代碼分享│Slingshot:你不知道的單細(xì)胞擬時(shí)序分析還有它
【37】基于基因功能注釋信息挖掘關(guān)鍵作用基因
【38】基于癌癥分類預(yù)測(cè)的標(biāo)志物特征提取的SVM-RFE分析代碼
【39】依據(jù)表型數(shù)據(jù)基于無(wú)監(jiān)督聚類算法對(duì)研究群體進(jìn)行分層聚類分析
【40】基于穩(wěn)健排序整合算法對(duì)多數(shù)據(jù)集進(jìn)行整合及可視化
【41】基于基因表達(dá)譜估算樣本免疫基質(zhì)評(píng)分和腫瘤純度
【42】自動(dòng)化繪制LASSO算法回歸模型圖
【43】用于臨床診斷和臨床決策影響的DCA分析
【44】基于樣本預(yù)后生存信息和臨床因素用于評(píng)價(jià)不同模型的一致性指數(shù)軟件
【45】用于探索、解釋和評(píng)估模型的DALEX殘差分析軟件
【46】基于細(xì)菌群落功能豐度結(jié)果進(jìn)行差異功能分析及可視化
【47】基于基因差異分析結(jié)果繪制其在染色體上的分布
【48】利用逐步回歸法篩選特征基因構(gòu)建Cox風(fēng)險(xiǎn)模型分析
【49】基于Immune Subtype Classifier進(jìn)行腫瘤免疫亞型分類
【50】不同物種之間的同源基因名稱轉(zhuǎn)換分析
【51】基于逐步多因素cox回歸篩選預(yù)后標(biāo)記基因并構(gòu)建風(fēng)險(xiǎn)評(píng)分模型
【52】基于表達(dá)信息挖掘與關(guān)注基因密切相關(guān)的基因
【53】基因組學(xué)基因名稱修正分析
【54】基于Spearman算法構(gòu)建關(guān)聯(lián)網(wǎng)絡(luò)
【55】基于線性建模方法對(duì)代謝組和轉(zhuǎn)錄組數(shù)據(jù)整合分析
【56】基于lasso回歸模型方法篩選特征基因
【57】基于線性建模方法對(duì)代謝組和轉(zhuǎn)錄組數(shù)據(jù)整合分析
【58】基于參數(shù)型經(jīng)驗(yàn)貝葉斯算法和支持向量機(jī)(SVM)篩選疾病亞型特征基因
【59】基于LDA(線性判別分析)算法的微生物biomarker的篩選
【60】基于R包xCell計(jì)算64種免疫細(xì)胞相對(duì)含量及下游可視化
【61】基于甲基化數(shù)據(jù)評(píng)估腫瘤純度及下游可視化
【62】基于DiffCorr包識(shí)別不同表型下的差異共表達(dá)關(guān)系對(duì)
【63】基于逆累計(jì)分布函數(shù)識(shí)別顯著偏差通路
【64】基于差異基因?qū)ν返挠绊懲诰蜿P(guān)鍵通路
【65】基于高通量數(shù)據(jù)的樣本相似性分析

“生信果”,生信入門(mén)、R語(yǔ)言、生信圖解讀與繪制、軟件操作、代碼復(fù)現(xiàn)、生信硬核知識(shí)技能、服務(wù)器、生物信息學(xué)的教程,以及基于R的分析和可視化等原創(chuàng)內(nèi)容,一起見(jiàn)證小白和大佬的成長(zhǎng)。