科研代碼大全|小云課堂之python簡單處理fasta序列

大家好,本期小云將向大家介紹簡單使用python處理fasta序列,接下來跟著小云一起來學(xué)習(xí)一下吧!
1.?認(rèn)識fasta序列
Fasta序列包含兩行,分別為id和序列,如下圖。給了四條fasta序列,小云會(huì)將這四條數(shù)據(jù)放在一個(gè)名為case格式為.txt的文件中,然后打包給大家練手

2.如何導(dǎo)入數(shù)據(jù),并統(tǒng)計(jì)序列總數(shù)
找到數(shù)據(jù)存放位置,得到其絕對路徑:單擊文件右鍵,點(diǎn)擊屬性即可得到。比如case在小云電腦的絕對路徑如下:C:/Users/Admin/Desktop/case.txt

然后使用代碼將數(shù)據(jù)讀入,并進(jìn)行處理:


該代碼可以統(tǒng)計(jì)總共有多少條序列。
首先是:

打開文件
然后是

將文件case所有內(nèi)容讀入并存放在t中

初始化一個(gè)數(shù)值為零的變量count用于計(jì)數(shù)



For循環(huán)的作用是是對存放在文件句柄t的數(shù)據(jù)進(jìn)行逐行編列,然后使用if語句判斷是否含有“>”大于符號,含有該符號,則count數(shù)值加一,遍歷完數(shù)據(jù)后,序列總數(shù)將存放在變量count中。接著使用

關(guān)閉文件句柄
最后使用

打印出總共有多少條序列。
3.?小云教大家怎么隨機(jī)抽出指定數(shù)目的fasta序列,這里定義了一個(gè)randomselect函數(shù)


只需要改變你想要的序列條數(shù),主函數(shù)的文件的路徑即可實(shí)現(xiàn)。
?以上就是本期的內(nèi)容啦,我們下期再見!這里小云還想推薦一個(gè)小工具:單細(xì)胞數(shù)據(jù)繪制小提琴圖(http://www.biocloudservice.com/788/788.php),在線運(yùn)行,可以使用加載的數(shù)據(jù)來實(shí)踐哦。
