「生信技能樹」2021公益課(linux基礎(chǔ) & conda)

看完啦!
老師聲音很好聽,講得也很棒,普通話也好,可以推薦!
BTW,由于是自用筆記,所以自己已經(jīng)會(huì)的東西就沒有記錄啦,只記錄了自己有點(diǎn)記不清或者新學(xué)到的東西嘿嘿嘿!
新姿勢(shì):
- wget:-c, --continue 斷點(diǎn)續(xù)傳(恢復(fù)獲取部分下載的文件)
- source ~/.bashrc:刷新環(huán)境配置,即重新加載一下 ~/.bashrc 讓修改生效,也可用 . ~/.bashrc ,. 等同于source
- 軟鏈接:ln,分為軟鏈接(常用)和硬鏈接(默認(rèn)),軟鏈接相當(dāng)于Windows下的快捷方式。ln不加參數(shù)即為硬鏈接,加上-s參數(shù)即為軟鏈接。常見用法:ln -s TARGET[絕對(duì)路徑] DIRECTORY
尚未理解:
- 巧用alias?19-conda的進(jìn)階技巧 P19 - 11:23?
- 刪除沒有使用的包?19-conda的進(jìn)階技巧 P19 - 13:06?
快捷方式:
Ctrl + U 剪切光標(biāo)位置到行首的字符
Ctrl + E 回到行尾
Ctrl + A 回到行首
Ctrl + W 剪切一個(gè)單詞
Ctrl + Y 粘貼命令行剪切的內(nèi)容
Ctrl + K 剪切光標(biāo)位置到行首的字符
一些命令:
cd - # 返回上次的工作目錄
ls -t # 以時(shí)間排序列出當(dāng)前目錄下文件
ls -R # 遞歸目錄列出文件
ls -d # 顯示目錄本身,而非目錄下文件
ls ./*txt # 列出當(dāng)前目錄下以txt結(jié)尾的文件
ls ../ # 列出上層目錄的文件
ls -l # 列出當(dāng)前目錄下文件的詳細(xì)信息
mkdir -p # 遞歸創(chuàng)建目錄
mv # 移動(dòng)或重命名
cp -r # 復(fù)制
rm -rfi # 遞歸刪除/不顯示警告訊息/刪除前詢問用戶
head/tail # 查看文件前/后n行,默認(rèn)10行。head常結(jié)合管道符用于控制輸出行數(shù)。(管道符:|)
more # 逐頁查看,按空格翻頁,按回車換行,q退出
less -S # 單行顯示
less -N # 顯示行號(hào)
zless # 查看壓縮文件
cat # 查看文本文件內(nèi)容,輸出到屏幕

tree # 以樹的結(jié)構(gòu)展示文件目錄結(jié)構(gòu)

tar # 解壓




wc # 統(tǒng)計(jì)文本

cut # 文本切割


sort # 排序

uniq # 去除重復(fù)行(只去除相鄰的重復(fù)行),-c 統(tǒng)計(jì)每個(gè)字符串連續(xù)出現(xiàn)的行數(shù)
paste # 文本合并,-d 指定分隔符,-s 按行合并

tr # 字符替換,-d 刪除指定字符,-s 縮減連續(xù)重復(fù)字符
文件夾詳解:

生物信息常見數(shù)據(jù)格式:
fasta:是一種基于文本用于表示核酸序列或多肽序列的格式。其中核酸或氨基酸均以單個(gè)字母表示,且允許在序列前添加序列名及注釋。特征,2行,ID行和序列行。ID行以“>”開頭,有時(shí)會(huì)包含注釋信息;序列行一個(gè)字母表示一個(gè)堿基/氨基酸。
fastq:是一種存儲(chǔ)了生物序列以及相應(yīng)的質(zhì)量評(píng)價(jià)的文本格式(測(cè)序的原始序列)。特征,4行。ID行,以@開頭,記錄必要信息;序列行;附加信息行(+ ,大部分后面啥都沒有,有的是和第一行一樣);堿基質(zhì)量行(PHRED值,根據(jù)ASCII表,用一個(gè)字符來表示一個(gè)堿基質(zhì)量的好壞)。
gff:記錄序列中轉(zhuǎn)錄起始位點(diǎn)、基因、外顯子、內(nèi)含子等組成元件在染色體中的位置信息?,F(xiàn)在多用第3版,即gff3。

gtf:現(xiàn)在多用第2版,即gtf2??梢杂胏ufflinks里的gffread命令互相轉(zhuǎn)換格式。

進(jìn)階——三駕馬車
grep:

正則表達(dá)式:

sed:


