一些分析學(xué)習(xí)記錄(結(jié)果是失敗了)
2022.10.21
一.實(shí)驗(yàn)名稱:第一批糞便宏基因組數(shù)據(jù)的分析
?
二.實(shí)驗(yàn)?zāi)康模和ㄟ^(guò)第一批宏基因組數(shù)據(jù)的分析,熟悉宏基因組分析流程,為后續(xù)數(shù)據(jù)分析積累經(jīng)驗(yàn)
?
三.實(shí)驗(yàn)方法:用Trimgalore、FastQC/0.11.9 軟件對(duì)數(shù)據(jù)進(jìn)行質(zhì)控分析
此次處理數(shù)據(jù)名稱:D2201105561(小鼠編號(hào)1F109L)
此次數(shù)據(jù)處理的軟件使用:trim_galore --paired --quality 20 -a AGATCGGAAGAGC -a2 AGATCGGAAGAGC --length 20 -o outdir DP8450000276BL_L01_429_1.fq.gz ?DP8450000276BL_L01_429_2.fq.gz(下圖為過(guò)程截圖)

接著用FastQC/0.11.9 軟件進(jìn)行質(zhì)控
處理數(shù)據(jù)名:DP8450000276BL_L01_429_1_val_1.fq.gz DP8450000276BL_L01_429_2_val_2.fq.gz
此次數(shù)據(jù)處理的軟件使用:fastqc *DP8450000276BL_L01_429_1_val_1.fq.gz DP8450000276BL_L01_429_2_val_2.fq.gz -o result(下圖為過(guò)程截圖)

四.實(shí)驗(yàn)結(jié)果
Trimgalore運(yùn)行結(jié)束(見(jiàn)下圖)

Fastqc運(yùn)行結(jié)束(見(jiàn)下圖)
HTML數(shù)據(jù)已經(jīng)存于桌面文件夾:HTML數(shù)據(jù)—第一批(17個(gè))—1F109L_1_val_1_fastqc和1F109R_2_val_2_fastqc;

實(shí)驗(yàn)名稱:kneaddate的下載和數(shù)據(jù)庫(kù)構(gòu)建
Kneaddate下載:conda install -c "bioconda/label/cf201901" kneaddata(下載截圖如下)
Kneaddate的數(shù)據(jù)庫(kù)下載(截圖如下):
mkdir?kneaddata_database
cd?kneaddata_database/
kneaddata_database?--download?human_genome?bowtie2?./
kneaddata_database?--download?mouse_C57BL?bowtie2?./
kneaddata_database?--download?human_transcriptome?bowtie2?./
kneaddata_database?--download?ribosomal_RNA?bowtie2?./

kneaddata_database?--download?ribosomal_RNA?bowtie2?./下載失敗

Kneaddate的使用:
單端數(shù)據(jù):
kneaddata?-i?D84-1.fastq.gz??-o?./D84-1?-t?20?-p?20?-db?$KNEADDATA_DB_HUMAN_GENOME(指定數(shù)據(jù)庫(kù))
雙端數(shù)據(jù):
kneaddata?-i?D84-1.R1.fastq.gz?-i?D84-1.R2.fastq.gz?-o?./D84-1?--output-prefix?D84-1?-t?20?-p?20?--cat-final-output?--serial?-db?$KNEADDATA_DB_HUMAN_GENOME?-db?$KNEADDATA_DB_RNOR_6?-db?$KNEADDATA_DB_RIBOSOMAL_RNA(可指定多個(gè)數(shù)據(jù)庫(kù))
?