FastQC——转录组数据质控的得力助手

FastQC——转录组数据质控的得力助手

在RNA-seq数据分析中,数据能否使用是最基本的问题,因此进行质量控制(Quality Control, QC)是不可或缺的步骤,今天小果介绍了一个高效好用的软件工具——fastqc,它可是转录组数据质控的得力的助手。

FastQC是一个免费使用的质量控制工具,能够对高通量测序数据进行快速、准确的评估。在这篇文章中,小果将以拟南芥转录组数据为例,详细介绍FastQC在RNA-seq数据质控方面的应用。

1.安装fastaqc

conda create –name fastqc###创建环境

conda activate fastqc###激活环境

conda install -c bioconda fastqc###安装

fastqc -version###验证否安装成功

2.数据准备

上一期我们对拟南芥的3组共9个转录组测序rawdata进行了过滤,这一期,小果继续用上次的数据带大家进行质量控制,当然啦,正确的做法是先对数据进行质量控制,然后根据结果报告来进行数据的过滤处理。小果先对数据进行了处理,然后进行了数据质控。

3.质量控制

这一步操作很简单,进入文件所在目录

fastqc -t 4 *_paired.fq.gz

或者

nohup fastqc -t 4 -o ~/my_folder/trimm/ninanjie_output/ninanjie_qc *_paired.fq.gz &

这一程序会在后台运行,并对所有以 _paired.fq.gz 结尾的文件进行质控,同时使用4个线程进行计算,结果输出到给定目录。

这一步可以根据自己的实际修改命令。

可以看到程序在后台并给出了进程ID,可以进入输出目录查看结果,下面是部分,结果,慢慢等待即可。

4.查看结果

程序结束后我们会看到每个样本都生成了read1和read2的.html报告和压缩文件,我们可以打开.html查看报告。

图表

描述已自动生成

好啦,不多说了,今天的内容就到这里了,你学会了吗!

欢迎使用:云生信  – 学生物信息学 (biocloudservice.com)

如果想用服务器可以联系微信:18502195490(快来联系我们使用吧!)