本次目的与任务:了解fastq测序数据 需要用安装好的sratoolkit把sra文件转换为fastq格式的测序文件,并且用fastqc软件测试测序文件的质量。 作业:理解测序reads,GC含量,质量值,接头,index,fastqc的全部报告,搜索中文教程,并发在论坛上面。 SRA文件转换为fastq文件用sratoolkit将NCBI上下载的sra文件转换成fastq文件,以便进行下一步的QC。该工具的安装与介绍在转录组入门1中已经有所介绍。这里我再回顾一下sratoolkit的使用: 阅读官方文档 https://trace.ncbi.nlm./Traces/sra/sra.cgi?view=toolkit_doc ,我们的目的是把测序sra文件转换为fastq文件,因此点击“fastq-dump”进一步阅读。 查看本地帮助 从进入的这个页面我们能大概了解到fastq-dump命令的基本用法。 然后我在本地的CentOS上又运行了帮助命令 来查看本地版的命令说明。
显然,本地的帮助说明更详细一点。 先看用法:fastq-dump [各种参数] <输入文件的登录号或者路径> 其中,[各种参数]在帮助中有详细介绍,根据博主@徐洲更以及@沈梦圆的文章介绍,我们常用到的参数主要是以下两部分的: 关于输出:
明白了fastq-dump的常用参数,我们就得到了转换sra文件的套路
具体到我们下载的数据,可以直接用@徐州更博文中的命令进行转换
以上命令在vim中编辑,保存为.sh文件后,通过bash运行,注意seq前的撇不是单引号。 查看转换结果 转换后生成一系列以.sra1.fastq.gz以及.sra2.fastq.gz结尾的压缩文件。 fastqc检测测序文件质量多个文件批量进行QC 进入转换后fastq.gz文件所在的文件中,用以下命令生成批量运行的脚本
运行结果会生成一个名称为fastqc.sh的脚本,运行该脚本即可对当前文件夹下的fastq.gz文件进行QC。
查看QC结果 单独查看 关于单独的QC结果文件,大家可以看我以前的几个入门帖子了解基本知识。 https://zhuanlan.zhihu.com/p/24608131?group_id=871001548837228544 |
|