分享

如何高效又简单地省时地获得SRA公共数据的Fastq格式数据

 生信药丸 2021-07-26

如何高效又简单地省时地获得SRA公共数据的Fastq格式数据

陈胖子


下载NCBI SRA数据库上的公共数据,整体上还是大部分搞数据分析,又想灌水的人必做的一个事情。

其实直接使用官网推荐的工具aspera,确实是可以直接从SRA或者EBI等网站直接以非常高效的方式下载自己想要的数据,教程网络大吧,所以这个推送就到这里了。下个月再见。。。


aspera其实...对于相当部分人来说,安装到配置上,都还是麻烦。我其实,只用过一次,后面就没用了。一般来说,我是直接使用linux下面的多线程下载工具axel。


常见做法
  1. 从NCBI下载.sra格式的数据

  2. 使用SRA toolkit 转换成 Fastq.gz 格式

省时做法
  1. 直接查看EBI是否有对应地NCBI SRA记录号地数据

  1. 使用aspera或者axel高速下载


嗯,之前有朋友特意提醒了我,我并不是一个愿意分享地人,说得太对了。以下附上一个链接,直接替换掉其中地SRR号,即可获得对应地信息表格,自行写个小脚本(直接提供脚本?我要做一个真的不影响别人自学的人),解析就可以了,虽有直接axel多线程下载就可以了

http://www./ena/data/warehouse/filereport?accession=SRR771924&result=read_run&fields=run_accession,fastq_ftp,fastq_md5,library_name

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多