分享

NCBI原始数据极速下载

 sailing_387 2016-08-31

今天教一下大家如何更加快速的(可都是Mb/s的速度奥)下载NCBI数据,包括转录组、基因组原始数据SRA文件和基因组组装及注释数据(genomeGFF文件),还有其他NCBI上所有数据大家自己发挥,都能找到,快速下载!

一、window系统

1、软件下载。Aspera Connect下载, 下载地址:http://www./downloads,选择相应版本,安装到本地电脑上;

2、数据网址获得。所有适用于aspera下载的数据均在此网址内http://www.ncbi.nlm./projects/faspftp/,你只需要找到对应的数据点击即可弹出aspera软件下载界面,下载即可(一个一个下,不可贪多奥!)

SRA数据下载截图,找到对应的SRR号,点击黄色部分SRR000001.sra即可完成下载


基因组相关信息网址:找到genome,然后找到对应物种拉丁文即可,注意点击黄色部分向右的小箭头,会翻页的奥!(别找不到自己的物种)


二、linux系统

1. 进入linux服务器,下载aspera

输入:wgethttp://downloads./download/sw/connect/3.1/aspera-connect-3.1.1.70545-linux-64.tar.gz

将会开始下载。

2. 下载完毕后,解压,输入: tar xvf aspera-connect-3.1.1.70545-linux-64.tar.gz

3. 安装输入:sh aspera-connect-3.1.1.70545-linux-64.sh

4. cd /home/usrname文件夹,ls-a就能看到 .aspera

这就是安装的文件夹。

5. 重要一步,添加环境变量,否则不能用。输入  

exportPATH=$PATH:/home/username/.aspera/connect/bin

6. 数据下载。

可以按照这个模板去下载了SRA数据(如果很多可以把所有命令写到一个shell里面,nohup提交睡大觉去就可以了,明早一醒,全部ok)

nohup /home/usrname/.aspera/connect/bin/ascp -i/home/usrname/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -T -l200manonftp@ftp-private.ncbi.nlm.:/sra/sra-instant/reads/ByRun/sra/SRR/SRR949/SRR949627/SRR949627.sra./ &    

可以按照此模板下载基因组相关数据

~/.aspera/connect/bin/ascp -i~/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -T -l200manonftp@ftp-private.ncbi.nlm.:genomes/all/GCF_000147175.1_CamFlo_1.0/GCF_000147175.1_CamFlo_1.0_genomic.fna.gz./

其中GCF_000147175.1_CamFlo_1.0/GCF_000147175.1_CamFlo_1.0_genomic.fna.gz根据你要下载的基因组改成NCBI FTP上的基因组、GFFCDS文件名字

其他类型数据类似

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多