今天教一下大家如何更加快速的(可都是Mb/s的速度奥)下载NCBI数据,包括转录组、基因组原始数据SRA文件和基因组组装及注释数据(genome和GFF文件),还有其他NCBI上所有数据大家自己发挥,都能找到,快速下载! 一、window系统 1、软件下载。Aspera Connect下载, 下载地址:http://www./downloads,选择相应版本,安装到本地电脑上; 2、数据网址获得。所有适用于aspera下载的数据均在此网址内http://www.ncbi.nlm./projects/faspftp/,你只需要找到对应的数据点击即可弹出aspera软件下载界面,下载即可(一个一个下,不可贪多奥!) SRA数据下载截图,找到对应的SRR号,点击黄色部分SRR000001.sra即可完成下载 基因组相关信息网址:找到genome,然后找到对应物种拉丁文即可,注意点击黄色部分向右的小箭头,会翻页的奥!(别找不到自己的物种) 二、linux系统 1. 进入linux服务器,下载aspera。 输入:wgethttp://downloads./download/sw/connect/3.1/aspera-connect-3.1.1.70545-linux-64.tar.gz 将会开始下载。 2. 下载完毕后,解压,输入: tar xvf aspera-connect-3.1.1.70545-linux-64.tar.gz 3. 安装输入:sh aspera-connect-3.1.1.70545-linux-64.sh 4. cd 到/home/usrname文件夹,ls-a就能看到 .aspera 这就是安装的文件夹。 5. 重要一步,添加环境变量,否则不能用。输入 exportPATH=$PATH:/home/username/.aspera/connect/bin 6. 数据下载。 可以按照这个模板去下载了SRA数据(如果很多可以把所有命令写到一个shell里面,nohup提交睡大觉去就可以了,明早一醒,全部ok) nohup /home/usrname/.aspera/connect/bin/ascp -i/home/usrname/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -T -l200manonftp@ftp-private.ncbi.nlm.:/sra/sra-instant/reads/ByRun/sra/SRR/SRR949/SRR949627/SRR949627.sra./ & 可以按照此模板下载基因组相关数据 ~/.aspera/connect/bin/ascp -i~/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -T -l200manonftp@ftp-private.ncbi.nlm.:genomes/all/GCF_000147175.1_CamFlo_1.0/GCF_000147175.1_CamFlo_1.0_genomic.fna.gz./ 其中GCF_000147175.1_CamFlo_1.0/GCF_000147175.1_CamFlo_1.0_genomic.fna.gz根据你要下载的基因组改成NCBI FTP上的基因组、GFF和CDS文件名字 其他类型数据类似 |
|
来自: sailing_387 > 《待分类》