最近有粉丝求助,说自己已经耗费十多天了还没有把一个NT数据库下载下来,不得已充值会员费希望可以加速,但是效果也很惨淡,如下图: 需要从 https://ftp.ncbi./blast/db/FASTA/ 下载核酸数据库nt.gz和nr.gz文件;这两个文件大的如此吓人(nr.gz:75G;nt.gz:72G)。用wget命令龟速(56.00K 7.03KB/s 剩余 124d),使用迅雷也就白天300KB/s晚上2MB。 我直接甩给他一个关键词:aspera 学员表示非常诧异,的确以前看到过我的教程,见:使用ebi数据库直接下载fastq测序数据 , 首先使用conda安装aspera conda create -n download 我们已经多次介绍过conda细节了,这里就不再赘述。
然后就可以使用conda配置好的aspera软件进行高速下载,但是这个教程不是仅限于ebi的测序数据吗? 然后学员半信半疑的尝试拼接出来了下面的命令: ascp -v -k 1 -T -l 200m -i ~/miniconda2/envs/rna/etc/asperaweb_id_dsa.openssh https://ftp.ncbi./blast/db/FASTA/nr.gz . 然后果然报错,如下: ascp: no remote host specified 我非常尴尬,首先学员没有认真看教程,没有扩展思维,其次,没有理解aspera下载是需要特殊的链接的,就又苦口婆心的语音指导了,成功写成下载链接如下: # 安装完成后可以使用ascp --help查看帮助,Aspera需要私钥asperaweb_id_dsa.openssh 下载速度令人激动: 这才是:生命如此美好! 如果你学习生信也需要帮助,可以考虑我们生信技能树官方举办的学习班哈! |
|