鉴于之前文章中错别字太多的问题,现在希望大家看到错别字给留言提出来, 小编会赠送一份礼物。谢谢支持。 之前给大家推送过一期Aspera软件如何下载数据的文章。但是呢貌似现在Aspera官网有所改版,大家按照那个操作去做,估计会有些问题。 作为一个升级版吧,今天还是跟大家再次说下如何利用Aspera快速的下载基因组序列。 今天重点用一个实际的例子,如何从NCBI下载人的基因组序列来讲解aspera如何使用。 首先去Aspera官网下载windows Aspera http://downloads./connect2// 下载之后,点点点,然后安装,安装完成之后,会看到电脑的快捷菜单有一个图标。 点击运行,会在电脑的右下角出现一个图标 点击这个图标选择首选项,可以进行相关的配置,比如说下载的上限。 这里值得注意的是,之前的软件都是英文,现在都支持中文了,可以间接的说明,这个东西好使。 下面,我们去下载下人的基因组。 知识点 在下载之前,大家需要对下载的原理有所了解。 就是目前http和ftp都是基于互联网TCP协议的。 TCP在远距离数据传输中存在一些先天的不足,文件越大、距离越远,其丢包、延时等问题对于传输速度的影响就越大。 但是呢IBM开发了一种基于fasp 的技术,不需要借助TCP协议,可以实现远距离,高速度,大文件的传输。速度可以到达ftp的100多倍。 上面话的重点在于,如果想用aspera进行下载,需要遵从fasp协议。如果文件不支持,就没有办法下载。 那啥片啥的,就想想的了。 那么NCBI支持aspera下载吗? 支持的。 如果你理解了,刚才我说的话,相信你不会这样去下载(右击,保存为) 这是一种错误的方式,这样启动的还是常规的ftp下载。 如何调用超级暴力的aspera下载呢 以NCBI为例 http://www.ncbi.nlm./projects/faspftp/ 网址中注明了fasp的,是可以利用aspera进行下载的。 然后我们进入这个网址 找到人的基因组 点击进去,选择seq中人的第一条染色体。点击保存
跳出如下页面 选择允许,启动下载(有人问为啥有两次已经完成了,因为太快了,没来的及截图) 小编亲测,速度高达30Mbs 到此数据下载完成。 相信这次手把手的教学,能帮助大家节省不少的时间。
|
|