分享

下载文件一定要md5校验一下

 健明 2021-07-14

因为要使用STAR-fusion软件,其GitHub主页里面提到了配置好的数据库文件,我就想直接下载,如下:

├── [ 26G]  GRCh37_gencode_v19_CTAT_lib_Nov012017.plug-n-play.tar.gz
├── [ 20G]  GRCh38_gencode_v26_CTAT_lib_Nov012017.plug-n-play.tar.gz
├── [ 21G]  Mouse_M15_CTAT_lib_Nov012017.plug-n-play.tar.gz

看起来大小差不多,我以为下载完毕,结构解压的时候发现

tar xxvf Mouse_M15_CTAT_lib_Nov012017.plug-n-play.tar.gz
Mouse_M15_CTAT_lib_Nov012017/
Mouse_M15_CTAT_lib_Nov012017/ctat_genome_lib_build_dir/
Mouse_M15_CTAT_lib_Nov012017/ctat_genome_lib_build_dir/ref_genome.fa
Mouse_M15_CTAT_lib_Nov012017/ctat_genome_lib_build_dir/pfam_domains.dbm 

gzip: stdin: unexpected end of file
tar: Unexpected EOF in archive
tar: Unexpected EOF in archive
tar: Error is not recoverable: exiting now

这个时候才想到去下载日志里面看看,原来是下载失败了。

22023800K .......... .......... .......... .......... .......... 8817.25h5m
22023850K .......... .......... ..                               88%  126K=9m26s

2018-01-07 23:41:09 (157 KB/s) - Connection closed at byte 22552444928. Retrying.

--2018-01-07 23:41:19--  (try:12)  https://data./Trinity/CTAT_RESOURCE_LIB/Mouse_M15_CTAT_lib_Nov012017.plug-n-play.tar.gz
Connecting to data.|69.173.92.29|:443... connected.
HTTP request sent, awaiting response... 404 Not Found
2018-01-07 23:41:38 ERROR 404: Not Found.

所以我检查了md5确认了一下,然后断点续下。

wget -c https://data./Trinity/CTAT_RESOURCE_LIB/Mouse_M15_CTAT_lib_Nov012017.plug-n-play.tar.gz
--2018-01-09 10:58:23--  https://data./Trinity/CTAT_RESOURCE_LIB/Mouse_M15_CTAT_lib_Nov012017.plug-n-play.tar.gz
Resolving data.... 69.173.92.29
Connecting to data.|69.173.92.29|:443... connected.
HTTP request sent, awaiting response... 206 Partial Content
Length: 25502123410 (24G), 2949678482 (2.7G) remaining [application/x-gzip]
Saving to: “Mouse_M15_CTAT_lib_Nov012017.plug-n-play.tar.gz”

88% [+++++++++++++++++++++++++++

虽然解决问题了,但是因为当初没有进行md5校验,导致后来的流程报错,浪费了几天时间。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多