分享

用命令行下载TCGA癌症数据

 嘉慕cx 2019-09-23

TCGA是什么,这里就不介绍了,大家自行检索吧。它的数据下载分为两种:1.网页下载(数据量大时不稳定),2.命令行下载(方便大数据下载)。现在要讲的就是命令行下载。

1.打开TCGA主页,点开Launch Data Portal

2.1.选GDC Apps---Data Transfer Tool---下载后解压,存到你想存的文件夹里

2.2解压后文件名叫gdc client.exe

3.1.点data,进去页面,点左边的case,选择pancreas(学习的例子是以胰腺癌为例)

3.2 点case旁边的file,然后勾选选项。我就不说为什么选这些选项了,这些都是根据自己的需要来选,现在勾选的这些是用来举例子的。选完之后点中间蓝绿色的键,Add all files to the cart,于是cart(购物车)里就有182个文件了。

3.3点右上角的cart进入这个页面,点download,就会出来manifest和cart。点击manifest,直接下载,与gdc client.exe放在同一目录下面。

4.两种方法:1,点“开始”,在对话框输入cmd,2.或者按windows键+R。进入DOS。

5.1.将存有gdc client.exe和manifest文件文档的地址复制,先输入cd,再把地址粘贴进入DOS对话框。如果不是C盘,记得先写D:或者E:回车,再输入cd,粘贴地址。

5.2刚才说我C盘里的gdc client.exe是木马,不让我运行,我换D盘试试,也不行,最后发现是安了三六零,把它卸载之后应该可以了。现在gdc client.exe和manifest文件是存在D盘一个叫gdc的文件夹里。

命令是这样的

D:\gdc>gdc-client.exe download -m gdc_manifest_20161213_015958.txt

然后点回车,注意gdc client一定要有后缀名exe,manifest文件一定要有后缀名txt。可以复制文件名后按Tab键,后缀就出来了。

简单来说就是D:\gdc>加gdc client文件名+gdc client后缀+download+空格+-m+manifest文件名+manifest文件的后缀+回车

然后就下载好了,所有的文件会在D盘的gdc里。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多