最近总有小伙伴找小编询问一些数据上传的问题,看来又到了发论文的高峰期了?小编不甚明了!不过既然这么多人受到困扰,小编就给大家再介绍一下如何将测序数据上传至NCBI。 一、提交数据数据基本流程: 1、注册NCBI账号; 2、登陆提交界面后,我们需要获取BioSampleID; 3、然后在获得BioProjectID; 4、BioProject和 BioSample 创建完成后,再到SRA 的网页,点击“Create newSubmission”,并完成信息填写; 5、完成4步骤后,网页上NCBI会给出一个登陆FTP的账号和网址链接; 6、登陆后用账号可直接上传(复制粘贴),或用软件FileZilla上传; 7、上传后会生成相应的编号,供发文章使用(上传数据请理清思路)。 二、注意: 1、上传的数据格式是根据测序平台不同而不同,文件格式(Illumina_native、bam、fastq、srf)都可以的; 2、创建好后,NCBI会提供数据上传的FTP的账号,压缩后上传到FTP。至于文章中的sra格式,是我们将数据上传后,NCBI数据库压缩的的格式; 3、交付的结果中,raw reads或clean reads序列文件(*.fq.gz)是可以直接提交SRA的数据。在交付结果中找到对应文件,无需解压,即可直接上传; 4、如果数据交付时您保留有对应文件的MD5校验码的话可以直接使用。如果没有保存MD5码可上网下载任意的MD5校验工具,重新生成一下MD5值; 5、一定要明白该数据的测序策略,不同的测序方法生产的数据的格式和填写的内容是不一样的,这需要先了解好,生物信息学知识百度提前补。 具体如下:
登入NCBI主页右上角Signin to ncbi注册(http://www.ncbi.nlm./)。
1. BioSample的注册: 登陆后,点击提交Submit(https://submit.ncbi.nlm./) 点击Newsubmission后按照提示填写完相应的信息,成功后生成BioSample号: 2.BioProjiect的注册 点击Newsubmission按照提示填写完相应的信息,成功后生成BioProjiect号: 按照提示填写: 3. SRA的注册,Create new Submission: 关联BioSample BioProjiect(https://submit.ncbi.nlm./),再返回到NCBI主页中点击submit后界面如下: 点击红色框圈出来的地方即可进入,下面界面:
完成信息填写: 点击SRA即进入下面页面,创建一个新的submission: 点击CreateNew submission,填写信息:
点击NewExperiment的界面,填写信息后保存,进入下一个界面:
到这里,我们网页上的填写信息就完成了,利用NCBI中给的网址链接,账号和密码,我们就可以直接登录NCBI。 方法一(该方法简单,但传输较慢): 打开我的电脑复制FTP网址进入,如图:
然后右键选择登录:
方法二(软件:FileZilla): 安装后打开的界面:本地站点为你的电脑,远程站点为服务器可视化界面; 主机:NCBI给你的FTP链接,账号:sra 密码:NCBI给端口:FTP数据传输默认为 21。
登陆SRA提交页面,打开本次的Submission,可查看每一条SRA记录的状态。请您仔细检查上传的每一条记录是否Completed,是否所有的Sample、Experiment、Run信息对应无误。 另外还可以看到记录对应的Accession编号,编号主要有SRP、SRS、SRX、SRR分别对应Study、Sample、Experiment、Run。文章中可以根据上下需要引用这些编号。 如果您在在提交过程中遇到技术问题,您可以随时向SRA的工作人员寻求帮助。 上传完成后,再登录到SRA 进入SRA结果: 好了,测序数据上传NCBI介绍完了,假如您还有问题,可以学习下面课程,定会豁然开朗! 扫我观看 |
|