formatdb is an outdated software tool in molecular bioinformatics to format protein or nucleotide databases for BLAST. It has been replaced by the tool makeblastdb and the NCBI "strongly encourage[s]" users to stop using formatdb. The formatdb.exe program is part of the BLAST release, which can be found here: ftp://ftp.ncbi./blast/executables/release/2.2.18
在对核苷酸或蛋白质序列数据库进行Blast搜索之前,必须要对所使用的序列数据库进行formatdb, 即对序列数 据库进行格式化,这是所有使用BLAST所必须的一步。 格式化序列数据库— —formatdb formatdb 简单介绍 formatdb处理的都是格式为 ASN.1和 FASTA,而且不论是核苷酸序列数据库,还是蛋白质序列数据库;不论是使用Blastall ,还是Blastpgp,Mega Blast应用程序,这一步都是不可少的。 formatdb 命令行参数 它可以根据我们的想法把源数据库格式化 主要参数的说明 -i 输入需要格式化的源数据库名称 Optional -p 文件类型,是核苷酸序列数据库,还是蛋白质序列数据库 T – protein F - nucleotide [T/F] Optional default = T -a 输入数据库的格式是ASN.1(否则是FASTA) T - True, F - False. [T/F] Optional default = F -o 解析选项 T - True: 解析序列标识并且建立目录 F - False: 与上相反 [T/F] Optional default = F formatdb命令的参数说明
示例: formatdb -i uniref100.fasta -n uniref100 -t uniref100 -l uniref100.log -p T
ftp://ftp.ncbi./blast/documents/formatdb.html http://www.ncbi.nlm./staff/tao/URLAPI/formatdb_fastacmd.html http://code.google.com/p/mass-spec-gui/downloads/detail?name=formatdb.exe&can=2&q= ======================================================================================== BLAST+ 中包含的 makeblastdb 参数详解 与以前的Blast相以,我们还是从格式化数据库到比对开始 一般我们是有一个fasta文件用来格式化数据库,以前的命令是formatdb,现在是makeblastdb 一般用到的格式如下: makeblastdb -in input_file -dbtype molecule_type -title database_title -parse_seqids -out database_name -logfile File_Name -in 后接输入文件,你要格式化的fasta序列 -dbtype 后接序列类型,nucl为核酸,prot为蛋白 -title 给数据库起个名(不能用在后面搜索时-db的参数) -parse_seqids 推荐加上,现在有啥原因还没搞清楚 -out 后接数据库名,自己起一个有意义的名字,以后blast+搜索时要用到的-db的参数 -logfile 日志文件,如果没有默认输出到屏幕
ftp://ftp.ncbi.nlm./blast/executables/blast+/ (download Blast+) http://www.ncbi.nlm./books/NBK1763/ http://hi.baidu.com/lidaof/blog/item/fb4569cfc2011931f9dc612f.html http://nebc./bioinformatics/docs/makeblastdb.html |
|
来自: zhuqiaoxiaoxue > 《生物信息学》