分享

基因家族分析套路(一)

 sailing_387 2016-10-13


近年来,测序价格的下降,导致越来越多的基因组完成了测序,在数据库中形成了大量的可用资源。如何利用这些资源呢?今天小编带你认识一下不测序也能发文章的思路--全基因组基因家族成员鉴定与分析(现在这一领域可是很热奥);

一、基本分析内容

o数据库检索与成员鉴定

o进化树构建

o保守domain和motif分析.

o基因结构分析.

o转录组或荧光定量表达分析.

二、数据库检索与成员鉴定

1、数据库检索

1)首先了解数据库用法,学会下载你要分析物种的基因组相关数据。一般也就是下面这些数据库了

oBrachypodiumdb:http://www./

oTAIR:http://www./

oRice Genome Annotation Project http://rice.plantbiology./.

oPhytozome:http://www./

oEnsemble:http://ensembl./genome_browser/index.html 

oNCBI基因组数据库:http://www.ncbi.nlm./assembly/?term=

2)已鉴定的家族成员获取。

      如何获得其他物种已发表某个基因家族的所有成员呢,最简单的就是下载该物种蛋白序列文件(可以从上述数据库中下载),然后按照文章中的ID,找到对应成员。对于没有全基因组鉴定的,可以下列数据库中找:

   a. NCBI: nucleotide and protein db.

     b. EBI: http://www./.

     c. UniProtKB:http://www./uniprot/

2、比对工具。一般使用blasthmmer,具体使用命令如下:

oLocal BLAST

formatdb–i db.fas–p F/T

blastall–p blastp(orelse) –i known.fas–d db.fas–m 8 –b 2(or else) –e 1e-5 –o alignresult.txt.

-b:output two different members in subject sequences (db).

oHmmer (hidden Markov Model) search. Thesame as PSI-BLAST in function. It has a higher sensitivity, but the speed islower.

Command:

hmmbuild--informatafaknown.hmmalignknown.fa; 

 hmmsearchknown.hmmdb.fas>align.out.

3、过滤。

oIdentity: 至少50%.

oCover region: 也要超过50%或者蛋白结构域的长度.

odomain: 必须要有完整的该蛋白家族的。工具pfamdb (http://pfam./) NCBI Batch CD- search. (http://www.ncbi.nlm./Structure/bwrpsb/bwrpsb.cgi).

oEST 支持

o Blast and Hmmer同时检测到

4、通过上述操作获得某家族的所有成员

明天继续!



    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多