分享

如何获取蛋白序列并进行序列比对?

 ypgao 2019-02-18

很多情况下,我们为了研究一个蛋白的重要性,需要查看这个蛋白在多个物种,以及与这个蛋白家族中其它蛋白的相似性,并构建进化树。今天我们就来说一下具体的方法,先介绍蛋白序列的获取和序列比对。  

以Sox家族的蛋白为例,我们首先通过Uniprot数据库(http://www./)获取蛋白序列:

我们直接在搜索框中输入sox,单击search:

这样我们能看到各个物种中展示的结果,其中人里面有175个:

我们全部选择后单击左上角的下载,然后选择fasta格式的非压缩文件后直接单击GO就可以了:

这是打开后是序列,我们看到包括了Sox9,Sox2,Sox11等蛋白的序列,这样我们就拿到Sox家族的各条序列了,接来下我们进行序列比对。

接下来我们要用的工具软件是MEGA,可以从官网(http://www./)下载:

下载后打开后的界面:

接下来我们导入刚才查到的序列,单击Align选项下的Edit/Build Alignment,

创建新alignment,选择蛋白protein:

打开新的界面:

在这里面我们直接把刚才的序列复制进来就好了:

接下来我们进行比对,在Alignment里面有Alignment by ClustalW和Muscle两个选项,其中ClustalW常用于两序列比对,Muscle速度快,用于序列多的时候进行的比对,这里我们选择Muscle,选择所有序列后进行比对:

这里我们用默认的参数进行计算,序列比较多的话需要等一下:

上面是比对好的结果,图还是比较漂亮的,不过软件在导出图片的时候没有给出方法,大家先截图使用吧。

下期我们来介绍构建进化树的方法,看看如何做出下图的进化树:

有科研问题要问?上科研微论坛!

关注后获取《科研修炼手册》1、2、3、4、5,基金篇精华合集

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多