分享

生物信息学之初学者(二)

 微笑如酒 2017-03-31

2017-03-30 sxr3 生信人

之前写了生物信息学之初学者(一),得到了不少赞,这也确实体会到生物信息学对于好多人来说基本是陌生的,对于这种交叉学科,我们生物狗们实际上还是需要多花一些力气了。小编我在此推出第2期,来方便初学者入门。

回顾上一次主体还是讲了比对的一些基本原理在一代测序中的应用,这是整个生物信息学最基础的部分,这次小编我先不讲二代,因为二代就是昨天发的Linux 命令敲代码,可能好多人一下子接受不了。小编这次主要讲生物信息领域中的网络资源。

生物信息分析也可以称为大数据分析,而提大数据那就可以进一步延伸到数据库了,不断地数据积累做成了数据库,其中大家比较熟悉的就是NCBI了。那么了解这些数据库的用法,挖取对自己有用的数据那便成了关键。因此对于生物信息学初学者首先要认识的就是我要了解有哪些数据库,知道如何去用。

罗静初老师那次来讲课介绍了他们北大的一个网站abc bioinformatic(http://abc.cbi.pku.edu.cn/),介绍了好多我们初学者需要了解的网站。对于生物信息学我们初学者应该就像这网站名,要从abc一点一滴开始去学习。

废话不多说,小编在此列出几个重要的网站,希望大家能够去了解:

1、NCBI:工具集+数据集

2、EBI:工具集+数据集

网址:

http://www./services

3、ExPASy:工具集

网址:

http://www./

4、Omics Tools:工具集

网址:

https:///

5、CBS :工具集

网址:

http://www.cbs./services/

6、CABRI:工具集

网址:

http://www./

7、SMA:工具集

网址:

http://www./sms2/index.html

8、Ensemble:工具集+数据集

网址:

http://asia./index.html

9、Softberry:工具集

网址:

http://linux1./berry.phtml

每个网站有各自的特点,资源含金量都相当高。对于我们初学者来说当我们遇到问题首先知道有这些资源我们可以去查,并且更重要的还要熟悉这些网站的用法。纳闷如何来熟悉网站用法?或者说如何使用在线工具(避开敲Linux代码)?这对于我们入门至关重要!

小编认为学会使用一个东西必须要动手,不能只看,而是带着问题去解决,去学习!比如说,一篇做基因家族分析的文章,首先他说从NCBI找到了300已知的MAPKKK基因家族成员,把他下载下来了。简单的一句话但这里面需要我们学习的很多,假设我们要模仿他做,那么我们就想这些已知的是如何在NCBI 中下到的,我们就去查,查到可以在nucleotide数据库中下到我们就输入MAPKKK结果出来了一大堆,联想是做植物的我们就只过滤植物的,加一步过滤选项,结果就OK 了,在这个过程中我们学会了如何使用NCBI 的nucleotide数据库,而不是漫无目的的看这个数据库的用法,总之一点我们要按需来学习,多去实战,在实战中学习,我们会进步很快。

再有就是我们要做结构域预测,文献中说是这两个网站(Pfam:http://pfam./和CDD:https://www.ncbi.nlm./Structure/bwrpsb/bwrpsb.cgi),那么我们就挑个序列上去戳弄戳弄,用不了多少时间我们就搞明白了用法,理解了结果,这样一来我们后面批量操作本地版本的结构域预测软件就容易了,知道如何输入输出,如何设置参数。

最后就是好多初学者不知道用什么工具分析,或者就是相同的工具有好多个不知道选用哪个,这个就要根据你的研究目的来选,因为每个工具都有他侧重的一面,建议大家看最新发的工具,往往他会有跟前面工具的对比,顺便提到各工具的适用性。

未完待续~

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多