分享

GEO、TCGA、Oncomine,我应该选择哪一个?

 Jennymgozseons 2018-04-09

现在是大数据时代,数据越来越多了,数据库也越来越多了,各种各样的基因芯片数据库、蛋白质数据库。。。没完没了。面对如此多的数据库,我们不知挖那一个了。本来东西越来越多是好事情,但是却不知道怎么样选择?真是令人头痛呀!最近有很多人问我们,GEO、TCGA、Oncomine,我应该选择哪一个?哪一个比较简单?哪一个比较好文章、哪一个能发高分文章?哪一个不用学编程?哪一个容易上手?因此,我们面对这些问题做一些总结。






1
GEO数据库


GEO是当今最大、最全面的公共基因表达数据资源。


适合研究方向:基本包括所有疾病,不是做肿瘤的小伙伴可以选这个。


难易程度:数据下载,整理都比较简单,分析过程需要R编程,这里有点难度,总的来说难度一般。


发文的高度:只做纯GEO数据挖掘的文章一般只能1-2分的文章,文章的分数偏低。


2
TCGA数据库


TCGA由美国 National Cancer Institute(NCI) 和 National Human Genome Research Institute(NHGRI)于 2006 年联合启动的项目,收录了33种癌症基因组测序数据。


适合研究方向:仅限于肿瘤,不是研究肿瘤方向的小伙伴就不要选择这个了。


难易程度:数据下载,整理都比较难,数据提取过程需要Perl或者Python、R,整一个分析过程需要R编程,整体来说,难度偏高。


发文的高度:只做纯TCGA数据挖掘的文章能发3-5分的文章,发文章的分数比较高,985、211名校博士毕业妥妥的。


3
Oncomine


Oncomine是大型肿瘤基因芯片数据库,涵盖65个基因芯片数据集、4700个芯片及4亿8千万个基因表达数据,可用于分析基因表达差异、寻找离群值、预测共表达基因等。


适合研究方向:仅限于肿瘤,不是研究肿瘤方向的小伙伴就不要选择这个了。


难易程度:各种各样的分析,我们只要点击鼠标就可以了,不用任何编程,数据挖掘中最容易的一个。


发文的高度:只做纯Oncomine数据挖掘的文章保底能发2-3分的文章,做一个基因家族的分析发3分以上的文章基本没有问题,985、211名校博士毕业也是妥妥的,文章分数会比TCGA低一点。


通过以上分析,可以看出,最易上手、最简单的、发文最快就是Oncomine, 但是只适合研究肿瘤的同学,难度最高和发文分数最高的就是TCGA,同样也只适合研究肿瘤方向的同学,GEO发的分数比较低,但是其他同学也可以做,例如研究糖尿病,心脑血管疾病等等。最后的选择还是根据自己个人的情况进行选择。如果只是为了发文章,个人建议先学Ocomine数据挖掘。


分享结束


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多