今天C君来给小伙伴们解读一下GO分析和Pathway分析结果,并讲解如何通过与差异基因结果结合挑选目标基因。Identification of a novel biomarker, SEMA5A, for non-small cell lung carcinoma in nonsmoking women相关疾病 : Carcinoma, Non-Small-Cell Lung; Lung NeoplasmsPMID: 20802022 影响因子 3.622 本文研究的是非吸烟肺癌患者的致癌机制,作者用芯片检测了台湾地区非吸烟肺癌女性患者60对癌症和癌旁肺组织样本,利用配对T检验筛选了肿瘤组织中687个差异表达基因。我们需要判断差异基因在肺癌细胞中主要富集在哪些功能类群和代谢通路。文章作者利用IPA(Ingenuity Pathway Analysis)软件对差异基因进行了功能分析,筛选出了16条显著性代谢通路。在最显著的三条通路中,其中两条都和轴突导向信号通路(axon guidance)相关,作者很意外,于是选择了轴突导向信号通路,并在其中挑选了差异表达倍数最高的SEMA5A基因作为后续的研究对象。归纳一下作者的整体思路,先找差异基因,并通过功能分析进一步缩小差异基因的范围,再从中有针对性的挑选基因。 在差异基因的功能分析中,主要有GO功能分析和pathway分析,上面案例作者主要用了pathway分析。GO是Gene ontology的缩写,GO数据库分别从功能、参与的生物途径及细胞中的定位对基因产物进行了标准化描述,即对基因产物进行了简单注释。通过GO富集分析可以粗略了解差异基因富集在哪些生物学功能、途径或者细胞定位。Pathway指代谢通路,对差异基因进行pathway分析,可以了解实验条件下显著改变的代谢通路,在机制研究中显得尤为重要。 GO分析好比是将基因分门别类放入一个个功能类群,而pathway则是将基因一个个具体放到代谢网络中的指定位置。我们来沿着作者的革命道路看看如何筛选出最后的SEM5A基因。C君利用上述案例中的数据GSE19804 在GCBI在线实验室首先进行差异分析(|fold change|>2, P值<0.001><>将差异基因分别进行GO(P值<><>和pathway分析(P值<>,富集得到351个GO term和110条pathway。结果如下图所示,表一和表二分别为部分GO富集结果和最显著的15条pathway分析结果。表头的各个参数解释如下,其中,重点看三个指标, enrichment score、p值和FDR。Pathway分析主要看P值和FDR值,两者越小越好。GO分析还可看enrichment score,数值越大表示某个GO term越容易受到实验因素的影响。GO和pathway分析结果中都得到了文章中选定的axon guidance这个结果(红框)。将axon guidance通路中的所有差异表达基因全部挑选出来,列表如下。作者在文中挑选了显著性最高的SEMA5A作为后续的研究对象。在此次分析中,当p值小于10^-6时默认为0,按照表达倍数排列SEMA5A也排在前列,和作者的结果较吻合。想要进一步了解GO和Pathway分析结果怎么看,请观看文章末尾视频,另附差异基因结果解读。目前有许多GO和pathway分析软件,GO分析软件有Avadis (商业软件)、BiNGO(开源java)、DAVID(基于web的工具)等,pathway分析有IPA和MetaCore(商业软件)等。有没有一种分析方法无门槛,直接上手就可以搞定的呢?GCBI平台, 伸手党的福音,生信分析方法直接加载了模块,你需要做的只是创建方案,拖动模块,单击运行即可。小编用样本GSE19804演示一下,倒数10min,GO富集分析,pathway分析全搞定。在方案界面,拖动模块,修改名字和参数,并用连接线将模块连接成一个方案,小编建立了如下差异分析和GO和pathway分析方案。 样本数据GSE19804 直接来自于GCBI样本库,将样本发送到在线实验室。点击方案中样本模块,在样本分组管理中选择配对样本,配对好相应的对照组和实验组样。Lung normal **N为对照组,Lung cancer **T为实验组。
|