分享

缘起Cytoscape的5.5分SCI

 阿非ycfg 2020-02-25

研究思路



· 差异分析,这里是在3个GSE数据集中进行差异分析后,取交集

· PPI及significant module,利用STRING进行蛋白互作的分析,MCODE进行模块筛选,cytohubba进行hub基因筛选

· 生存分析,基于基因表达水平分组后进行KM曲线绘制;

· 基因表达水平的比较,在不同临床亚型下进行基因表达水平的比较;

· 实验验证(western blot和qRT-PCR)

· 外部数据验证,利用另一个GSE数据集进行生存分析,印证之前的分析结果;

· GSEA分析,对相关基因进行GSEA分析,联系上生物学功能;



结果




1



差异分析

对3个GSE数据集进行差异分析后,取共有的差异基因(即相同阈值得到的基因列表取交集)共379个;在STRING中输入差异基因后得到蛋白互作关系,用MCODE找到最有意义的模块,均在cytoscape中进行展示;

2



hub基因分析

利用cytoHubba筛选得到10个最有意义的hub基因,并在cbioportal中对得到的10个hub基因进行共表达分析,得到hub基因及其共表达基因的调控关系;利用ClueGO和CluePedia对筛选得到的hub基因进行生物功能注释分析;并用热图展示hub基因在正常和肿瘤组织中的表达;

3



单因素生存分析

KM曲线分析认为,在10个基因中有8个基因跟生存相关(文中说,在GEPIA中先看到了两个基因与生存相关,后面修改阈值后,发现8个基因与生存相关,所以,我们看到的图是风格迥异的两个),其中5个基因为高表达预后差,3个基因为高表达预后好;

4



基因表达水平比较

在肿瘤和正常组织中进行CCND1和PECAM1的表达水平比较,均为在肿瘤中高表达,且具有统计学意义;并在正常和肿瘤的AJCC和ISUP分级下进行CCND1和PECAM1表达水平的比较;

5



外部数据进行生存分析验证

在另一个GSE数据集GSE3538中进行CCND1和PECAM1的生存分析,同样是,依据表达将样本分为高低表达两组后进行生存曲线的绘制,印证了之前的生存分析结果,即高表达预后好;

6



实验验证

western blot和qRT-PCR对肿瘤和正常样本进行蛋白和RNA表达水平的比较,均为在肿瘤中相对高表达;

7



GSEA分析

对CTNND1和PECAM1显著相关基因进行GSEA分析,并用热图对相关基因进行表达水平的展示;



结语



主要利用了4个GSE数据集和TCGA-KIRC数据集。其中3个GSE数据集进行差异分析,对差异分析结果取交集后cytoscape分析得到重要模块和hub基因;在TCGA数据集中进行生存分析,并在另一个GSE数据集中进行生存分析验证;在数据集中进行基因表达水平的分析,并进行实验验证;最后用GSEA对表达相关基因进行通路富集分析,最终将结果落到了生物学功能上。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多