分享

总结篇(九)——找差异分子案例实践

 微笑如酒 2017-01-11
原创 2016-05-28 freescience 弗雷赛斯
弗雷赛斯

freescience

Freescience由浙江大学医学院几个硕博士发起创建,旨在最广泛分享有价值的科研技能和知识;FreeScience的宗旨:“科学自由分享、人人平等,共求真理”。

本章节围绕'Differentially expressed gene profiles ofintrahepatic cholangiocarcinoma, hepatocellular carcinoma, and combinedhepatocellular-cholangiocarcinoma by integrated microarray analysis '(影响因子为3.611 ,PMID: 25712376)这样一篇文献进行详细的数据还原分析。

文章的基本思路:通过收集别人的含有肝内胆管癌(ICC),肝细胞肝癌(HCC)和混合型肝癌的原始芯片数据,然后分析得出三组比较差异的基因列表和相关通路和功能,最后挑选出其中的S100A11基因在HCC和ICC细胞系中验证表达。

回顾下往期的还原分析的流程:

1.如何选题和寻找切入点
开篇引言(一)
2.芯片数据哪里来,怎么找?
基因芯片数据库(二)
2.下载哪些文件,怎么下载?
找差异分子案例实践(三)
3.用什么软件分析获得差异基因?怎么操作?
找差异分子案例操作实践(四)万能芯片数据分析(五)
4.如何进行多个数据集的meta整合分析?
多类型芯片数据整合分析(六)
5.通路和功能分析是要用到什么软件,怎么操作?
富集分析上(七)富集分析下(八)
6.挑选其中的某一基因来实验验证有什么原则和方法?
找差异分子案例实践——总结篇(九)

本期就来讨论下如何通过芯片数据分析的结果来指导我们的实验方向,挖掘有价值的东西。根据不同的实验背景,在设计和分析上有什么不同的原则和方法。

一、样本数

如果对象是组织且是配对的样本,例如同一病例的癌和癌旁组织,一般要求至少三对样本。对于非配对组织,例如正常组织和癌组织,一般至少每组5个样本。对于动物组织,一般每组至少3个样本,如果观察动物的长期指标,例如生存等,一般每组至少5个样本。

二、统计方法
一般统计方法取决于实验设计,两组的配对差异比较,一般选用配对t检验,两组非配对的差异比较,选用非配对的t检验。 对于每组样本数较小的情况下建议使用随机方差的t检验来矫正P值。当然用这种传统的统计方法会产生大量的假阳性基因,但用保守的多重比较去严格修正,对于大多数的基因芯片分析是不合适的。而多元置换检验的方法或SAM(Statistical Analysis of Microarrays)算法可以根据给定的置信度和假阳性率阈值下得到权衡的基因,是基因芯片分析的流行算法。传统的统计方法尽管在发现个别基因的统计学效力受到假阳性的限制,但芯片实验目的是寻找差异分子进行后续的实验分析,从这角度来说传统的差异全局检验仍然具备较好的效果,适用于一般的差异分析。
三、多组比较

在芯片实验设计中,不仅仅只有简单的两组差异比较,还存在多组比较的设计。例如三组样本的比较例如,正常组织v肝炎组织v肝癌组织,或者细胞对照组v细胞处理6小时v细胞处理24小时,或者样本包含丰富的临床数据,例如预后和诊断信息。通过一些更高级的分析方法可以寻找到哪些差异基因与疾病进展,时间序列和生存预后相关,或者哪些基因组合能预测诊断分类等等,从而寻找到具有临床意义和价值的分子。

四、功能富集分析
从指导实验方向来说,功能富集分析是非常有效的生物学解释方式。通过分析得到感兴趣的通路和功能来进行实验验证,就像是故事中的线索一样,起到承上启下的作用。而在这个过程中,对于纳入多少差异基因来进行富集分析就值得讨论了,纳入基因太多就会分析出许多的功能通路,这样就难以选择,无法起到线索的作用。反之,纳入太少就得到较少的功能通路或者富集不到任何通路功能。我们可以通过差异分析的差异倍数和p值来控制差异基因列表的大小,从严到宽的多次调整,来达到适合功能富集分析的目的。
五、分子机制预测
基因芯片分析除了寻找到差异的基因及相关的重要通路,是否还能对分子间直接调控机制进行预测,这对指导实验来说意义会更大。当然这种分析就涉及到不同分子类型的数据关联分析了,例如miRNA-mRNA,转录因子-mRNA,甲基化- mRNA的机制调控,严谨的实验设计是对同一个样本进行多层面上的基因芯片检测,例如一个样本同时做miRNA芯片和mRNA芯片。这样的原则下,分子调控的预测是比较可靠的。
六、生物网络分析
从某种角度来说,人体内的分子都是互相关联,联系的,就像社会网络一样。重要的分子就像明星名人一样,大家都认识关注她,直接受到她的影响。而对于普通人来说,间接通过几次社交拓展可以联系到世界上任何一个人。我们可以从网络理论去寻找一些重要的明星分子即所谓的“hub node”,或者根据相似的模式去定义一些重要的功能模块,就像是现实社会中的俱乐部,交际圈,协会一样的概念。通过构建生物网络,从整体系统的角度去认识疾病,从而去寻找到可以作为标志物或治疗靶标的“hub node”或模块。未来随着医学知识的不断积累,生物网络计算的不断完善,我们甚至可以通过生物网络直接推演和模拟疾病的发生发展过程,对关键结点干预,从而攻破疾病。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多