分享

不做实验也能圆你高分SCI的梦--miRNA在精神分裂症中的作用

 九斗酒 2017-08-15
ActionFree 

一个追求高品质生活异想天开的浪漫疯子,一只研究精神疾病与脑的遗传的科研汪...生活不该只停留在想法而无实际行动,做一个勇敢的行动者,去尝试去努力。 此公众号旨在分享本汪在科研及生活中的一些实践报告、学习笔记,期待与你的交流与合作。戳这里ActionFree公众号原文,请多关注哦~















随着技术的进步,数据的累积,有很多公共的数据可以用来挖掘出有意义的解读。今天小编跟大家扒拉的是一篇发表在JAMA Psychiatry杂志上的文章的分析方法。






全文都是利用的公共数据库,在线的网站,并没有费一兵一卒来做实验,对于想要从生物信息角度入手的你,值得学习。



梗概



精神分裂症是一种常见的精神障碍,发病率高,遗传度高,且遗传异质性很大。2014年的GWAS荟萃分析找到了108个精神分裂症的相关基因组,标志着人类对精神分裂症理解的一个伟大进步。研究精神分裂症的风险基因是如何作用于疾病的是非常重要的课题。

随着研究的开展,MicroRNA(miRNA)——基因表达的调控因素参与精神分裂症的病因的证据越来越多:



1

miRNA在脑的发育过程中发挥总要作用;

2

在死亡后的精神分裂症的脑组织中发现了差异表达的miRNA;

3

miRNA和miRNA的靶基因富集在风险基因区域



而精神分裂症相关的GWAS信号大多被认识是来自于影响了基因表达的区域。此文在三个层面上研究了miRNA在精神分裂症可能发挥的作用:



1

评估精神分裂症的风险基因是否更可能被miRNA调控;

2

通过基因集富集分析找到能调控精神分裂症风险基因的保守的miRNA;

3

基因表达分析来系统的描绘GWAS和CNV研究界定的区域中的miRNA的特性;






分析方法:


1

Level 1




1. 从PGC2下载了精神分裂症的GWAS的summary statistics数据【这个数据也可以在GWAS Catloge下载,详情见】

2. 根据编码蛋白质的基因的位置,得到每个基因与精神分裂症相关的汇总的p value

3. 使用TargetScan预测miRNA的靶基因;

4. 统计每个基因上miRNA的binding sites的数目

5. 建立线性回归模型,将基因与精神分裂症的相关程度作为因变量,基因的miRNA的binding sites作为因变量,同时将基因的长度和基因的3‘UTR的长度作为协变量,评估 miRNA 基因调控和精分的风险基因之间的相关性。

6. 为了验证该模型的specificity, 本文还将如上方法分析了克罗恩病,女性初潮年龄和身高的GWAS的数据。



2

Level 2







精分相关的基因集

根据千人基因组的European的计算LD,分成不同的interval,然后根据显著性水平,将interval分成三种(threshold):

1 × 10-5;

top 1%;

top 5%;

miRNA

首先根据来源,分成:

  • 保守的miRNA;

  • 位于精分GWAS loci的miRNA ;

  • 位于精分相关的CNV的miRNA;

然后利用TargetScan6.2分别预测他们的靶基因,得到了三类基因集;

对于每一类miRNA的靶基因集与精神分相关的三种基因集分别进行INRICH分析,得到三个p value,将这三个p value 汇总为一个combine score,对每一类的miRNA的基因集中进行排序,得到排序最高的miRNA, 即为调控精分风险基因的miRNA。




3

Level 3


对level2中找到的排名靠前的miRNA,研究其在脑中的表达情况,使用BrainSpan的数据,可以看到miRNA在脑的发育过程中的表达的变化情况,不同时间和不同脑区。同时还进行了这些miRNA的靶基因的聚类分析。


主要结果


1.    具有更多的miRNA binding sites的基因具有更strong的精神分裂症的相关性,但是在其他的性状的分析中也有类似的趋势;

2.    给出了富集分析中保守的miRNA的top 10罗列如下

且将他们的靶基因谱用circos图绘制出来:

局部视图如下↓

3.    重点miRNA的时空表达




小编 总结

MiRNA的研究是最近几年的研究热点,此文为研究miRNA在复杂性状的研究中提供了一个比较好的范式,同样的,你可以将这套流程搬迁到你需要探讨的疾病上,看是否可以找到一些比较重要的miRNA.


批判的眼光

1.    本文所用的risk gene是使用了位于GWAS信号中的基因,而很多研究指出risk gene不一定是GWAS信号附近的基因,所以在界定risk gene时仍需要斟酌,可以参考SMR所提供的精分的基因,或者自己使用SMR界定target 基因,同时QTL调控的基因也是不错的选择;

2.    MiRNA在本文中所起的作用,是调控risk gene, 而我们知道miRNA的发挥作用seed region是非常重要的区域,而作者似乎并没有做到这么精细,这也是需要改进的地方;

3.    关于靶基因的预测问题,预测的靶基因之间证据程度是有不同的,作者这里是一概而论,虽然后面做validation的时候引入了其他的证据,不过可能把靶向程度也考虑进来应该是更全面的。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多