文章标题:《Genome-wide association meta-analysis identifies GP2 gene risk variants for pancreatic cancer》,链接是 https://www./articles/s41467-020-16711-w 从曼哈顿图可以看到 GWAS的 p值,阈值有 (α = 5 × 10−8). 和 (α = 10−6).,但是都没有多少个位点被筛选到 ; 这个曼哈顿图超级简单,就是 qqman 这个包,自带数据(gwasResults)很容易(一句话函数 manhattan )出图,代码如下所示:
当然了,图形美化就需要一些功夫了,也可以去搜索高级R包,有打包好的主题和配色。比较麻烦的其实是数据(gwasResults)的整理。 有了这个 (SNP) at 16p12.3 is rs78193826 ,可以简单看看它附件的基因,毕竟大家对基因的认知会更好一点。 这个时候,研究者虽然定位到了GP2这个基因,但是设计实验并没有笼统的去敲减过表达它,而是很认真仔细的去干扰这个(SNP) at 16p12.3 is rs78193826 具体的位点, 设计突变组和野生型组的,差异分析,如下所示: 这个分析就很常规了,目前简单的差异分析流程,基本上转录组测序技术和芯片技术拿到的表达量矩阵后续分析大同小异,公众号推文在:
作者自己也承认,The functional characterization of GWAS-identified SNPs remains a challenge. 但是通过对该基因型的干扰,作者成功的说明了:functional relevance of rs78193826 may involve mod- ulation of KRAS activity. 这个转录组测序数据是:https://www.ncbi.nlm./geo/query/acc.cgi?acc=GSE147368
而且作者提供了每个样品的表达量矩阵 :
大家可以试试看简单的处理一下。 现在,你的gwas结果(GWAS-identified SNPs)的下游实验设计有思路了吗? 其实,目前的趋势是使用三维基因组等手段去探索gwas关联到的突变位点其作用的机制,因为绝大部分GWAS-identified SNPs都并不是在基因编码去。 |
|