2016-11-19GWAS(Genome-wide association study),即全基因组关联分析,是指在人类全基因组范围内找出存在的序列变异,即单核苷酸多态性(SNP),从中筛选出与疾病相关的SNPs。目前,已经发表了超过1300多项GWAS研究,寻找到了6500个与疾病或性状相关的易感位点。但只有7%的位点落在蛋白编码区,而93%落在非编码区。对于SNPs在肿瘤中的贡献来说,如果一些生殖细胞突变发生在蛋白质编码区往往是非常有害和致死性的,这样可能直接导致携带者不能存活,所以这种形式可能不是主要的贡献方式。而发生在一些调控区的生殖细胞突变,可以在不同组织或阶段特异的引起基因表达渐微的变化,这可能是肿瘤易感位点SNPs在癌症整个进展中的主要贡献方式。大量研究表明非编码RNA在众多生命活动调控中扮演了越来越重要的角色 在近十余年的生命科学研究中非编码调控RNA可谓是研究最火的领域之一,从06年诺奖的siRNA,到前几年异常火爆的microRNA,到如今风靡的lncRNA,可谓如火如荼。为什么近年来lncRNA才被人关注呢?因为在以前,lncRNA被认为是基因组转录的“噪音”,是RNA聚合酶II转录的副产物,不具有生物学功能。但随着研究的进展,lncRNA重要的调控机制被发现,例如参与了X染色体沉默,基因组印记以及染色质修饰,转录激活,转录干扰,核内运输等。lncRNA 研究将是基因组研究中非常吸引人的一个方向,使人们逐渐认识到基因组中知之甚少的“暗物质”。 目前GWAS研究已遇到瓶颈,英格兰杂志曾发表了数篇文章辩论GWAS研究的是否有意义。总结了历年的GWAS病例/对照研究数据,发现花费了数亿美元的GWAS研究,最后获得的大部分 biomarker,对疾病预测的贡献值都是非常小的,低于7%。所以后GWAS研究时代必将进入功能验证的时代(也就是仅仅烧钱是不够的,必须要做功能验证),而这篇文章具有标杆作用。 赵忻艺,将大数据应用于医学科研,主要包括临床医学数据的挖掘、收集、整理和利用(标准化和科学化的数据库),医学分子大数据的整理、利用及研究(基因、蛋白及代谢)。特别针对肿瘤个体化的基因测序和数据快速处理,寻找个体化的分子标志物、药物靶标和治疗方案。目前,已建立浙大大数据挖掘团队,旨在降低研究者学习大数据的门槛,推动大数据共享与研究协作,发表更高质量的研究成果,为科研决策提供精准的预测和实验证据。 |
|