分享

【昊阅读】Nature Genetics 1月精选文章一览

 生物_医药_科研 2019-01-22

01


Assembly of a pan-genome from deep sequencing of 910 humans of African descent

910名非洲后裔深度测序后泛基因组的组装揭示该人群的独有基因组序列

研究者基于910个非洲后裔个体的深度测序数据集,构建了一组DNA序列,这些序列存在于这些个体中,但不存在于人类参考基因组中。研究者将来自910个个体的1.19万亿个测序reads与参考基因组(GRCh38)比对,收集了所有未能比对的reads,并将这些reads组装成连续序列(contigs)。然后,研究者将所有contigs相互比较,以鉴定一组参考基因组缺失的非洲泛基因组区域的独特序列。研究者的分析揭示了非洲后裔中存在总长度296,485,284 bp 的125,715个不同contigs,表明非洲泛基因组含有比目前人类参考基因组多约10%的DNA。尽管这些序列的功能意义尚不清楚,但387个新contigs 处于315个不同的蛋白质编码基因,其余的都是位于基因间的。


02


ROBO4 variants predispose individuals to bicuspid aortic valve and thoracic aortic aneurysm

ROBO4变异携带者易患二叶主动脉瓣和胸主动脉瘤

二叶主动脉瓣(BAV)是一种常见的先天性心脏缺陷(人群发病率1-2%),常见于升主动脉瘤患者(AscAA)。 BAV / AscAA为常染色体显性遗传,表现为不完全外显和男性多见。致病基因突变(例如,NOTCH1,SMAD6)仅见于≤1%的非综合征BAV病例(伴有或不伴有AscAA),阻碍了该疾病机制研究和治疗策略的发展。本研究报道了ROBO4基因(编码已知有助于内皮细胞性能的因子)突变在两个家系中与疾病共分离。与对照相比,ROBO4的靶向测序显示BAV / AscAA先证者中罕见变异的富集。在内皮细胞系中靶向沉默ROBO4或破坏ROBO4表达可导致屏障功能和合成功能损伤,提示该基因参与内皮 - 间质转化。这与缺乏ROBO4的患者和动物模型中的BAV / AscAA相关表型发现一致。这些数据鉴定了这种常见人类疾病表型的新型内皮病因。


03


Trans-ethnic association study of blood pressure determinants in over 750,000 individuals

基于超过750,000人的多人群关联研究探究血压决定因素

在这项跨种族多学科研究中,我们重新解释了血压的遗传结构,以确定血压稳态相关的基因,组织,表型和药物。我们的研究纳入百万退伍老人计划(MVP)和合作研究中多达776,078名参与者,在基于收缩压,舒张压和脉压的全基因组关联研究中确定208种血压相关SNP和53种罕见变异。我们的转录组范围内关联研究在45个组织中检测到可预测840个基因表达的4,043个血压关联,小鼠肾单细胞RNA测序鉴定了肾小管细胞中上调的血压基因。


04


Discovery of the first genome-wide significant risk loci for attention deficit/hyperactivity disorder

研究发现注意力缺陷/多动障碍的第一个全基因组显著风险基因座

注意力缺陷/多动障碍(ADHD)是一种高度遗传性的儿童行为障碍,约影响5%的儿童和2.5%的成人。常见遗传变异实质上对ADHD易感性有贡献,但没有发现与ADHD强烈相关的变异。本研究报告了基于20,183名ADHD患者和35,191名对照的全基因组关联荟萃分析,发现12个超过全基因组显著性的独立基因座,为ADHD潜在生物学病因提供了新的信息。这些关联集中在进化上受限的基因组区域,功能丧失的不耐受基因以及脑组织表达的调控基因。三项验证研究(一组被诊断患有ADHD的个体,自我报告的ADHD样本和人群中ADHD症状的定量测量荟萃分析)均支持上述发现,同时突出显示了遗传与教育程度重叠的研究特异性差异。基于ADAS症状的定量GWAS强烈支持ADHD的临床诊断是持续遗传性状的极端表达。


05


Discovery of common and rare genetic risk variants for colorectal cancer

研究发现结直肠癌的常见和罕见遗传风险变异

为了进一步剖析结直肠癌(CRC)的遗传结构,我们对1,439个病例和720个对照进行了全基因组测序,将发现的序列变异和单倍型参考联盟变异数据纳入全基因组关联研究数据中进行基因型填补,并在34,869例病例和29,051例对照中研究遗传相关性。研究结果随后在23,262例患者和38,296例对照中进行了验证。我们在CHD1处发现了强烈保护性的变异信号,频率为0.3%。在基于125,478个个体的综合荟萃分析中,我们确定了P <5×10-8的40个新的独立基因座,使CRC的已知独立信号的数量达到约100个。新基因座涉及低频变异,Krüppel样因子,Hedgehog信号传导,Hippo-YAP信号传导,长非编码RNA和体细胞驱动因子,并支持免疫功能在疾病发生中的作用。遗传度分析表明,CRC风险是高度多基因参与的,更大,更全面的研究将促进稀有变异分析,提高稀有变异促进发病风险的生物学理解,并影响个性化的筛选策略和药物开发。


06


A map of constrained coding regions in the human genome

人类基因组中受约束编码区图谱

基于数千人遗传变异的深度测序数据通过识别变异稀缺的编码区域可以实现对种内约束的探究。虽然现有技术总结了整个基因组的约束情况,但单个基因范围的指标隐藏了每个基因内的区域约束变异性。因此,我们通过利用基因组聚合数据库的123,136个个体中观察到的变异,创建了受约束编码区(CCR)的详细图谱。最受约束的CCR富含ClinVar中的致病变异和发育障碍突变。 CCR体现蛋白质结构域家族处于高限制范围中,同时CCR也包含很多未注释或不完整的蛋白质结构域。在评估常染色体显性疾病研究中的新发突变时,百分位数最高的CCR补充了现有的变异优先排序方法。最后,我们在缺乏已知疾病关联的基因中识别高度受限的CCR。该观察结果表明,CCR可用于识别受强纯化选择的区域,这些区域突变时,往往导致严重的发育表型或胚胎致死性。


07


Gain-of-function DNMT3A mutations cause microcephalic dwarfism and hypermethylation of Polycomb-regulated regions

功能获得性DNMT3A突变导致小脑侏儒症和多梳蛋白调节区域的高甲基化

DNA甲基化和Polycomb基因是建立脊椎动物细胞特性和命运的关键因素。在本研究中,我们报告了DNA甲基转移酶编码基因DNMT3A上的新发错意突变。这些突变可导致小头畸形侏儒症,该疾病是一种极端的全局性生长失败的低增生疾病。 PWWP结构域中的氨基酸替换破坏了该结构域与组蛋白修饰H3K36me2和H3K36me3的结合,并改变了患者细胞中的DNA甲基化。多梳相关的DNA甲基化谷,包含发育基因的低甲基化结构域,伴随着H3K27me3和H3K4me3二价标记的消耗变为甲基化区域。这种新发DNA甲基化在体外Dnmt3aW326R多能细胞分化期间发生,并且在Dnmt3aW326R/+ 矮化小鼠中也有发现。因此,我们提出DNMT3A PWWP结构域与H3K36me2和H3K36me3的相互作用通常限制多梳标记区域的DNA甲基化。我们的研究结果暗示了DNA甲基化和Polycomb基因在关键发育调节因子之间的相互作用,这是哺乳动物体型大小的决定因素。


08


Neurodevelopmental disease genes implicated by de novo mutation and copy number variation morbidity

新生突变和拷贝数变异涉及的神经发育疾病基因

我们结合了来自10,927名发育迟缓和自闭症患者的新生突变( DNM )数据,识别了253个候选神经发育疾病基因,这些基因存在过量的错义和/或可能的基因破坏( LGD )突变。在这些基因中,有124个基因对DNM具有全基因组意义。将这些结果与拷贝数变异( CNV )发病率数据相交叉,显示基因组紊乱区域的富集。我们鉴定了具有过量错义DNMs重叠缺失综合征和重复综合征的基因,例如染色体16p11.2复制中的重复12p13错义突变、12p13复制区域中的重复CHD4错义DNMs和10q11.23复制区域中的重复WDFY4错义DNMs。对显示DNMs过量的基因的网络分析突出了功能网络,包括纹状体D1+和D2+ 神经元的细胞特异性富集。


09


The copy number variation landscape of congenital anomalies of the kidney and urinary tract

先天性肾和泌尿道异常的拷贝数变异图谱

先天性肾和泌尿道异常是儿童肾衰竭的主要原因。我们对2,824例和21,498例对照进行了拷贝数变异体的全基因组分析。受影响的个体携带了大量罕见的外显子CNVs,并因已知的基因组疾病( GD )而富集。肾脏异常( KA )病例中外显子CNVs最为丰富,包括GD-CNVs和新的缺失;梗阻性泌尿疾病( OU )的CNV负荷较低,GD-CNV中度流行;膀胱输尿管反流( VUR )的GD-CNVs最少,但富含新的外显子CNVs,尤其是重复。6个基因座( 1q21,4p16.1-p16.3,16p11.2,16p13.11,17q12和22q11.2 )占GD-CNVs患者的65%。17q12、4p16.1-p16.3和22q11.2的缺失对KA是特异性的;16p11.2基因座显示广泛的多效性。采用多学科方法,我们确定TBX6是16p11.2微缺失综合征CAKUT亚表型的驱动因素。


10


High-resolution genetic mapping of putative causal interactions between regions of open chromatin

开放染色质区域之间预测因果相互作用的高分辨率遗传图谱

三维空间中调控元件的物理相互作用对疾病的研究提出了挑战,因为非编码风险变体可能距离它们调控的基因很远。捕获这些相互作用的实验方法,如染色体构象捕获,通常不能在调控元件之间指定因果方向,这是精细作图研究的重要组成部分。我们开发了一种贝叶斯分层方法,该方法使用两阶段最小二乘法,并将其应用于来自100名个体的ATAC-seq数据集,以识别超过15,000个高置信度的因果相互作用。大多数( 60% )相互作用发生在<20 kb,那里基于染色体构象捕获的方法表现不佳。对于一小部分基因座,我们鉴定了一种改变多个区域可及性的单一变体,并使用CRISPR基因组编辑实验验证了与多种自身免疫疾病相关的BLK基因座。我们的研究强调了染色质状态的关联遗传学是如何识别调控元件之间相互作用的有力方法。


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多