分享

【综述】甲状腺癌的全基因组关联研究进展

 CharlesNice 2020-02-29

文章来源:中华内分泌代谢杂志,2016,32(1): 82-86

作者:陆凤 龚巍巍 何青芳 潘劲 费方荣 俞敏

摘要 

甲状腺癌是环境和遗传因素共同作用的复杂疾病,近年来全基因组关联研究(Genome-wide association study,GWAS)的出现使得甲状腺癌遗传因素的研究进入了一个崭新的阶段,发现了许多新的易感基因或区域。迄今为止,GWAS发现的易感区域共11个,相关位点16个,为甲状腺癌病因学研究及其防治提供了新的思路。

甲状腺癌是内分泌系统最常见的恶性肿瘤,是危害女性健康的十大癌种之一[1]。近年来全球甲状腺癌上升趋势明显,1973~2008年间全球女性发病率增加1.38倍,男性增加0.94倍,平均每年增长约4%。在我国,尤其在一些沿海地区,甲状腺癌发病率上升趋势更为明显,如上海市1982年至2000年女性甲状腺癌发病率从3.3/10万上升至5.0/10万,2006年则达16.7/10万。浙江省肿瘤监测数据显示,2011年浙江省甲状腺癌发病占女性恶性肿瘤的第5位,顺位比全国更靠前,发病率为11.78/10万,比2007年(3.86/10万)上升205.18%,年平均增长29.95%,甲状腺癌已成为浙江省增长最快的恶性肿瘤。

目前认为甲状腺癌是环境和遗传因素共同作用的复杂疾病。家族聚集性研究表明甲状腺癌患者一级亲属甲状腺癌发病风险是一般人群的8.6倍,遗传度高于其他任何一种恶性肿瘤,提示遗传因素在甲状腺癌的发生中扮演着至关重要的角色。研究者们通过候选基因策略已发现了一些与甲状腺癌发病相关的易感基因,包括DNA修复相关基因(XRCC、hMSH、OGG1)、p53、促甲状腺激素受体(TSHR)、甲状腺过氧化物酶(TPO)和pre-miR-146a等,但候选基因研究由于样本量较小、研究设计参差不齐、结果缺乏验证等,导致结果重现性较差,真正与甲状腺癌易感性建立明确关联的基因较少。随着以国际单体型图谱计划(HapMap)为代表的单核苷酸多态性(SNPs)数据库的共享以及高通量基因分型技术的建立和完善,全基因组关联研究(Genome-wide association study,GWAS)成为甲状腺癌等复杂疾病遗传机制研究的重要策略。本文将综述近年来甲状腺癌GWAS的研究进展以及相应结果的验证性研究,总结GWAS的经验及局限,并展望下一步的研究方向。

一、甲状腺癌GWAS的研究现状

GWAS是目前甲状腺癌遗传易感性研究最有效的策略,其借助高通量的基因分型平台在全基因组范围内选择几十万甚至上百万个标签位点,在较大样本量的人群中筛选与甲状腺癌显著相关的SNPs,其通过多阶段初筛和验证,降低了由于单个研究人群或研究设计缺陷所导致的虚假效应,增加结果可靠性。自2009年第1篇甲状腺癌GWAS发表以来,目前甲状腺癌GWAS共6项,详见表1。

2009年,Nature Genetics报道的第1篇甲状腺癌GWAS,研究应用Illumina HumanHap300和HumanCNV-duo芯片(共304 083个有效SNPs)在冰岛人群(初筛:192例病例和37 196例对照;验证:432例病例和1 727例对照)中发现2个新易感区域或基因的2个SNP:9q22.33区域(FOXE1)rs965513和14q13.3区域(NKX2-1)rs944289与甲状腺癌的发病风险相关联,相对危险度(OR)分别为1.75(P=1.7×10-27)、1.37(P=2×10-9),该风险效应值明显高于其他恶性肿瘤遗传易感位点。按病理类型分层后两个位点与乳头状甲状腺癌、滤泡状甲状腺癌仍存在关联;同时该研究还探讨与甲状腺相关代谢指标的相关性,发现两个位点均与低浓度的TSH水平有关联,同时rs965513与低水平的T4和高水平的T3相关。

2010年,第2篇甲状腺癌GWAS报道了与核辐射相关的俄罗斯人群甲状腺癌,研究发现rs965513与辐射相关的甲状腺癌有关联(OR=1.65,P=4.8×10-12),而rs944289未发现相关性(P=0.17)[19],可能该位点仅与非辐射相关的甲状腺癌特异性相关。2012年,首篇GWAS同一课题组通过在27758例非甲状腺癌欧洲人群中筛选出22个与TSH水平有关联的SNPs,进一步两阶段病例对照验证,又发现2个新易感区域2q35、8p12,14q13.3区域的rs944289未得到验证,但发现该区域另一个位点rs116909374(与rs944289位于两个相邻的LD区域,r2=0.005)与甲状腺癌的发病风险有关,提示14q13.3区域可能有两个或更多的致病位点。

2013、2014年发表2篇意大利人群的甲状腺癌GWAS,又证明了一批新的甲状腺癌易感位点与甲状腺癌发病风险有关联:rs10238549、rs7800391、rs7617304、rs10781500、rs6759952、rs10136427和rs7267944 [21,22]。2015年最新发表的基于西班牙人群的甲状腺癌GWAS,新发现了两个区域的位点:10q26.12区域(rs2997312,rs10788123和rs1254167)和6q14.1区域rs4075570,但统计学P值未低于1×10-5,该结果在目前甲状腺癌GWAS为数不多的情况下,仍具有一定的提示作用。

综上所述,目前基于GWAS发现的甲状腺癌易感区域共11个,相关位点16个:9q22.33区域rs965513,14q13.3区域rs944289、rs116909374,2q35区域rs966423、rs6759952,8p12区域rs2439302,7q31.1区域rs10238549、rs780039,3q25.32区域rs7617304,9q34.3区域rs10781500,14q24.3区域rs10136427,20q12区域rs7267944,10q26.12区域rs2997312,rs10788123、rs1254167,6q14.1区域rs4075570。

二、甲状腺癌GWAS的验证性研究

上述所有甲状腺癌易感基因或位点均为基于高加索人群的研究,目前其他种族和地区的甲状腺癌GWAS仍未见报道,仅有GWAS已发现位点在其他人群中的验证性研究,以下主要描述亚洲人群中的报道结果。

2011年,Matsuse等通过507例日本人群来源病例和2 766例对照,证明了rs944289、rs965513与日本人群乳头状甲状腺癌发病风险之间存在阳性关联,相应的OR值分别为1.69(P=1.27×10-4)、1.21(P=0.01。该研究为首篇亚洲人群的验证性研究,结果提示日本人群甲状腺癌发病风险与高加索人群在这两个位点上是一致的,但在日本人群中rs944289的相对危险度要明显高于rs965513,与高加索人群结果正好相反。随后2015年初该课题组在另一日本人群(959例滤泡状甲状腺癌、535例乳头状甲状腺癌和2 766例对照)中,成功验证了rs944289、rs2439302会增加滤泡状甲状腺癌的发病风险,rs965513、rs944289、rs2439302会增加乳头状甲状腺癌的发病风险,而未发现rs965513与滤泡状甲状腺癌之间的阳性关联,该结果与首篇高加索人群甲状腺癌GWAS的病理分层结果存在着不一致性。日本人群的验证仅限于上述3个GWAS位点,剩余其他位点的研究尚未见报道,也未对甲状腺相关代谢指标的关联进行探讨。

而中国汉族人群的验证研究仅见于Wang等2013年的报道,在845例甲状腺癌病例和1 005例对照中验证发现rs944289、rs965513、rs966423和rs2439302与乳头状甲状腺癌发病风险之间存在阳性关联,相应的OR值分别为1.53(P=2.03×10-10)、1.53(P=1.44×10-4)、1.31(P=0.001)、1.41(P=2.78×10-5),未检测到rs116909374多态性。该研究系统验证了前2篇GWAS的阳性位点,其中4个位点的结果与高加索人群非常一致,OR值相对也较大,但未对2013年以后的GWAS结果进行研究。

三、GWAS阳性位点的功能学研究

GWAS发现了许多候选基因策略未发现的新的甲状腺癌易感基因或位点,这些基因有些与甲状腺功能相关,有些未发现与甲状腺功能有相关报道。新发现的位点使得研究者们对这些相关基因与区域开始深入研究,可能通过调控相关靶基因表达影响相关基因功能,进而在甲状腺癌的发生发展过程中发挥重要作用。

其中与rs944289距离最近的相关基因为NKX2-1,该基因在甲状腺的形成过程中起着重要作用,在甲状腺癌组织中NKX2-1基因的表达发生了明显改变。研究发现rs944289下游3.2kb处存在一个长链非编码RNA——PTCSC3,只特异地表达于甲状腺组织,PTCSC3在肿瘤组织中表达下调,且携带rs944289风险等位基因T下调最明显。rs944289位点的变异位于C/EBPα和C/EBPβ基因的CCAAT盒或增强子的结合部位,C/EBPα和C/EBPβ蛋白能激活PTCSC3启动子而开始表达。因此rs944289风险等位基因可能通过下调PTCSC3的表达而影响甲状腺癌的发生发展,该位点目前功能学研究相对明确。rs116909374与rs944289位于同一区域内,密切相关基因也为NKX2-1,但该位点风险等位基因是否引起甲状腺癌组织内NKX2-1或PTCSC3过表达等机制尚未明确。

rs965513位于最近的FOXE1基因上游的57kb处,该基因在甲状腺癌组织中高表达,其对脑垂体和甲状腺的形成非常重要,是胚胎时期甲状腺早期分化所需转录因子与辅酶因子调节网络的重要组成部分,FOXE1基因突变易引起甲状腺发育不全等症状。该基因在甲状腺特异基因如甲状腺球蛋白基因和甲状腺过氧化物酶基因的转录过程中起重要调节作用,该功能是甲状腺组织维持分化型状态所必需的。这些甲状腺特异基因的规律表达对甲状腺相关激素T3和T4的合成又起到非常关键的作用,如甲状腺球蛋白是T3和T4的前体,它们的合成又需要甲状腺过氧化物酶进行催化。FOXE1基因与甲状腺癌的功能相关性较为明确,但rs965513风险等位基因是否引起甲状腺癌组织内FOXE1过表达等机制也尚未明确。

rs966423位于DIRC3基因内含子区,该基因与甲状腺癌的功能学研究未见报道;rs2439302位于NRG1基因的第一内含子内,该基因编码神经调节蛋白1,为神经系统、心脏、乳腺等组织中介导细胞间传导的重要信号蛋白,与甲状腺癌的报道未见;血液提取总RNA表达谱分析携带rs2439302风险等位基因G使NRG1基因表达明显下调。2013年以后GWAS发现的SNPs相关功能学研究更是空白。

基于上述已发表的甲状腺癌GWAS的结果,本课题组申请省部共建课题'基于GWAS的甲状腺癌易感基因筛选与功能分析',将验证欧洲人群GWAS发现的9个甲状腺癌遗传易感位点单独或联合与中国浙江人群甲状腺癌易感性的关系,及与甲状腺相关代谢标志物表型的关系;探索环境影响因素、基因-环境交互作用与甲状腺癌风险的关系,建立遗传和环境多个因素预测甲状腺癌发病风险的模型,为评价中国人群甲状腺癌遗传易感标志物用于识别高危人群、预防甲状腺癌的发生提供科学依据;初步阐明阳性易感位点对相关基因的转录调控、转录后调控和蛋白表达的影响,以明确其重要生物学功能,为深入探讨甲状腺癌的发生机制提供理论基础。

四、甲状腺癌GWAS面临的挑战

较之候选基因策略,甲状腺癌GWAS发现了较多新的易感区域,且这些研究成果很容易在后续研究中被重复验证,已经被研究者认为是目前甲状腺癌易感基因筛选的最佳途径。虽然取得了许多重要研究成果,甲状腺癌GWAS仍面临巨大挑战。

1.需开展覆盖更大样本量和更多人群的研究:

尽管GWAS取得了令人瞩目的成绩,发现了许多有价值的甲状腺癌易感位点,但这些仅仅是冰山一角,只能解释很少一部分甲状腺癌的发生。有研究对5个已报道的甲状腺癌位点进行估计,大约能解释6%~11%的人群遗传风险,可能与前期甲状腺癌GWAS样本量小、人群范围局限等有关。上述6项GWAS的初筛样本量,尤其是病例组均低于1 000例,发现的易感位点基本上是MAF较高,而大部分MAF低的位点由于统计学把握度低很难被检出,增加样本量是提高易感位点发现能力的最有效方法。因此开展多个研究中心合作扩大样本量是大势所趋,但鉴于GWAS的高昂费用,还可尝试通过meta分析合并多个GWAS的结果来增加样本量,目前在其他肿瘤研究中已较多开展。目前甲状腺癌GWAS的研究人群均为高加索人群,研究人群的单一性限制了易感位点的发现,而多个人群由于遗传背景和环境暴露差异可增加易感位点的发现能力。如表2所见,不同种族易感位点频率差异也是造成其能否被检出的重要原因,如Wang等[26]的研究发现欧美人群中的易感位点rs116909374未在中国人群中检测到多态性。因此在多个人群开展甲状腺癌GWAS有利于发现种族特异的遗传图谱,对进一步探讨肿瘤发病机制提供更多数据支持。而验证数据缺乏的人群如亚洲人群首先要开展高加索GWAS结果的系统性大样本验证。尽管全是针对高加索人群的GWAS,由于全基因组芯片覆盖位点有所差异,也会导致不同研究发现同一区域不同关联的SNP;同一位点在不同研究中结果不一致,可能是受芯片分型成功等因素影响,或高加索人群中本身也存在人群异质性,这些问题急需覆盖更多基因组位点的芯片进行大样本量的多阶段验证。


2.GWAS鉴定的位点大多位于非功能区:

GWAS发现的大部分甲状腺癌的易感位点位于基因的非编码区,有些还处于基因荒漠区,这些传统意义上的非功能区位点,是否是真正的致病位点还有待研究。目前主要的研究方向包括两种:这些位点可能通过非编码序列或基因的远距离调控发挥作用,如长链非编码RNA、miRNA、增强子等,rs944289与长链非编码RNA(PTCSC3)的调控机制为甲状腺癌病因机制的一大发现;同时因为GWAS芯片采用的位点都是标签位点,有可能与真正的同一个致病位点直接高度连锁,也有可能与几个不同的致病位点高度连锁[35]。另外,易感位点即使落在已知基因内,很多是首次发现,这些基因在甲状腺癌中的作用大部分尚不明确。因此,在今后的研究中对已发现的易感区域进行精细作图研究寻找真正的致病位点或进行二代测序寻找一些较低频率的位点,并开展相应的生物学功能研究,将是未来甲状腺癌研究的新领域。

3.疾病预测:

GWAS研究的最终归宿还是实际应用,包括预防、诊断和治疗,主要体现个体化医学,目前数据挖掘最多的是预测个体甲状腺癌发病的风险。Liyanarachchi等[33]应用俄亥俄州队列和芬兰队列研究的样本对5个已报道的甲状腺癌易感位点通过加权的办法构建风险模型,结果提示遗传信息的加入使模型的ROC曲线下面积(AUC)由0.608~0.527增加到0.724~0.621,效应较为明显。Guo等对中国人群风险预测模型的研究结果,纳入4个已报道位点建立九种统计学模型计算得到的AUC为0.54~0.60,提示4个位点的遗传风险模型的预测效果比较有限,有待发现其他更多的位点,尤其是致病位点。

4.基因环境交互作用与甲状腺相关代谢指标表型研究:

目前甲状腺癌GWAS研究结果只着眼于多个独立的易感位点,而忽视了位点之间、基因环境之间的交互作用,这也可能是解释疾病发病的一个重要方面。另一方面,甲状腺癌的发生发展与甲状腺相关代谢指标密切相关(如TSH、T3、T4等),GWAS发现的易感位点是否也影响这些指标的水平,将有利于甲状腺癌发病机制的探索。GWAS发现rs944289、rs965513、rs966423、rs2439302、rs116909374五个位点均与低浓度的TSH水平有关联,同时rs965513与低水平的T4和高水平的T3相关;后续的GWAS则无相关研究,可能是代谢指标信息的缺乏。在亚洲人群的验证性研究中也缺少该部分内容的挖掘,因此实践中还应注意相关代谢指标表型的收集。

五、总结及展望

GWAS给甲状腺癌易感性研究带来了前所未有的成功,发现了一批有价值的易感位点,但为了更全面地揭示甲状腺癌的遗传机制并将这些结果真正应用于疾病预测与个体化治疗,仍需开展大量的工作,相较于高加索人群研究,亚洲人群尤其是国内甲状腺癌GWAS更需要开展。总结现有GWAS的经验和不足,发现存在的问题,并采取合理措施来应对这些挑战,以进一步优化GWAS和后续研究,更好地理解和应用GWAS研究成果。下一步可从以下几个方面着手:(1)多途径发掘更多的甲状腺癌易感位点:增加样本量,开展亚洲人群GWAS及GWAS结果的后续验证,适当降低检验水准进行新一轮位点验证而降低假阴性率,深入开展基因-基因,基因-环境交互作用分析而寻找有交互作用特异性的易感位点;(2)致病位点的研究:对已发现的易感区域进行精细定位作图研究寻找功能位点;对易感区域进行二代测序等以发现低频率的功能位点,对可能的致病位点或基因进行生物学功能研究;(3)GWAS研究成果应用:完善发病风险预测模型的统计学方法,注重样本基线信息收集,开展阳性易感位点甲状腺相关代谢指标表型研究,有助于进一步了解甲状腺癌的发生发展过程。


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多