分享

基因变异有害性预测工具分享

 闲庭之雨 2024-01-18 发布于湖北

转自 微信 河南省儿童医院分子诊断平台

遗传基因检测报告解读

———————

 生信分析工具分享 

图片
前言
图片

WGS和WES等二代测序会产生大量的变异数据,其中致病性变异的筛选对于临床遗传病的诊断至关重要。在2019年发布的<ACMG遗传变异分类与解读指南应用标准化建议>中PP3证据提到:多种统计方法预测出该变异会对基因或基因产物造成有害影响(包括保守性预测、进化预测、剪接影响等)

有害性预测通常应用于非同义突变(错义突变、无义突变)和剪接突变,以上这些突变都可能会导致不同程度的蛋白质结构变化和功能变化,最终导致疾病的发生。

目前已有多种软件可对变异有害性进行评估,运用这些预测软件,对基因检测分析报告的解读非常重要。以下将为大家介绍常见的有害性预测软件。


13种预测工具简介

(1)SIFT

http://sift.

基于同源蛋白每个位点上的氨基酸保守性,通过进化保守性和位置特异打分矩阵PASSM,SIFT预测错义替换是否影响蛋白质功能,从而得知这个氨基酸替代是否有害。SIFT分数范围0-1,分值<0.05的位置被预测为有害D:Deleterious,分值≥0.05则预测为无害T:Tolerated。

(2)ClinPred 

https://sites.google.com/site/clinpred/

2018年发表的工具,注重对非同义突变的危害性注释。整合random forest (cforest) 和gradient boosted decision tree (xgboost) 两种模型的机器学习算法,在进行有效预测的前提下减少过拟合的影响,软件的预测结果参考两个模型的最大值,最大程度提高特异性。训练数据集为ClinVar数据库以及gnomAD数据库中所有人种AF (allele frequencies) 的注释信息。预测分值高于0.5有害,低于0.5为无害,分值越高致病性越强。

(3)LRT

http://www.genetics./jflab/lrt_query.html

对每个待测试的密码子,LRT将来自31个物种的氨基酸进行比对来预测突变的危害。预测结果有害突变 (D:Deleterious) 表示突变来自高度保守的密码子,突变氨基酸在其他比对的真核哺乳动物中不存在。中性突变 (N: Neutral) 表示:突变发生在非高度保守的密码子,突变的氨基酸至少在一个进行比对的真核哺乳动物中发现。未知结果 (U: Unknown) 突变没有在已有数据库中找到。

(4)Mutation Assessor 

http:///r3/

该软件预测蛋白质中氨基酸替换的功能影响,如在癌症中发现的突变或错义多态性。基于蛋白质同源物中受影响氨基酸的进化保守性评估功能影响。该方法支持OMIM验证。预测结果表示该变异对蛋白序列的影响程度。预测结果H:High (高度影响功能),M:Medium (中度影响功能),L:Low (无功能性低度影响),N:Neutral (无影响)。

(5)FATHMM 

http://fathmm./

预测编码和非编码突变功能的高通量网络服务器。通过结合隐马尔可夫模型 (HMMs) 对序列保守性来预测蛋白质错义突变的功能效应。FATHMM预测结果表示该变异对蛋白序列的影响。预测判定D:Deleterious (有害),T:Tolerated (无害)。

(6)PolyPhen2

http://genetics.bwh./pph2/index.shtml

基于进化保守性与蛋白质的三维结构,利用贝叶斯分类器计算后验概率来预测突变的致病性。通过已有的蛋白质注释数据库鉴定替换位置的重要性做打分矩阵评分,软件应用机器学习算法Naive Bayes。Polyphen2_HVAR,基于HumanVar数据库,常用于单基因遗传病,预测结果D: Probably damaging (很可能有害,分值>=0.909),P: Possibly damaging (可能有害,0.447<=分值<=0.909),B: Benign (无害,分值<=0.446)。Polyphen2_HDIV,基于HumanDiv数据库,常用于复杂疾病。预测结果D:Probably damaging (很可能有害,分值>=0.957)P:Possibly damaging (可能有害,0.453<=分值<=0.956),B:Benign (无害,分值<=0.452)。

(7)Mutation Taster 

http://www.

基于进化保守性、Grantham矩阵评分、贝叶斯分类器来进行预测,用于预测内含子和非同义突变、短插入缺失 (InDel) 突变以及跨越内含子-外显子边界变异的对功能的影响。包括来自千人数据库中的单核苷酸多态性 (SNP) 和Indels,以及来自ClinVar和HGMD Public的已知致病病变异。预测结果A:Disease causing automatic (有害),D:Disease causing (可能有害),N:Polymorphism (可能无害),P:Polymorphism automatic (无害),其中Disease causing automatic和Polymorphism automatic表示该变异在已知数据库中有记录,证据明显。

(8)PROVEAN 

http://provean./index.php

是一种预测蛋白质序列变异是否影响蛋白质功能的工具,依据进化保守性、神经网络模型、BLOSUM62氨基酸替换打分矩阵预测,识别非同义突变或InDel对蛋白质的生物功能是否有影响。预测结果分值范围-14~14,阈值为-2.5,分值-14~2.5,预测为Deleterious,分值-2.5~14,预测为Neutral,分值越小越有害,反之亦然。

(9)REVEL 

https://sites.google.com/site/revelgenomics/

REVEL是一种错义突变预测的集成方法,结合了多个软件 (MutPred、FATHMM、VEST、PolyPhen、SIFT、PROVEAN、Mutation Assessor、Mutation Taster、LRT、GERP、SiPhy、phyloP和phastCons) 的预测结果,使用致病和罕见的中性无义突变进行训练,运用random forest算法,对罕见错义突变的预测效果较好。单个突变的预测得分范围0-1,阈值可根据所需灵敏度和特异性需求设定。

(10)Gene Splicer

http://www.cbcb./software/GeneSplicer/gene_spl.shtml

该工具是一种快速、灵活检测各种真核生物基因组DNA剪接位点的系统。通过RNA剪接的保守型序列GU-AG规则。结合MDD (maximal dependence decomposition) 决策树方法和马尔科夫模型来检测真核mRNA的剪接位点。该系统已在恶性疟原虫 (疟疾)、拟南芥、人类、果蝇和水稻上进行了成功的训练和测试。

(11)SPIDEX

http://www./annovar/spidex_download_form.php

由基因组学深度学习知名机构Deep Genomics出品,使用最新的深度学习算法对多个数据集进行训练,可对剪切位点附近300bp以内的位点进行预测,确定单核苷酸变异 (SNV) 是否影响剪接,还可以分析外显子区域的同义、错义和无义突变。预测输出|z|>=2提示破坏剪接。

(12)HSF

http://www./HSF/technicaltips.html

系统结合了12种不同的算法来识别和预测突变对剪接Motif的影响,包括受体和供体剪接位点,已知的增强或抑制剪接的分支点和辅助序列,这些算法基于PWM矩阵、最大熵原理或Motif比较方法。检测类型和阈值设定详见网页。

(13)GERP

http://mendel./SidowLab/downloads/gerp/

基因组进化速率评测,使用最大似然法对具体位点的进化速率进行估算。GERP分数用于衡量进化中跨物种基因序列的保守情况。高GERP分数意味着序列高度保守,因此改变是有害的。RS (rejected substitution) 分值代表位点的保守性,分值越高越保守,改变越有害。

图片

※注意

对突变位点有害性预测方法在不断发展,多数算法预测已知致病的错义突变的准确率能达到65%-80%,从而为判断变异致病性提供有效证据。

根据《ACMG遗传变异分类标准与指南》,在使用这类软件时需注意:虽然许多不同的分析软件程序使用不同的算法进行预测,但其基本原理是相似的;因此,在序列解读中,不同软件工具组合的预测结果被视为单一证据而不是相互独立的证据。

因为每个软件工具基于他们使用的算法都各有优缺点,所以仍然建议使用多种软件进行序列变异解读;很多情况下,预测性可能因为基因和蛋白质序列的不同而有差异。

无论如何,这些软件分析结果只是预测,他们在序列变异解读中的应用应该慎重。不建议仅使用这些预测结果作为唯一证据来源进行报告分析解读及临床判断。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多