分享

Nat. Biomed. Eng.| 深度学习优化治疗抗体

 DrugAI 2022-04-19

大家好,这次分享的是苏黎世联邦理工大学系统与免疫学实验室Sai T. Reddy课题组发表在Natrue Biomedical Engineering上的一篇优化治疗抗体的文章,题目是Optimization of therapeutic antibodies by predicting antigen specificity from antibody sequence via deep learning。

在传统方法中,治疗性抗体的优化是时间和资源密集型的,这主要是因为对在哺乳动物细胞中表达的全长抗体(~1000突变体)的低通量筛选中,通常很少得到优化前体。本文使用了深度学习方法,从大量不同的抗体序列空间中学习,通过预测抗原特异性来优化抗体的突变体。

为了产生训练数据,作者测序了治疗抗体曲妥珠单抗(trastuzumab,一种抗肿瘤药物,~10000突变体)的深度序列库,并筛选了这些库对人类表皮生长因子受体2(HER2)的特异性。然后,使用训练过的神经网络来筛选曲妥珠变异体的文库(~1亿突变体),并预测HER2特异性子集(~100万突变体),过滤其粘度、间隙、溶解度和免疫原性后,以产生数千个高度优化的优化前体。对未筛选文库中随机选择的30个变异的重组表达和实验测试表明,所有30个变异都对HER2保持了特异性。

主要流程

  1. 使用表达不能结合HER2抗原的变异体(CDRH3基因突变序列)的杂交瘤细胞系,由CRISPR-Cas9介导的同源定向突变(HDM)生成文库,并通过DMS检测筛选抗体的CDRH3的氨基酸序列和指导抗体文库的生成。

  2. 训练基于序列的机器和深度学习模型,能够预测对目标抗原HER2的抗体特异性。

    将氨基酸进行one-hot编码,使用了广泛的机器学习方法进行训练,包括逻辑回归、kNN、SVM、CNN和LSTM-RNN等模型。

    作者通过比较最终选择了CNN模型。

  3. 采用完全训练好的CNN模型对文库中7200万个序列变异体分类,筛选具有抗原结合性的变异体。

    将置信度设为0.7后,筛选出约600万个变异体。

    为了验证,作者随机选择了42个包含CDRH3序列的变异体,其中30个为正类,12个为负类。

    使用流量细胞计数法(Flow cytometry)发现30个正类变异体都具有抗原特异性,12个负类有11个未显示出结合活性。

  4. 对深度学习预测的抗原特异性序列进行进一步筛选,过滤其粘度、间隙、溶解度和免疫原性后,以产生数千个高度优化的优化前体,并对这些候选抗体进行实验评估。

参考资料

Mason, D.M., Friedensohn, S., Weber, C.R. et al. Optimization of therapeutic antibodies by predicting antigen specificity from antibody sequence via deep learning. Nat Biomed Eng (2021). 

https:///10.1038/s41551-021-00699-9

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多