分享

chEMBL数据库赋能医药创新

 翌然生物 2023-06-03 发布于广东

ChEMBL

人类基因组序列为改善人类健康提供了完整的“分子零件清单”。现在的一个关键任务是记录基因产物与药物及类药分子的相互作用。ChEMBL是一个“化学基因组学”数据库,汇集了化学、生物活性和基因组数据,以帮助将基因组信息转化为有效的新药物。因此,该资源对于大型制药公司、小型企业和学术机构中的药物发现研究人员都有很大的帮助。该数据库对分子进行了人工校正,并且是完全开源的,它不仅包含了小分子如何和蛋白靶标相互作用的信息,还包含分子的2D结构、计算属性(如logP、分子量、Lipinski参数等)和抽象的生物活性(如结合常数、药理学和ADMET等数据)。这个数据库旨在将基因组信息转化为有效的新药物。当前Release 32版本中包含8.6万篇文献和专利,240万个化合物和150万个生物实验的数据,这些数据与PubChem BioAssay和BindingDB等数据库进行数据交换。

ChEMBL数据库的优势

1. 综合全面:chEMBL数据库集成了化学、生物活性和基因组数据,为研究人员提供了一个全方位的资源,可以深入了解化合物的性质和活性。相比其他数据库,chEMBL提供了更全面的数据集,为药物发现研究提供了更丰富的信息。

2. 人工校正:chEMBL的数据是通过人工校正和抽取的,从主要的科学文献中获取。这种高质量的手动策划确保了数据的可靠性和准确性,与自动抽取或其他方式相比,更加可信。

3. 开放共享:chEMBL是一个开放获取的数据库,任何人都可以免费访问和使用其中的数据。这种开放性促进了科学共享和合作,有助于加速药物研发的进展。

4. 丰富的候选化合物:chEMBL数据库中包含了大量的药物候选化合物,包括已上市的药物和正在临床开发的化合物。这使得研究人员可以在一个平台上查找和分析具有潜在治疗价值的化合物,节省时间和资源。

5. 详细的治疗靶点和适应症注释:chEMBL为化合物提供了详细的治疗靶点和治疗适应症的注释。这使得研究人员可以更好地了解化合物的作用机制和潜在用途,有助于药物设计和优化的决策过程。

图1 ChEMBL数据库中包含的数据类型

ChEMBL数据库提供了全面的药物信息,包括化合物的结构、计算属性、生物活性数据以及与治疗靶点和适应症相关的注释,这使得研究人员能够在一个平台上获得关于药物的综合信息。

图2 ChEMBL数据库中包含的药物信息类型

目前ChEMBL中大部分的活性数据是通过人工的方法,从七个药物化学期刊的全文文章中提取的,这些期刊包括:MedChemComm、Journal of Medicinal Chemistry、ACS Medicinal Chemistry Letters、European Journal of Medicinal Chemistry、Bioorganic & Medicinal Chemistry、Bioorganic & Medicinal Chemistry Letters、Journal of Natural Products。对于这些期刊,每个新期刊中的每篇文章都会筛选是否存在定量的小分子(或肽段)生物活性数据。数据有时也会从其他期刊和文章中提取,ChEMBL中排在Top15的期刊文献数量统计如图3所示。ChEMBL数据库的原始数据整理流程涵盖了数据抽取、标准化、注释、整合和维护等关键步骤。这些流程确保了数据库中的数据质量和可用性。

图3 ChEMBL中Top15期刊文献统计(2019年统计数据)

图4 ChEMBL数据整理流程

ChEMBL数据库可以通过以下四种方式进行访问:

1. 网页界面:chEMBL提供了一个用户友好的网页界面,通过在浏览器中访问chEMBL的官方网站(https://www./chembl/),用户可以直接在网页上浏览和搜索数据库中的化合物和相关数据。网页界面提供了丰富的搜索选项和过滤功能,以便用户根据自己的需求查询所需的数据。

2. API访问:chEMBL还提供了应用程序编程接口(API),允许开发人员通过编程方式访问和查询数据库。API提供了各种功能和方法,例如检索化合物、查询活性数据、获取结构信息等。开发人员可以使用API来集成chEMBL数据到自己的应用程序或工具中。

3. 数据下载:chEMBL数据库还提供了可下载的数据集文件,用户可以直接下载数据并在本地进行分析和处理。数据集文件包括化合物数据、活性数据、药物靶点信息等,以及与药物相关的其他注释信息。

4. 数据库镜像:chEMBL数据库的镜像副本可以在本地安装和部署,使用户可以在自己的服务器上运行和访问数据库。这种方式适用于那些需要频繁访问和处理大量数据的用户,可以提供更快的查询速度和更高的灵活性。

图5 ChEMBL数据四种访问方式

图6 ChEMBL网页版访问结果展示

参考文献:

Mendez D, Gaulton A, Bento AP, Chambers J, De Veij M, Félix E, Magariños MP, Mosquera JF, Mutowo P, Nowotka M, Gordillo-Marañón M, Hunter F, Junco L, Mugumbate G, Rodriguez-Lopez M, Atkinson F, Bosc N, Radoux CJ, Segura-Cabrera A, Hersey A, Leach AR. (2019) 'ChEMBL: towards direct deposition of bioassay data.' Nucleic Acids Res., 47(D1) D930-D940.

关注我获得

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多