分享

DrBioRight使用自然语言界面,方便科研工作者进行直观的数据分析

 GCTA 2022-06-11 发布于贵州


德州大学安德森癌症中心的研究人员开发了一个新的数据分析工具,它包含了一个用户友好的自然语言界面,允许没有生物信息学或编程语言方面专业知识的生物医学研究人员对大型数据集进行直观分析。

这个由人工智能(AI)驱动的开放存取项目,被称为 DrBioRight,旨在为所有研究人员降低障碍,以充分利用现代研究方法产生的日益庞大的数据。关于这个平台的报告今天发表在《癌细胞》杂志上。

生物信息学和计算生物学教授 Han Liang 博士说: “我们认为我们可以通过创造一个任何研究人员都可以使用的工具,来改进目前进行常规生物信息学分析的模式,并大大加快周转时间。”。“我们 DrBioRight 的长期目标是成为每位研究人员的智能合作者。”

现代生物医学研究中使用的高通量技术产生大量复杂的数据集,这些数据集提供了有关病人、动物模型或正在研究的细胞系的全面信息。这些可能包括,例如,研究整个遗传信息(基因组学) ,基因表达(转录组学) ,或蛋白质表达(蛋白质组学)。

梁解释说,因为这些“组学”数据集是如此复杂,如果没有专门的分析方法,回答特定的生物学问题是具有挑战性的。这些分析通常是通过使用用各种编程语言编写的计算机脚本来完成的,这需要对编程和生物信息学有一定的了解。

生物信息学家可以帮助导航和处理这些复杂的数据集,但是这项工作可能是耗时的。因此,研究小组开发了 DrBioRight,使研究人员能够更容易地通过用户友好的聊天界面与自然语言交互进行自己的数据日常分析。

面向自然语言的程序允许用户问程序的问题,就好像他们是在自然地说,而不是在复杂的编程语言,梁解释说。

对学术研究人员免费开放。最初,该计划有一些模块已经准备就绪,可以处理最常见类型的生物信息学问题,包括一些最常用的公共癌症数据集,如癌症基因组图谱和癌症细胞系百科全书

为了证实这种方法,研究人员用 DrBioRight 重复分析了一篇经典的癌症基因组学论文,发现它能准确地重现以前发表的结果。

因为这个程序是由人工智能驱动的,所以它也有能力从每个查询中学习并改进分析,随着时间的推移成为一个更有用的工具。展望未来,研究人员希望改进 DrBioRight,使用户能够分析自己的数据集,并允许开发新的模块。

“在我们努力改进程序的同时,我们也希望让其他生物信息学家贡献他们的算法,并教授 bioright 博士,”梁说。“整个研究团体的参与将有助于创造一种工具,能够更有效地回答复杂的研究问题。”

这项研究得到了美国癌症研究国立卫生研究院的支持(U24CA209851,U01CA217842,P50CA221703和 P30CA016672) ,MD 安德森医学院学者奖给梁和洛林戴尔生物信息学个性化癌症医学项目。

其他合作者包括: Jun Li,ph.d. ,Hu Chen,Yumeng Wang,ph.d. 和 Mei-Ju May Chen,ph.d. ,所有的生物信息学和计算生物学。和 y. Wang 也是位于 TX 休斯顿的贝勒医学院定量和计算生物科学研究生项目的成员。



参考文献:

1. https://www./cancer-cell/fulltext/S1535-6108(20)30433-5;

2. https://www./newsroom/next-gen-bioinformatics-tool-enables-big-data-analysis-without-programming-expertise.h00-159385101.html

-------------------------------------------------------------------------


    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多