分享

AI-DNA计算机的挑战,你准备好了吗?

 6231wd 2019-12-16


     

基因组(Genome)是指人体所有遗传信息的总和,即人体每个体细胞中的全套基因,包括DNA序列中的60亿个A、T、C、G碱基[1, 2]。20世纪90年代初开始,多国科学家参加了全球范围内的全面研究人类基因组的重大科学项目。旨在阐明人类基因组的碱基配对,破译人类全部遗传信息,能够使人类第一次在分子水平上全面地认识自我[1]

Figure 1  人类基因序列简图  图片来自: pic.people.com.cn

    历时十年的人类基因组草图已经绘制完成,这是人类科学史上的一个重大突破。然而,进行基因测序的成本问题,包括资金成本和实践成本,一度被认为是基因测序无法克服的问题。随着高通量技术的发展,基因测序的价格已经降低到了原来的几十万分之一[3]。2000年左右,基因测序需要3000万美元,到2015年,基因测序的成本已经跌破1500美元,如今,基因测序只需不到100美元。这个价格几乎是所有人都能承担的起的,并且随着技术的发展,价格可能会进一步下降,这也造就了基因组的大数据。

 Figure 2基因数据量大 图片来自 gouwu.mediav.com

人类的基因组包括60亿个碱基对,这是什么样的概念呢?如果要把一个人所有测得的数据全部打印出来装订成册。以每页300词,每本100页的话,可能要装订100万册。当然,这还只是一个人的基因序列,如果把全球60亿人的数据收集起来那是相当可怕的。然而,拥有这些数据巨大的数据并不水我们的最终目的[4]。面对浩瀚如海的数据,我们的了解的仅仅是冰山一角,这些计算也超过了人类计算的范畴[4]。据文献报道,我们能了解只有3%,还有97%的DNA序列,虽然已经被我们所检测出来,但我们并不能知其所以然。那么多数据,仅仅靠人力阅读,工作量可以说是非常的巨大了。那么,有没有什么办法结局这样的问题呢?

有,答案是人工智能。人工智能(ArtificialIntelligence,AI)也称机器智能,是指由人工制造出来的系统所表现出来的智能[5],是研究、开发、模拟、延伸和拓展人的智能的理论、方法、技术及应用系统的一门新的科学。简单来说,人工智能是研究使计算机来模拟人的某些思维的过程的智能行为,包括学习、推理、思考、规划等的学科,主要包括计算机实现智能的原理、制造与类似于人脑智能的计算机,使计算机能实现更高层次的应用。

  Figure 3人工智能用于基因序列解读 图片来自sike.news.cn

大数据目前面临的挑战有数据端的计算速度快,增速极快,几乎是指数级的增长,而在样本端也存在样本量较小,样本端的质量问题。疾病相关的复杂化,包括动态的,有向的,双色的,非线性的[4, 6, 7]。AI能够完成人类所能完成的计算,同时能够比人脑做的更快、更准确。因此,利用AI进行基因大数据的解读和分析是解决剩下的一大部分内容最佳的方案[2]。AI和基因相辅相成。某个疾病与疾病的相关性是根据统计学统计出来的。比如,研究癌症和人体基因的关系时,首先,要统计大量的癌症患者的基因数据,然后进行比对。在筛选出相似的基因,即选定可能致癌的基因[5]

但即使基因检测获得了大量数据,对于疾病的指向性依据是有限的[7, 8]。而面对这样的情况,我们加入AI能够深度学习To C端数据库的功能或许有所助益。然而如何进行To C端数据库的功能呢?面对个体浩瀚的基因,如何计算一个人的精准医学呢?[9]大数据就需要更加强大的计算能力,最终会复杂到需要运用目前最先进的超级计算机。当指数数目达到上百个时,即使最快的超级计算机也只能望洋兴叹[11, 12]

那么,既然浩瀚的数据可以被计算,浩瀚的基因可不可以被计算呢?

DNA计算是利用巨量的不同的核酸分子杂交,产生类似某些数学运算的一种组合结果并对其进行筛选来完成的[10]。“DNA计算机”模型首先是由Adleman博士于1994年提出来的[6]。其实验结果公诸于世后,引起世界各国科学家极大关注。这个实验的成功开创了在分子水平进行计算的先例,证明了DNA计算的强大能力,突破了硅工业领域中难以达到的材料尺寸限制。它证明了DNA作为一种数据存储结构的独特应用前景,而这些正是现在电子计算机所望尘莫及。阿德拉曼的发现告诉我们,生命细胞和计算是有联系的;在生物学和计算机科学的交叉领域里,有很多秘密正等待着人们去揭开[13]

DNA计算机是一种生物形式的计算机,利用DNA建立的一种完整的信息技术形式,以编码的DNA序列为运算对象,通过分子生物学的运算操作以解决基因组的计算问题[16]。与传统的计算机相比,它的体积更小,存储量更大,运算速度较快,同时耗能较低,并且具有并行性。目前,DNA计算机的应用的基本模式是数学模型、非线性问题、基因分析以及图与优化模型等的组合,如下图所示[10, 17]

Figure 4 DNA计算机的基本原理 [15]

 2001年11月,以色列科学家成功研制成世界第一台DNA计算机雏形,它的输出、输入和软硬件全由在活性有机体中储存和处理编码信息的DNA分子组成[13]。它的最大优点是充分利用了DNA分子具有海量存储遗传密码以及生化反应的海量并行性。因而,以DNA计算模型为背景而产生的DNA计算机必有海量的存储以及惊人的运行速度。1 立方米的 DNA 溶液,可存储 1 万亿亿的二进制数据。十几个小时的 DNA 计算,相当于所有电脑问世以来的总运算量[14]。2002年,日本OLYMPUS研制出全球第一台真正能够投入商业应用的DNA计算机。他们开发的这种计算机有分子计算机组件和电子计算机组件两部分组成。前者用来计算分子的DNA组成,以实现生化反应,搜索并筛选出正确的DNA结果,后者则可以根据这些结果进行分析[19, 20]

Figure 5第一台DNA计算机 图片来自tech.sina.com.cn    

 美国加州斯克里普斯研究院和以色列理工学院科学家开发出一种生物计算机,目前可用于破译存储在DNA芯片中的加密图像。这是首次通过实验演示基于DNA计算的分子图像密码系统。由硬件、软件、输入和输出4个部分构成,输入、输出的是电子信号,硬件是各种金属、塑料、导线、晶体管的复杂组合,软件是一系列电子信号形式的机器指令[21]。并且可能具有较为轻便易携带的效果,很有可能具有较高的经济效益。美国加利福尼亚理工学院的科学家在显微镜下将DNA折叠成有趣的外型。同年夏季,这种“DNA折纸”技术获得了新的突破,可以用于建造超小型计算机芯片[22, 23]。英国研究人员找到了一种新方法,可以用把计算机常用的文件格式编码进DNA中。随着DNA测序和合成的价格持续下降,研究人员估计,DNA这种生物存储介质将在未来几十年内变得具有竞争力[24]。2目前,DNA的应用还只是集中在医学领域方面,例如,2007年,美国用DNA计算机实现RNA干扰机制。这种DNA计算机可进行基本的逻辑工作,能够用于人工培养肾细胞;2006年,美国用DNA计算机快速准确诊断禽流感病毒。能够更快、更准确的检测出西尼罗河病毒和禽流感病毒以及其他疾病。

   DNA计算机出现,使在人体内、在细胞内运行的计算机研制成为可能,它能够充当监控装置,发现潜在的致病变化,还可以在人体内合成所需的药物,治疗癌症、心脏病、动脉硬化等各种疑难病症,甚至在恢复盲人视觉方面,也将大显身手。但DNA计算机的应用不会局限在医学研究的领域,在电子存储、基因编程等方面都会有较为重要的优势。未来DNA在基因编程、疑难疾病诊治等方面具有重要的优势。

虽然,很多问题还有待克服,但是AI和DNA计算机的时代迟早会到来。那么,你做好迎接AI和“DAN计算机”冲击的准备了吗?

【参考文献】

1.       宗安民徐力, and 韩倩人类基因组计划的现状和展望.河南医学研究, 2001(02): p. 175-177.

2.       (美)埃里克·托普未来医疗 智能时代的个体医疗革命. 2016: 杭州:浙江人民出版社. 322.

3.       华大基因编著基于高通量技术的人类疾病组学研究华大基因. 50.

4.       Braich, R.S., et al., Solution of a 20-variable 3-SAT problem on aDNA computer.Science, 2002. 296(5567):p. 499-502.

5.       Winston著;崔良沂,赵永昌译.P.H., 人工智能 3. 2005: 北京:清华大学出版社. 525.

6.       Adleman, L.M., Molecular computation of solutions tocombinatorial problems. Science, 1994. 266(5187):p. 1021-4.

7.       Aubert, N., et al., Computer-assisted design for scaling upsystems based on DNA reaction networks. J R Soc Interface, 2014. 11(93): p. 20131167.

8.       Taghipour, H., M.Rezaei, and H.A. Esmaili, Solving the 0/1knapsack problem by a biomolecular DNA computer. Adv Bioinformatics, 2013. 2013: p. 341419.

9.       Su, X. and L.M. Smith,Demonstration of a universal surface DNAcomputer. Nucleic Acids Res, 2004. 32(10):p. 3115-23.

10.     Grody, W.W., Molecular genetics. Introduction. ArchPathol Lab Med, 1993. 117(5): p.470-2.

11.     Rogowski, L. and P.Sosik, The laws of natural deduction ininference by DNA computer.ScientificWorldJournal, 2014. 2014: p. 834237.

12.     Sakowski, S., et al., A detailed experimental study of a DNAcomputer with two endonucleases. Z Naturforsch C, 2017. 72(7-8): p. 303-313.

13.     黄俊民,顾浩等编著计算机史话. 2009: 北京:机械工业出版社. 39

14.     郑杨., 我国在DNA计算机领域取得重要进展经济日报. p. 004

15.     许进 and 张雷DNA计算机原理、进展及难点(Ⅰ):生物计算系统及其在图论中的应用.计算机学报, 2003(01): p. 1-11

16.     Zhang, Z.Z., J. Zhao,and L. He, [Progress in molecular biologystudy of DNA computer].Yi Chuan Xue Bao, 2003. 30(9): p. 886-92.

17.     Sarkar, M., P. Ghosal,and S.P. Mohanty, Exploring theFeasibility of a DNA Computer: Design of an ALU Using Sticker-Based DNA Model.IEEE Trans Nanobioscience, 2017. 16(6):p. 383-399.

18.     PatriciaReaney,宫宇峰全球首台DNA计算机问世.英语文摘, 2002(1): p. 34-35.

19.     DNA计算机告别科幻时代.发明与创新(综合版), 2001(1): p. 40-40.

20.     颜世宗DNA计算机告别科幻时代.电子科技杂志, 2000(6): p. 24-25.

21.     美科学家开发生物计算机 能破译DNA芯片图像.生物医学工程研究, 2012(3): p. 156.

22.     美国DNA计算机解题能力创新高.世界科技研究与发展, 2002(3): p. 104.

23.     美国科学家发明“DNA折纸术”.生物技术世界, 2006(2).

24.     计算科学:用DNA取代硬盘.科技创业, 2013(1): p. 124.

25.     硅谷科学家将DNA制成活硬盘”.硅谷, 2012(11).

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多