分享

“穿孔卡”DNA可能意味着更便宜的大容量数据存储

 西当源 2020-04-09

这种新方法可能比其他的基因存储方法更快、更简单。

如果地球上每个人都不得不依赖闪存(一种用于存储卡和U盘的数据存储系统),那么到2040年,全球预计将产生的信息量将比微芯片级硅的预期供应量高出100倍。为了防止这样的危机,研究人员一直在探索生命本身所依赖的一种存储材料:DNA

从理论上讲,这种物质可以储存大量的信息——每立方毫米DNA可以储存1eb(10亿千兆字节)的信息——长达数千年。作为大多数数字档案基础的磁带的最长寿命约为30年,但70万年前化石的DNA仍然可以测序。然而,使DNA数据存储成为现实的一个障碍是,创建或合成符合所需代码的新DNA序列的过程缓慢、昂贵且容易出错。

伊利诺伊大学厄巴纳-香槟分校(University of Illinois at Urbana-Champaign)的编码理论家奥吉卡·米伦科维奇(Olgica Milenkovic)表示:“在记录成本、准确性和书写速度方面,合成DNA是一个主要瓶颈。”她和她的同事提出了一种新的解决方案:用“刻痕”模式标记现有的DNA分子来编码数据,而不是从头开始自定义合成DNA。这种方法受到打孔卡的启发,打孔卡是一种硬纸板,在特定的位置打孔,用来存储许多早期计算机的信息,包括二战时期的ENIAC。研究人员周三在《自然通讯》(Nature Communications)杂志上详细介绍了他们的技术。

以前的DNA存储方法处理四种关键的DNA成分,即碱基——腺嘌呤、胸腺嘧啶、胞嘧啶和鸟嘌呤类电子比特,即编码数字数据的10。例如,每个碱基可能被赋值为00011011。但是,这种新方法并没有将一系列的位元转换成DNA代码,也没有合成相应的碱基串,而是把现有的遗传物质当作类似于早期打孔卡片的纸张。这项研究的主要作者S. Kasra Tabatabaei说,酶是“打孔的设备”。在这种情况下,这些“孔洞”是组成DNA骨架的分子之间被切断的键。出现这个标记表示1,若没有则表示0

布朗大学(Brown University)的理论化学家布伦达·鲁宾斯坦(Brenda Rubenstein)说,这项研究最有趣的方面是它如何依赖于自然。她没有参与这项研究。她说,“研究人员让这些酶做它们最自然的事情,从而留下痕迹来储存信息”

为了精确定位这些“孔洞”(即酶留下的痕迹),研究小组对双链DNA分子进行加热直到它们在中间展开一点点。这个过程会形成气泡,使碱基暴露在外。接下来,科学家用单链DNA分子,每个分子只有16个碱基长,让它们附着在这些气泡内相应的碱基序列上。这些单链分子的末端起着向导的作用,告诉酶去哪里。在DNA中,每个碱基连接一个糖分子和一个磷酸基,形成一种称为核苷酸的化合物。新技术中使用的酶切断了一个核苷酸与另一个核苷酸之间的连接,从而在糖-磷酸轨道上形成一个缺口。

因为这种方法不需要合成精确的DNA序列,研究人员说,它的一个重要优势是,他们可以像打孔卡一样处理几乎任何DNA分子。例如,他们用从现成的大肠杆菌菌株中廉价获取的遗传物质进行实验,研究人员知道这些菌株的非常精确的序列。利用450个碱基对的细菌DNA链,每个碱基对包含510个孔洞,科学家编码了亚伯拉罕·林肯的葛底斯堡演说的272个单词和一个14千字节的林肯纪念堂的图像。在他们把这些信息放在DNA上之后,使用测序技术以很高的准确率读取出了这些文件。

鲁宾斯坦说:“多年来,人们一直认为分子计算就是把我们在硅上所做的事情映射到分子上,从而产生了很多小题大做的装置。相反,这项新研究表明,酶在数百万年的进化过程中,其效率是令人难以置信的。”

科学家们希望他们的方法能比那些依靠合成DNA的方法更便宜、更快。然而,过去提出的DNA数据保存策略仍然有一些优势,比如存储密度大约是穿孔卡技术的1250倍。不过,目前DNA数据存储的最大问题不是密度,而是成本。米伦科维奇说,“我们的成本真的很低,甚至可以更低。此外,她补充说,较老的DNA存储系统必须包含冗余序列,这是防止传统DNA合成易出错的一种保障。这一需求减少了它们实际能够容纳的数据量,缩小了它们与新技术之间的存储密度差距。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多