2023年41篇(共391篇)原创文章 4月末,有幸收到元英进院士邀请,到天津参加京津冀DNA存储前沿研讨会。因上个月二阳后身体不适,公众号停止更新,很是抱歉。元老师的报告内容丰富,我分成上、中、下三篇撰写“听讲笔记”。行文过程中得到元老师亲自指导,他非常认真,我受益匪浅,万分感激。如有错漏之处,还是我个人的学识浅薄所致,文责自负,敬请指正。从距今5000多年以前的结绳记事开始,人类就开始存储数据。历经了500年的纸质时代和50年的磁光电时代,人类的数据存储形式由文字过渡到照片再到视频。我们可以看到,当数据存储的介质没有发生变化,数据革新是很有限的。因此,当今爆炸式增长的数据,磁光电存储模式面临功耗、密度等诸多挑战,人类亟需新的存储介质。 美国科学家、控制论的创始人维纳(N. Wiener)和俄罗斯科学家Neiman在上世纪六十年代就提出: DNA的双螺旋结构,和绳结在形态上有异曲同工之妙。Wiener N. Interview: machines
smarter than men? US News World Rep. 1964,56,
84–86. Neiman M S. On the molecular memory
systems and the directed mutations. Radiotekhnika,
1965, 6: 1-8 从这个意义上说,合成生物学的理念在上世纪60年代就提出来了。 即便我们从思路上把碳基世界的DNA和硅基世界的0-1二进制联系在一起。但在60年代,我们没有规模化合成DNA的技术水平。到了现在,我们掌握了DNA存储的技术,践行了当年的原理:把文档、音乐、视频背后的0-1二进制,编码成为DNA的碱基序列。再通过扩增、测序、再解码的方式,把存储的信息读取出来。 随着人类科技的进步,DNA存储概念从60年代到今天,取得了许多重要进展:2012-2013年:哈佛医学院、欧洲生物信息中心,首次在寡核苷酸池存储超过百KB的数据。 2016年:德州大学奥斯汀分校、华盛顿大学、微软公司,实现了存储信息的“随机访问”。2017年:哈佛医学院运用CRSPR技术,将视频写入了大肠杆菌的菌群。2018年:华盛顿大学、微软公司的存储数据量首次突破200MB。2020年:哥伦比亚大学、苏黎世联邦工学院,用存储有数据的DNA打印物品。2021年:天津大学,构建首个存储信息的人工染色体。清华大学,镜像DNA存储并扩增数据。经过那么多年,DNA存储的核心关键技术发展,就是围绕以下内容:信息的编码→数据的写入→DNA介质→介质的读出→信息的解码 这里面涉及了一系列的技术和多学科的努力,以及广泛的商业实践机会。 正因为这是多学科、多专业的融合赛道,因此需要政界、学界、商界、金融界之间的紧密联系和协作。2020年10月,Twist Bioscience、Illumina、Western Digital(西部数据)、微软研究院等公司和机构联合成立DNA数据存储联盟(DNA data storage Alliance)。我们也很期待中国有这样的联盟,将不同领域的专长和能量汇聚在一起。2021年6月,联盟发布首份白皮书《保存我们的数字遗产:DNA数据存储》(Preserving Our Digital Legacy: An Introductionto DNA Data Storage)。白皮书介绍了DNA存储的基本原理、技术概述、潜在的新存储介质的成本,讨论了使用DNA存储的必要性,以及其在解决数字数据指数增长方面的前景。白皮书预测:2030年,1TB仅需1美元;密度比LTO 9(18TB)磁带提升10万倍,达1.8 EB。 未来随着 DNA 合成通量的上升和成本的下降,DNA 存储有望革新信息存储载体的行业生态。 正是基于这样的市场预期,DNA数据产业的创业和融资已拉开帷幕。 例如,【联川生物】在IPO的招股说明书中,提到第二代高通量DNA合成技术和合成仪器,将应用到DNA存储赛道。 例如,DNA数据存储服务商【中科碳元】,是国内首批专注于DNA数据存储的企业,由中科院深圳先进技术研究院孵化成立。
最新披露的融资是2021年8月的英诺天使基金领投的数千万人民币。 例如,致力于合成生物学研发和应用的高科技公司迪赢生物,是国内第一家实现DupSeq商业化的公司。
最新披露的融资是2021年12月字节跳动战略投资部。 DNA存储产业海内外的融资情况可参考下表。 最新的融资,大部分都集中在2021-2022这两年。 商业化落地的周期较长,是风险投资机构谨慎出手的原因之一。 2023年披露融资的只有基因合成技术研发商Evonetix(B+轮)。
|