为存储海量数据,谷歌用了超过90万台服务器,微软建设了8300平方米的数据中心。未来用DNA存储,只要一块方糖大小的面积就可够了。 当前,存储技术已经跟不上数据产生的速度了,1995年上映的电影《捍卫机密》的情景,很有可能发生在现实世界。该故事讲述了一个人脑可以运输数据的时代,强尼为了在脑中运输更多的数据,洗去了自己的记忆。 就在4月,微软研究院和华盛顿大学联合研究团队发表的一项DNA存储研究成果表明,强尼完全没有必要这么做,因为他体内一立方毫米的DNA就可以储存超过10亿GB(十亿字节)的数据。 上述团队利用组成DNA的四种碱基(ATCG),表示计算机语言1和0,按照数字编码的顺序人工合成DNA链,实现信息的存储;读取信息时,使用DNA测序技术测得碱基顺序,再转化成数字编码。 研究人员在每条DNA链上都添加了“地址信息”,方便读取信息时快速查找到相应的DNA链。DNA体积微小,所以其存储密度远高于传统硬盘。 利用DNA提升存储密度有其必要性。存储专家、《大话存储》的作者张冬告诉《财经》记者,下一代硬盘存储技术是热辅助磁记录(HAMR)技术,使用高温激光提升材料磁性,进而提高硬盘存储能力,存储密度会比现在翻几倍,但HAMR之后,暂时没有新技术可以提升容量。 然而,数据存储需求正在以指数级速度增长,市场研究公司IDC和存储设备厂商EMC的研究指出,到2020年全球计算机、历史档案、电影、照片、企业系统和移动设备中的数据量将达到44万亿GB,是2013年的10倍。 为了存储海量数据,谷歌已经使用了超过90万台服务器,微软建设了8300平方米的数据中心。如果DNA存储能够代替服务器,谷歌和微软可以把数据中心做到一块方糖大小。 而且,DNA双链的稳定性可以让数据存储的时间更长。磁带能稳定保存数据的时间为10年—30年,硬盘为3年—5年,而人工合成的DNA可以超过500年。 研究人员已经成功将4张图片存储到DNA片段中,然后从DNA片段中读取、还原了这4张图片,没有损失一个字节的数据。
“现在可以用机器来合成DNA,但是机器只能合成短链,还需要把短链连接起来。” 中科院遗传与发育研究所高级工程师姜韬告诉《财经》记者,“测序方面,目前主流的第二代测序技术还是比电脑读取数据慢得多。”
他进一步表示,现在大家都还是把DNA上读取的遗传信息存入硬盘里,DNA存储还很遥远。因为合成和读取DNA序列的工作仍然比较复杂,速度也很慢。
不过,华盛顿大学计算机科学和技术副教授、论文共同作者路易斯·塞兹(Luis Ceze)则乐观地认为, 计算机技术过去一直在推动生物技术发展,现在到了生物技术“回馈”的时候了。 |
|