美国研究人员研发新型DNA存储技术 存储密度大幅提升
哥伦比亚大学和纽约基因组中心(NYGC)的研究人员利用一种手机视频流算法展示了如何最大化利用DNA的存储潜力,成功将海量信息压缩至脱氧核糖核酸(DNA)的四个碱基。该方法能够将215PB(1PB=1024TB)数据存储在一克DNA中,相当于Google和Facebook服务器上数据量总和的两倍。全世界每天产生的信息量超过2.5quintillion(百万的三次幂)字节的数据,目前世界上近90%的数据是在过去两年中产生的。随着人类生活越来越多的使用数字化存储,该趋势会继续扩大。现今的存储设备已渐渐无法满足巨大数据量的需求,而依靠DNA存储或将成为未来大数据量存储的崭新发展方向。该研究成果已发布在近期的《科学》杂志上。
DNA存储技术是一项着眼于未来的具有划时代意义存储技术,其利用人工合成的DNA作为存储介质,具有高效、存储量大、存储时间长、易获取且免维护的优点。DNA作为一种理想的存储介质,因为其体积超小,在阴凉干燥的环境下可储存上千年。该项研究的合著者、哥伦比亚大学计算机科学教授雅尼夫·埃尔里赫表示,DNA不会像磁带和CD那样随时间的推移而分解,且不会过时。
埃尔里赫与纽约基因组中心的助理研究员迪娜·杰林斯基选择以下六个文件编码写入DNA:一个完整的计算机操作系统、一部1895年的法国电影、电影《火车到站》、一张50美元的亚马逊礼品卡、一组电脑病毒、一块“先驱者”徽章和一项信息理论家克劳德·香农1948年的研究成果。研究人员将所有文件压缩成一个主文件,然后将数据分成由1和0组成的二进制码短字符串。使用“喷泉码”纠删算法,随机将字符串打包成所谓的“水滴”,并将每个“水滴”中的1和0绘制在DNA的四个碱基(A、G、C和T)上。
研究人员一共研制了72000个DNA链,每个链上含有200个碱基,他们将这些DNA以文本文件的形式送往旧金山DNA合成公司Twist Bioscience,该公司擅长将数字数据转换为生物数据。为恢复文件,研究人员使用现代测序技术读取DNA链,然后利用软件将一串代码转换为二进制。研究报告称,先前的文件顺利得到恢复,且错误率为零。研究人员还验证了使用编码技术创建一个几乎无限数量的文件,这项技术通过聚合酶链反应(PCR)使DNA样本增殖,这些文件、甚至是文件的副本所恢复后的文件都可以达到零错误率。
研究人员表示,其编码策略可在1克DNA上容纳215 PB的数据,是哈佛大学、欧洲信息生物研究所研究结果的100倍。这是有史以来密度最高的数据存储设备。DNA数据存储能力理论上可实现每种碱基存储两个二进制位,但由于DNA本身的生物约束,以及重组和读取需要加入冗余信息,DNA的实际存储能力为每种碱基可存储1.8个二进制位。使用该团队的喷泉码技术使读取和写入过程更高效,平均每个碱基的存储量可达到1.6个二进制位。
https://v.qq.com/txp/iframe/player.html?vid=t0383tia0pp&width=500&height=375&auto=0
目前DNA存储尚不适合用于普通存储用途。一方面是代价高昂,在本次实验中合成DNA共耗资7000美元,读取数据花费2000美元(未来测序DNA的价格有望日渐低廉);另一方面是读写时间较长,通常需要数周时间进行解析和读取,未来一旦实现分子快速编码解码技术,DNA存储将为较大数据量的存储技术带来革命性的进步。
来源:物理学家组织 等/图片来自互联网
中国国防科技信息中心 张珂 刘爽
如需转载请注明出处:“国防科技要闻”(ID:CDSTIC)
觉得不错,请点赞↓↓↓