首页 > 范文大全 > 正文

DNA存储信息:突破极限

开篇:润墨网以专业的文秘视角,为您筛选了一篇DNA存储信息:突破极限范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

dna是个生物数据库,存储着我们体内的海量基因代码。科学家发现,它的这种能力其实还可以用来存储外部信息,一克DNA即能储存上千亿个千兆字节,相当于1000亿张DVD光盘的内容。

近日,哈佛大学维斯生物工程研究所的研究人员将一本大约有5.34万个单词的书籍编码到不到一沙克(亿万分之一克)的DNA(脱氧核糖核酸)微芯片中,连同文字一起的还有11张图片和一段Java程序。这是迄今为止人类使用DNA遗传物质储存数据量最大的一次实验,被刊登在最新《科学》期刊上。团队负责人乔治·丘齐(George Church)表示,“今后,拇指大小的设备或许就能存下整个互联网的信息。”

DNA存储的“野心”

“利用DNA来存储数据并不是一个新的概念。事实上,自从生物学确定了DNA结构,就有研究人员尝试将其用于存储和运算”,北京华大基因研究中心医学事业部主任甄二真告诉记者。

他介绍,DNA由4种碱基组成,分别为A(腺嘌呤)、 C(胞嘧啶)、G(鸟嘌呤)及 T(胸腺嘧啶),它们两两互补成对出现,共同构成了相互缠绕的双链螺旋结构。DNA可以被视为四位运算存储方式,存储量比二位运算存储大得多。

“目前通用的存储模式都是二位运算的。为了存储更多数据,早已有科学家尝试过使用物理方法实现四位运算。但是技术上难以实现,只能出现‘有’、‘无’、‘中间’三种状态,也就是三位运算,无法实际操作”,甄二真说,与之相比,DNA是天然的四位运算,有四个不同状态,与二位运算相比存储量大、运算速度也快得多。

处于信息爆炸的时代,很多科学家尝试以DNA存储数据。比如今年初,台湾国立清华大学和德国卡尔斯鲁厄技术研究所以三文鱼的DNA作为基础,制造出单次写入多次读取的存储器。不过,这个DNA存储器的有效时长只有30小时。

甄二真表示,这些DNA无法长期存储数据是因为研究人员使用的是来自活细胞的基因组,这些细胞不仅会死亡,而且还会分裂复制,对其中存储的数据有致命性打击。

合成DNA:改变存储模式

为了排除细胞会死亡、分裂、变异而使数据内容发生改变的危险,丘奇率领的团队避免使用活细胞,而是采用人工合成的DN段,并将片段用喷墨打印机嵌入到芯片上。

这一次,丘奇选择存储在合成DN段上的信息是他的著作《再生:合成生物学将如何改变未来的自然和自己》。首先,他把书中的图片、文字、程序转化为HTML格式的文件,再将其编译为由 0和1组成的电脑能够读懂的二进制数据。随后,这些二进制数据被转化为四种碱基,即把0转为A或 C,把1转成G或者T,并将其建立在DNA双链螺旋结构上来。

至于读取数据的过程其实就是测序,通过DNA测序仪将DNA序列中的编码按顺序排列,还原为二进制格式的数据,用电脑“读”出来。

尽管听起来很复杂,甄二真表示其中重要一步就是将二进制数据转化为4位运算数据(A、C、G、T),做成DNA链结构,这可以使存储量按级数增长。而以经化学反应得到的合成DNA取代活细胞使得这项研究成果更符合现实意义。此前以细胞内DNA来存储信息一直无法取得技术突破,只能在短期内保证数据安全,此次转换思路是被《科学》认可的关键。

突破传统存储的极限

与目前流行的存储方式相比,DNA存储的最大优势就是单位存储量大。北京邮电大学信息与通信工程学院副教授陈光表示,现在使用的光介质和磁介质在存储量上都几乎达到了极限,这就需要研究其他存储方式,比如DNA存储这样的生物介质。

他告诉记者,磁介质包括磁带、磁盘、硬盘等。硬盘的存储量可达上百G,但由于现在硬盘数据存储密度提升的空间已经有限,基本不太可能出现单碟1000G的硬盘,所以如果硬盘体积不变,容量难以实现大幅突破。而CD、DVD等光介质存储对表面积的要求更大,磁介质可以分几层存储数据,光介质只能单层平铺保存信息,单位存储量更小。

DNA可以很好地解决这一存储量的问题。甄二真表示,这不仅与四位运算的特性有关,也与DNA特有的双链螺旋结构有关。这一结构可以把DNA序列压缩得足够小,整个立体空间都可以利用,比磁介质和光介质的平面存储更具优势。按照哈佛团队给出的数据,“一克DNA即能储存上千亿个千兆字节,相当于1000亿张DVD光盘的内容”。

此外,合成DNA的稳定性也很优秀。陈光介绍,磁介质是建立在电磁的基础上,工作环境受到限制,容易出现消磁等现象;而光介质受环境影响小一些,但耐久性不理想。与这两者相比,合成DNA不存在细胞死亡、变异等影响,在室温下很稳定,甚至可以存放数万年而不变。

尚难大范围应用

对于DNA存储的前景,此项目另一位负责人瑟里拉姆·库苏里(Sriram Kosuri) 表示,随着DNA合成、测序价格的不断下降,这或许将成为长期存储数据的一种选择。而现阶段,它距离商业化还很远。

甄二真表示,不仅是成本问题,DNA存储还存在控制难点。与二进制存储相比较,磁介质0、1之间的转换只需加磁、消磁即可实现,而光介质可以通过刻录机将数据以“平地”或“坑洼”的形式烧写在光盘上,这些都比较容易实现。而将数据“写”入DNA则困难得多,难以做到“即时写”,因此目前只有数据归档等用途。

同样的,合成DNA相当费时。甄二真介绍,目前已经有自动合成仪可以将碱基连接起来,形成DNA序列,但是一般只能连接20到30对碱基,再长就难以实现了。此次哈佛团队采用的也是短DNA序列来编码数据。

与写入数据费时费力相比,利用测序仪来读取DNA存储数据虽然速度也不快,但是甄二真认为,未来测序速度大幅提高相对容易实现,也就是DNA存储有可能做到“即时读”。

在陈光看来,有些应用对写入数据的速度要求不高,只要读取速度可以接受就行了。此外,作为生物介质之一,DNA存储于人体更具“亲和力”,较易与人体蛋白融合。未来有一天也许可以嵌入人体内工作,这时只需存入特定数据就可以了,存储慢的问题就很好解决了。