广告

DNA 数据存储超越摩尔定律

了解 DNA 数据存储如何提供解决方案,以应对摩尔定律的局限性,实现巨大的数据存储容量。

Google NewsGoogle News Preferred Source

新闻简报

注册我们的电子邮件新闻简报,获取最新的科学新闻

注册

滴在移液管中的粉红色溶液,其中包含数百万个 DNA 分子,可以存储 10,000 千兆字节的数据。(图片来源: Tara Brown Photography/华盛顿大学) 过去几十年来,人们越来越清楚地认识到摩尔定律已经开始瓦解。1965 年的观察结果以戈登·E·摩尔的名字命名,指出芯片上的组件数量似乎每年翻一番,但我们正达到硅存储能力的极限。为了不断推动计算技术的界限,我们需要重新思考计算机的基本组成部分。DNA 存储领域可能为我们日益数字化的世界中一个日益突出的问题提供解决方案:互联网组成的数十亿千兆字节的数据存储在哪里?华盛顿大学计算机科学系副教授 Luis Ceze 表示:“构建更好的计算机很大程度上在于寻找更好的材料来构建计算机。“所以,硅恰好是一种很棒的材料,但它已经达到了我们可能无法继续用硅推动的临界点。因此,我发现生物学已经进化出许多对未来构建更好的计算机有用的分子,这令人着迷。”

广告

超越硅

目前的档案设施,例如 Facebook 最近在俄勒冈州 建造 的数据存储中心,占据了整个仓库,最多可存储约 1 EB(10 亿千兆字节)数据。这仅占整个互联网的一小部分,预计到 2017 年将达到 16 ZB,即 16,000 EB。研究人员表示,通过使用地球生命蓝图的 DNA 来编码信息,他们可以将所有这些信息压缩到你的客厅大小。通过将信息位从计算机芯片上的 1 和 0 转换为 DNA 的四种字母,科学家们可以创建 DNA 链,这些 DNA 链可以编码你想要的任何内容,从泰勒·斯威夫特的歌曲到国会图书馆。要做到这一点,研究人员会构建一个索引,将构成 DNA 的四种核苷酸 (A、T、C 和 G) 与我们已经在计算机上使用的 1 和 0 字符串关联起来。DNA 合成器会创建短 DNA 链,每条链都包含文件代码的一部分。一旦所有信息都被转换为 DNA,就可以使用读取核苷酸组合的 DNA 测序仪来存储和检索信息。

一种更好的 DNA 编码方式

Ceze 是华盛顿大学一支研究团队的成员,该团队开发了一种编码和读取存储在合成 DNA 中的信息的新方法。他们借鉴了一种广泛使用的音频压缩工具,称为 Huffman 编码,这是一种以更短的方式表达二进制代码字符串的方法。他说,他们的方法通过减少冗余(为了弥补错误而制造多个相同链的过程)实现了更大的存储容量,并且允许在不测序所有存储的 DNA 的情况下读取数据的各个部分,而这在以前是做不到的。该方法在 DNA 链中包含独特的“引物”,在测序过程中可以靶向这些引物以突出显示特定链。他们说,这提高了他们系统的功能性,消除了读取单条链就必须测序整个数据库的需要。作为概念验证,该团队将几个图像文件的信息编码到合成 DNA 中,并成功地对链进行测序以重新绘制图像。虽然他们只编码了几兆字节的信息,但 Ceze 说,该过程可以扩展以存储更大的数据库。Ceze 说:“如果我们从密度或特定体积内的位数来看,DNA 的密度将是闪存的至少十亿倍。你可以在一立方英寸的空间里存放一个 exabyte,也就是几块方糖。”

研究人员将 DNA 转换成的三张图片,然后又变回了图片。(图片来源: Bornholt et. al/华盛顿大学) Ceze 强调,合成 DNA 来存储数据与基因工程无关。他们的目标不是试图将正确的 DNA 链组合起来以创造一个有机体,他们的这种方法是完全合成的。

DNA 计算机

将数据存储在 DNA 链中有一个明显的缺点:速度慢。与使用电子以近乎光速通信的计算机芯片不同,DNA 数据存储依赖于物理移动分子。因此,Ceze 表示,我们不应期望在附近的电脑商店看到 DNA 硬盘。相反,他设想使用 DNA 数据存储来保存海量数据存档,例如 Facebook 和云存储服务使用的那些,在这些应用中速度不是那么关键。该技术仍然很昂贵。但是,Ceze 说,即使与五年前相比,价格也已大幅下降。他期待 DNA 合成和测序成本的进一步降低,这将提高 DNA 数据银行的可行性。Ceze 说:“计算机以前很昂贵,然后它们变得便宜,因为市场需求下降了价格。现在,DNA 存储正在创造比生物医学行业更大的(对 DNA 合成和测序)需求,这将推动价格下降。”

保持好奇

加入我们的列表

订阅我们的每周科学更新

查看我们的 隐私政策

订阅杂志

订阅可享封面价高达六折优惠 《发现》杂志。

订阅
广告

1篇免费文章