dna将成为数据存储工具(在DNA上存储信息现在已经足够便宜可行了)(1)

我们需要承认这样一个事实,我们已经变成了数字囤积者,我们的数据已经没有存储的空间了。

2016年,人类总共产生了16.1万亿千兆字节的数字信息; 到2025年,这个数字预计将增加十倍以上。我们的个人照片、文字和电子邮件只是沧海一粟; 真正的洪水来自科学家们,他们在进行实验和临床试验时创造了大量的信息,深入研究生物学最微小的组成部分,观察其他行星,尽可能深入地探索浩瀚的宇宙。我们目前存放这些数据的地方ーー大部分是外部硬盘驱动器和云服务器机房ーー并不是一个完美的解决方案。它们占用了大量空间,每隔十年左右就需要升级。

生物技术创业公司正在寻找解决问题的方法,特别是在我们的细胞内。

大存储的最新趋势是在 DNA 中编码数据。毕竟,遗传物质已经是一种编码技术。它为生命编码: 每个人体细胞含有30亿个碱基对,这些配对的核苷酸要么是腺嘌呤(a)与胸腺嘧啶(t)配对,要么是鸟嘌呤(g)与胞嘧啶(c)配对。它们的顺序是所有蛋白质的配方,这些蛋白质执行我们(和所有生物)生存所需的功能。


包括美国军方研究机构国防高级研究计划局(Defense Advanced Research Projects Agency)在内的几家机构已经开发出了基于 DNA 的存储系统,可以将各种信息编码到微小而稳定的分子链中,这种分子链可以存储数千年。一些估计表明,通过 DNA 编码,世界上所有的数据都可以运行。

只有一个问题: 制造独一无二的编码信息的 DNA 是昂贵的。据《连线》杂志报道,打印目前录制一分钟立体声所需的1,500,000个碱基对大约需要100,000美元。

由前麻省理工学院研究人员创办的位于波士顿的 Catalog 公司正在努力降低这些成本。“目录”不是用信息填充一条长长的 DNA 链,而是用20到30个碱基对的 DNA 片段片段,可以用酶把它们缝合在一起。这些片段的排列决定了它们的含义。本质上,它就像一种语言: 在英语中,只有26个字母,但是通过不同的排列,理论上,我们可以创造出无限多的不同单词。估计存储一兆的数据只需花费不到三千美分。在 Spotify 上,一分钟的最高质量的立体声大约是2.4 MB。

6月26日,Catalog 宣布它已经使用这个系统存储了道格拉斯 · 亚当斯(Douglas Adams)的小说《银河系漫游指南》(a Hitchhiker’s Guide to The Galaxy)和罗伯特 · 弗罗斯特(Robert Frost)的诗《未选择的路》(The Road Not Taken)。该公司还表示,它已经收到了来自各种风险投资公司的900万美元的资金支持。该公司计划明年将其技术商业化。

任何感兴趣的公司只需要提交它想要的数据到 Catalog,然后 Catalog 就会把这些信息转换成0和1的长链中的二进制代码。接下来,该公司的流程为每个核苷酸分配一对这些0和1; 例如,“ a”可能是00,“ c”可能是01,“ t”可能是11,“ g”可能是10。然后,这些数据通过这种 DNA 编码被转换成一小瓶遗传物质,可以安全地储存在任何达到4c (39.2 f)的冰箱里,就像餐馆里使用的那样。

当信息以这种方式存储时,你需要有这把钥匙,以便将 DNA 解码回二进制代码,然后再回到可读的格式。创始人之一 Hyunjun Park 说,一旦公司开始对信息进行编码,他们就会公开他们的密钥,这样客户就可以让任何人对他们的信息进行重新编码。然而,公司可以请求一个新的私有密钥,这样他们的信息就有了一个额外的加密层。

如果 Catalog 的处理过程如它所说的那样顺利,这家公司可能会为几个世纪以来每个人都可以访问基因数据存储铺平道路。帕克表示,该公司正在与档案管理员合作,寻找在 DNA 密码本身中包含一个易读、永恒的密钥的最佳方式,以便我们的曾曾孙(或外星入侵者) ,在未来能够自己解码 DNA 目录。


【翻译自https://www.hindustantimes.com/】

,