您当前的位置:首页 > 生活热点

dna保存多久(dna保存时间多久)

时间:2022-03-12 21:04:47

在当今这个大数据洗礼的时代,弄清楚如何低成本存储数据已经成为一个越来越重要的核心问题。也许最奇怪的解决方案是最好的答案:在DNA分子中储存信息。

目前流行的长期冷藏方法可以追溯到20世纪50年代,当时人们将数据写在披萨大小的胶带卷上。相比之下,DNA存储可能更便宜、更节能、更耐用。研究表明,用盐密封的DNA在室温下可以稳定保存几十年,如果保存在数据中心的受控环境中,应该可以保存更长时间。另外,DNA本身不需要维护,存储的DNA中的文件容易复制,存储成本几乎可以忽略不计。

更好的是,DNA可以在几乎红豆博客的不可思议的pocket 空空间中存储惊人的信息量。让我们展望未来:到2025年,预计人类将拥有33千兆字节的数据——即33后跟21个0。DNA存储可以把这些信息全部存储在一个乒乓球大小的空间里,甚至还有很大的空间空。美国国会图书馆总共7400万字节的信息可以装进一个小小的芝麻里,大小相当于乒乓球的六分之一。只有半个芝麻可以存储脸书的所有数据。

听起来像科幻?不完全是。DNA存储技术目前已经存在,但要完全实现它,研究人员还需要克服技术集成中的各种困难和障碍。为了完成这项意义重大的工作,洛斯阿拉莫斯国家实验室的团队开发了一种分子存储的关键技术,支持软件可以使用自适应DNA存储规范(ADS Codex)将数据文件从计算机中的二进制形式翻译成具有生物学意义的四字母代码。

ADS Codex也是智能高级研究计划局(IARPA)分子信息存储(MIST)项目的关键组成部分。MIST希望为政府和私营部门的大数据运营提供更低成本、更大规模和更持久的存储解决方案。目前的短期发展目标是实现24小时内写入1 TB(1万亿字节)、读取10 TB数据的性能,成本控制在1000美元。

从计算机代码到因子代码

提到DNA,大多数人首先想到的是生命的蓝图——与计算机无关。但DNA本身其实是一个四个字母的代码,用来传递生物体的各种信息。一个分子由四个碱基或核苷酸组成,每个碱基或核苷酸都标有一个字母,分别是腺嘌呤(a)、胸腺嘧啶(t)、鸟嘌呤(g)和胞嘧啶(c)。这些是所有DNA编码的基础,指导着地球上所有生物的繁衍和生长。

DNA合成是一项成熟的技术,广泛应用于医学、制药、生物燃料开发等领域。该技术的本质是将碱基组织成由A、C、G和t的特定序列所指示的不同排列,这些碱基形成相互缠绕的扭曲链(即双螺旋)结构的分子。字母本身的顺序也建立了一个编码系统,可以用来指导生物的生长发育。

一套完整的DNA分子将构成基因组,即人类成长的蓝图。通过从零开始合成DNA分子,研究人员发现,他们可以指定写出由字母A、C、G和T组成的长串,并随时读取序列信息。整个过程类似于计算机存储二进制信息的方式,但这次我们需要将二进制计算机文件编码成四个字母的生物分子。

这种方法已经被证明是有效的,但目前来看,读写DNA编码文件需要很长时间。给DNA添加一个碱基大约需要一秒钟,以这个速度写一个存档文件可能需要几十年。但研究人员正在开发更快的方法,包括一次写入多个分子和进行大规模并发操作。

在翻译过程中没有数据丢失。

ADS Codex准确地解释了如何将0和1转录成A、C、G和t四个字母的组合序列。Codex还可以将该序列解码回二进制形式。DNA可以通过许多方法合成,ADS Codex已经将这些合成方法标准化。

不幸的是,与传统的数字系统相比,使用DNA合成的分子书写的错误率非常高。这些错误的来源与数字书写完全不同,因此更难纠正。在数字硬盘上,错把0写成1就意味着出错,反之亦然。但是对于DNA来说,问题主要来自于插入和删除错误。比如我们的洪都博客可以希望写在A-C洪都博客-G-T里,但实际上A没能正常写,于是整个字母序列向左移动,变成了C-g-t,当然也有可能写一次,直接形成A-A-A。

常规的纠错码不能很好的解决这些问题,所以ADS Codex增加了检错码来验证数据。当软件将数据转换回十进制时,它还会测试代码是否匹配。如果不匹配,将删除或添加碱基(字母),直到验证成功。

前景可期

目前,ADS Codex的1.0版本已经完成,计划在今年年底之前用它来评估其他MIST团队开发的存储和检索系统。这项工作也与洛斯阿拉莫斯国家实验室在计算领域的历史使命和探索精神高度一致。从上世纪40年代开始,我们就一直在研究计算技术,积累下一批历史最长、规模最大的纯数字数据资产。今天,这些资产仍然有相当大的价值。我们会永远保留这些数据,希望能找到最适合它的冷藏方案。

最终,每个用户的数码照片和推文,全球金融部门的所有记录,农业、设施、冰川融化的卫星图像,以及现代科学背后的所有模拟系统,最终都会找到一席之地。现在大家熟悉的“云”并不是一个庞大的数据中心,而是数量庞大的数据中心,需要消耗大量的电力来存储这些万亿字节。这些数据中心的建设、供电和运营成本高达数十亿美元,而随着数据存储需求的指数级增长,我们恐怕很难无限支撑这样的基础设施规模。

也许DNA是数据存储的终极解决方案。诚然,这项技术需要新的工具和新的方式来使用它,但如果有一天世界上最有价值的信息已经可以存储在一个小芝麻中,请不要太惊讶。

碱基 数据 分子 字母 的是

最新文章