DNA因其编码密度高、冷藏寿命长和能耗低等优点,被认为是下一代数据存储介质的有力候选。尽管如此,实现高保真、全集成且经济高效的DNA存储系统仍然面临挑战。

 

近期,南京理工大学邓盛元教授、万莹教授、满天天等人提出了一种基于数字微流控的集成式DNA数据存储系统,能够实现从DNA合成到测序的全过程,并以南京理工大学校训为例成功存储和提取信息,整个过程耗时约6.5小时,存储速度远快于之前报道的方法。相关研究以“Bead-Based DNA Synthesis and Sequencing for Integrated Data Storage Using Digital Microfluidics”为题目,发表在期刊《Angewandte Chemie International Edition》上。

 

本文要点:

1、本研究开发了一种基于数字微流控(DMF)的紧凑型DNA存储平台,能够完成从DNA合成到测序的全过程。

2、采用磷酰胺化学在200nm的磁珠上进行DNA合成,并通过聚合酶催化的引物延伸进行测序,释放的焦磷酸会导致可计数的化学发光信号。

3、通过DNA变性和重复测序结合多数投票法,将碱基准确率提高到95%以上。

4、作为概念验证,研究利用霍夫曼编码和里德-所罗门纠错码将语义信息存储于DNA中,并成功读取。

5、整个过程耗时约6.5小时,存储速度达49分钟/字节,显著快于此前报道的2.8~4.2小时/字节。

6、这种基于磁珠的小型化设备为实现高通量、全集成和高精度的DNA存储提供了一种无人值守的解决方案,具有广阔的应用前景。

 

使用DNA作为数据存储介质的优势包括:

1、高存储密度DNA能够以极高的密度存储信息,理论上每克DNA可以存储约17艾字节(Exabytes)的数据,远超传统存储介质的容量。

2、长存储寿命在适当的冷藏条件下,DNA可以稳定保存数千年,远超磁性、光学或电子存储介质的寿命。

3、低能耗DNA存储的能耗相对较低,适合大规模数据存储。

4、小型化与便携性DNA存储介质体积极小,可实现超高密度的数据存储,便于运输和保存。

5、信息稳定性DNA分子具有高度稳定的化学性质,不易受到环境因素(如温度、湿度等)的影响。

6、信息安全性:DNA存储可以提供更高的安全性,适合存储敏感信息,减少数据泄露的风险。

7、可扩展性DNA存储技术具有良好的扩展潜力,适用于从大规模云存储到个性化数据存储的多种场景。

8、生物兼容性DNA作为天然分子,与生物系统高度兼容,可用于未来的生物计算和生物信息存储。

 

这些优势使得DNA成为下一代数据存储介质的理想选择,尤其是在数据量快速增长的背景下。

 

数字微流控平台通过以下方式提高了DNA合成和测序的效率:

1、集成化流程:该平台将DNA合成和测序过程集成在一个系统中,简化了操作流程,减少了手动干预和设备切换的需要。

2、滴液操控:利用数字微流控技术,可以精确操控微升至皮升级别的液滴,允许在微小体积内进行化学反应,从而提高反应效率和反应条件的可控性。

3、快速合成和测序:该平台实现了从DNA合成到测序的全流程,整个过程仅需约6.5小时,存储速度为49分钟/字节,显著快于之前的方法(2.8~4.2小时/字节)。

4、高精度:通过使用多次测序和多数投票的方式,平台能够实现高达100%的文本准确率,结合Reed-Solomon纠错码,进一步提高了数据的可靠性。

5、减少试剂消耗:数字微流控技术的使用使得试剂的消耗量大幅减少,降低了成本并提高了环境可持续性。

6、灵活配置:该平台的设计支持灵活配置和快速调整实验条件,适应不同的实验需求。

 

综上所述,数字微流控平台通过集成化、精确操控、快速反应和高效利用资源,显著提高了DNA合成和测序的效率。

 

 

图1.数据存储系统的示意图,突出了DMF环境中基于微珠的DNA化学合成到焦磷酸测序的特征。

 

 

图2.DMF盒的结构表征。

 

 

图3.DMF上DNA合成的表征。

 

 

图4.DMF上基于微珠的DNA测序。

 

 

图5.基于DMF的DNA存储在保存和获取南京理工大学校训作为一条具体数据中的应用。

 

论文链接:https://doi.org/10.1002/anie.202416004