縱觀數(shù)據(jù)存儲歷史可以發(fā)現(xiàn),隨著人類社會數(shù)據(jù)量的不斷增加,存儲介質(zhì)也在持續(xù)不斷地迭代變化。人類歷史的腳步不會停下,碳基生物存儲尤其是DNA存儲是我們不得不關(guān)注的重要前沿技術(shù)方向。
DNA是已知最古老的信息存儲系統(tǒng),存儲著碳基世界中從微生物到人類的億萬生命數(shù)據(jù)。人類的存儲介質(zhì)經(jīng)歷了從骨骼、毛皮、竹簡、紙到電腦硬盤的演變,但在DNA上“寫入”和“讀取”數(shù)據(jù)似乎只是造物主才能做的事情。近年來,隨著DNA合成技術(shù)(數(shù)據(jù)寫入)和DNA測序技術(shù)(數(shù)據(jù)讀?。┑耐黄菩园l(fā)展,DNA存儲已成為下一代存儲技術(shù)熱點。2019年7月1日,著名科普雜志《科學(xué)美國人》公布了2019年十大突破性技術(shù)榜單,DNA存儲技術(shù)榜上有名。
5G通信、萬物相聯(lián)、人工智能……在大數(shù)據(jù)時代的未來,雖然傳統(tǒng)存儲硬盤隨著科技進步在不斷優(yōu)化提升,但人類社會日益增長的信息數(shù)據(jù)的存儲需求,必將使傳統(tǒng)存儲硬盤面臨巨大挑戰(zhàn)。有數(shù)據(jù)顯示,2015年至2019年期間,機器對機器間的流量以44%的年復(fù)合增長率增長,并且到2020年全球每月將產(chǎn)生高達6.3ZB(1ZB>10億TB)的數(shù)據(jù)量。這必然造成硅基半導(dǎo)體材料的巨大消耗、數(shù)據(jù)維護期間的電力供應(yīng)問題以及海量電子垃圾引發(fā)的生態(tài)環(huán)境危機。
相比之下,一個邊長約1米的DNA立方體就足以容納等量數(shù)據(jù)。DNA存儲技術(shù)以其體積小、數(shù)據(jù)密度大、穩(wěn)定性強、能耗極低等優(yōu)勢,成為解決未來因數(shù)據(jù)爆發(fā)產(chǎn)生系列危機的潛在技術(shù)路徑之一。此外,人工智能尤其是類腦智能的發(fā)展,硅基人工智能在未來或有向更高層次的碳基人工智能發(fā)展的可能性。屆時,DNA存儲技術(shù)將成為不可或缺的配套技術(shù)之一。
一、DNA存儲簡介
DNA即脫氧核糖核酸(英文Deoxyribonucleic acid的縮寫)是磷酸基團、多糖和四種堿基構(gòu)成的雙螺旋結(jié)構(gòu)大分子,是主要的遺傳物質(zhì)。DNA四種堿基A、T、G和C的排列順序代表遺傳信息,控制合成不同功能的蛋白質(zhì),用以構(gòu)建生命體和催化一系列體內(nèi)生化反應(yīng)。
DNA存儲是將二進制文件通過編碼映射成DNA里A、T、G和C堿基序列,按序列順序通過人工合成技術(shù)形成長鏈DNA來保存數(shù)據(jù)的方法。數(shù)據(jù)寫入即人工合成DNA,數(shù)據(jù)讀取即DNA測序,數(shù)據(jù)拷貝即DNA復(fù)制。利用DNA中堿基序列編碼存儲二進制數(shù)據(jù)具體實例如下所示。
二、DNA存儲的優(yōu)勢與挑戰(zhàn)
DNA存儲的優(yōu)勢顯而易見。一是數(shù)據(jù)密度大、占地小。理論上1克DNA可存儲455EB數(shù)據(jù)量。二是DNA特殊的雙螺旋結(jié)構(gòu)使其性能十分穩(wěn)定、存儲時間長。在干冷條件下可保持數(shù)萬年以上,常溫下可保持幾百甚至上千年。三是能耗低。常溫保存時基本不需要電力。
但該技術(shù)的挑戰(zhàn)也與之并存。一是成本過高。目前DNA存儲200MB數(shù)據(jù)需要耗資80萬美元。二是讀寫速度慢。在DNA中寫入20MB數(shù)據(jù)可能需要1天時間。近年來,“數(shù)據(jù)讀取”技術(shù)(DNA測序技術(shù))發(fā)展較快,代表性企業(yè)包括Pacbio、Illumina和華大基因等公司,但“數(shù)據(jù)寫入”技術(shù)(DNA合成技術(shù))發(fā)展慢,需要較大的理論和技術(shù)突破。三是數(shù)據(jù)存儲的準確性有待提高。目前DNA測序時的重復(fù)讀取導(dǎo)致讀錯概率較大。四是隨機讀寫困難。目前DNA合成技術(shù)無法一次性產(chǎn)生較長的DNA分子,只能合成眾多的短片段。這使得在眾多DNA小片段組成的混合物中快速調(diào)取出特定數(shù)據(jù)較為困難。
三、DNA存儲技術(shù)不斷獲得突破
實際上,DNA存儲并非新名詞,相關(guān)研究已持續(xù)了30余年。1988年,美國藝術(shù)家Joe Davis與哈佛大學(xué)科學(xué)家合作,首次把0與1的電子數(shù)據(jù)和DNA的四個堿基對應(yīng),將古日耳曼代表著生命和女性的圖片編輯到大腸桿菌的DNA序列中。2001年,以色列科學(xué)家研制出世界第一臺DNA計算機,它的輸出、輸入和軟硬件全由DNA分子組成。2007年,日本科學(xué)家成功使用細菌DNA儲存數(shù)據(jù)。2010年,美國合成生物學(xué)家克雷格?文特爾帶領(lǐng)研究團隊化學(xué)合成了整個支原體基因組DNA,并將該課題研究者的名字、研究所網(wǎng)址和愛爾蘭詩人詹姆斯的詩句等信息編碼進新合成的DNA中。
而當美國哈佛大學(xué)教授喬治·丘齊在2012年將650KB數(shù)據(jù)寫進DNA,使DNA存儲數(shù)據(jù)容量的紀錄提高了1000倍后,DNA存儲技術(shù)進入快速發(fā)展的新時期。
2013年,歐洲生物信息實驗室(EMBL)將20MB數(shù)據(jù)寫進DNA存儲;2016年4月,美國微軟公司向美國生物科技初創(chuàng)公司 Twist 購買了1000萬個DNA分子,用于研究數(shù)據(jù)儲存。同年7月,微軟公司和華盛頓大學(xué)分子信息系統(tǒng)實驗室(MISL)合作,耗資約80萬美元將200.2MB的數(shù)據(jù)(包含100本書籍的信息)成功存入DNA。2017年,微軟公司投資20億美元,為其高能耗的數(shù)據(jù)中心開發(fā)DNA服務(wù)器,并計劃在10年內(nèi)部署一臺復(fù)印機大小的商用DNA存儲裝置。同年,美國哥倫比亞大學(xué)和紐約基因組中心研究人員開發(fā)一種噴泉碼技術(shù),使DNA高效存儲數(shù)據(jù)和無損讀取,并將DNA存儲效率在喬治·丘齊技術(shù)水平上再提高100倍。2018年,愛爾蘭沃特福德理工學(xué)院(WIT)研究人員開發(fā)出一種新型DNA存儲方法,可在1克大腸桿菌DNA中存儲1ZB的數(shù)據(jù)。
2019年3月,美國微軟公司和華盛頓大學(xué)的研究人員開發(fā)出一個完全自動化的系統(tǒng),用于編寫、存儲和讀取DNA編碼的數(shù)據(jù)。雖然成本和耗時依然居高不下,但全自動合成和讀取是DNA存儲技術(shù)從實驗室走向商業(yè)數(shù)據(jù)中心的關(guān)鍵步驟。
四、DNA存儲技術(shù)受到西方科技強國重視
DNA存儲技術(shù)具有解決未來社會因數(shù)據(jù)量激增引發(fā)的一系列挑戰(zhàn)的潛力,尤其是近些年DNA存儲技術(shù)的難點不斷被攻克,商業(yè)化應(yīng)用曙光微顯。西方科技強國們敏銳地嗅到DNA存儲技術(shù)的前景,紛紛走上DNA存儲的餐桌,不愿缺席這場未來技術(shù)盛宴。
國家層面。美國在DNA存儲技術(shù)方面的研究一直處于世界領(lǐng)先地位,政府層面也高度重視該技術(shù)的發(fā)展。2018年2月,美國高級情報研究計劃局(IARPA)發(fā)布“分子信息存儲”(MIST)項目,旨在開發(fā)可部署的存儲技術(shù),利用DNA存儲取代傳統(tǒng)存儲方式。IARPA項目經(jīng)理David Markowitz表示,建設(shè)一個10億GB的數(shù)據(jù)中心需要10年時間,花費100億美元以及數(shù)百兆瓦的電力,但存儲相同的數(shù)據(jù)量僅需1千克DNA。英國政府也注意到DNA存儲技術(shù)的應(yīng)用潛力,資助Goldman等科學(xué)家成立專門的公司,用于研發(fā)下一代DNA存儲技術(shù)。此外,以色列、愛爾蘭、法國和日本等國也紛紛開展了DNA存儲方面的研究工作。
研究機構(gòu)層面。美國哈佛大學(xué)是全球最早開展DNA存儲技術(shù)研究的科研機構(gòu),積累了豐富的研究成果;華盛頓大學(xué)的DNA存儲技術(shù)也處于世界領(lǐng)先地位。此外,美國的加州大學(xué)、約翰霍普金斯大學(xué)、伊利諾伊大學(xué)、勞倫斯伯克利國家實驗室、哥倫比亞大學(xué)和紐約基因組中心;歐洲生物信息研究所;法國的查爾斯-賽德倫高分子研究所和艾克斯-馬賽大學(xué);愛爾蘭沃特福德理工學(xué)院和瑞士蘇黎世理工學(xué)院等高?;蚩蒲袡C構(gòu)均開展了DNA存儲技術(shù)的相關(guān)研究并紛紛取得突破性成果。
企業(yè)層面。美國微軟公司是當前全球研究DNA存儲技術(shù)最活躍的高科技公司。值得一提的是,微軟公司近年來經(jīng)過一系列變革和戰(zhàn)略調(diào)整,積極投身云計算、生物存儲等業(yè)務(wù),公司市值由2013年的2000多億美元增長到2019年的破萬億美元,成為全球市值最高的上市公司。微軟對DNA存儲技術(shù)的重視,值得重點關(guān)注。除傳統(tǒng)科技巨頭外,近些年DNA存儲行業(yè)也涌現(xiàn)出眾多初創(chuàng)科技企業(yè),如美國Catalog公司、Molecular Assemblies公司、Twist Bioscience公司和Iridia公司等,以及英國的Evonetix公司、法國的DNA Script公司、愛爾蘭的Helixworks Technologies公司和奧地利的Kilobaser公司等。
五、DNA存儲技術(shù)的戰(zhàn)略意義及相關(guān)建議
(一)DNA存儲技術(shù)具有重要戰(zhàn)略價值
傳統(tǒng)存儲器的主要材料是硅晶片,其制作需要熔融、切割、刻蝕和清洗等過程。伴隨著數(shù)據(jù)存儲需求激增的同時是硅晶片使用量的激增,以及由此造成的環(huán)境污染問題、水資源和能源消耗問題等。此外,硅基半導(dǎo)體的摩爾定律也在走向物理極限。另一方面,5G通訊的普及將促進物聯(lián)網(wǎng)社會的構(gòu)建,海量電子元器件必然產(chǎn)生電子垃圾泛濫的新問題。DNA存儲技術(shù)將在減少半導(dǎo)體材料、電力能源、水資源的使用,減少化學(xué)工藝造成的廢水廢物排放,尤其是使用可生物降解的DNA代替不可降解的電子垃圾等方面,或可發(fā)揮重要作用。因此,DNA存儲技術(shù)對國家開發(fā)替代性的數(shù)據(jù)存儲介質(zhì)、維護生態(tài)環(huán)境安全和能源安全等具有重要戰(zhàn)略意義。
(二)DNA存儲技術(shù)或?qū)⒃黾訑?shù)據(jù)管理難度和數(shù)據(jù)失竊風(fēng)險
存儲數(shù)據(jù)的DNA可整合到細菌基因組、動物基因組甚至是人類基因組(如手指的一小塊細胞群,不會對整個身體基因組造成影響)上,數(shù)據(jù)可隨細胞復(fù)制而拷貝擴增。DNA存儲技術(shù)或?qū)⑹股矬w尤其是人體成為自由行走的“硬盤”。DNA因其微型性、生物相容性等隱蔽性特點,以及非金屬材料導(dǎo)致的傳統(tǒng)安檢設(shè)備失效,將嚴重沖擊當前的數(shù)據(jù)管理模式。尤其是某些人員通過DNA秘密攜帶重大機密數(shù)據(jù)出入海關(guān),將增加數(shù)據(jù)失竊風(fēng)險。西方科技強國在DNA存儲領(lǐng)域的快速發(fā)展,使我國數(shù)據(jù)安全面臨新挑戰(zhàn)、新變局。密切跟蹤全球DNA存儲技術(shù)的研究進展,積極促進和提升我國DNA存儲技術(shù)的研發(fā)能力,與時俱進更新數(shù)據(jù)管理理念和模式,研發(fā)DNA存儲相關(guān)的新型監(jiān)測和監(jiān)管設(shè)備,是我國面對DNA存儲技術(shù)挑戰(zhàn)的重要應(yīng)對之策。
(三)DNA存儲技術(shù)或?qū)⒊蔀樘厥饧用苡猛镜臄?shù)據(jù)存儲手段
DNA存儲作為一種新興多能的存儲方式,或?qū)⒊蔀檐娛骂I(lǐng)域、經(jīng)濟領(lǐng)域等特殊加密用途的數(shù)據(jù)存儲手段。軍事應(yīng)用方面。美國科學(xué)家曾在1999年發(fā)表過“DNA隱寫術(shù)”的文章。研究人員將“JUNE 6 INVASION:NORMANDY”(6月6號入侵:諾曼底)這段歷史上的軍事密令轉(zhuǎn)化成100bp左右的DNA信息,然后將該DNA與30億bp的垃圾DNA信息混在一起。只有通過密鑰(也就是一對引物)進行PCR擴增獲取目的DNA片段,測序后解碼方可獲得該信息。金融應(yīng)用方面。近期,F(xiàn)acebook推出了電子加密貨幣Libra,一石激起千層浪,眾多國家央行高度警惕和密切關(guān)注,不少大型企業(yè)也蠢蠢欲動推出自己的電子加密貨幣。從比特幣到Libra,電子貨幣似乎將成為未來社會的一個重要趨勢,而個性的、穩(wěn)定的和安全的新型存儲方式也就成為必然需求。美國初創(chuàng)公司Carverr推出將數(shù)字貨幣密碼存儲在DNA中的服務(wù),以保護數(shù)字貨幣財產(chǎn),28位客戶已與其簽約。Carverr公司目前還在與銀行和其他大型加密貨幣控股公司進行談判,以擴大服務(wù)范圍。
(四)其他生物存儲技術(shù)也值得重點關(guān)注
近期,除DNA存儲技術(shù)外,其他生物存儲技術(shù)也涌現(xiàn)出新成果。例如,2019年5月,美國哈佛大學(xué)開發(fā)出利用蛋白質(zhì)存儲數(shù)據(jù)的新技術(shù)。該技術(shù)減少了合成新分子的難度和消耗時間,同時避免了從線性DNA大分子中編碼和讀取數(shù)據(jù)的難題。7月,美國布朗大學(xué)將2000bp數(shù)字圖像數(shù)據(jù)儲存在含有糖、氨基酸和其他類型小分子的液體混合物陣列中,并能夠在其中進行數(shù)據(jù)檢索。據(jù)稱,小分子代謝物具有比DNA更大的信息密度。
傳統(tǒng)半導(dǎo)體存儲方式或許在未來一段時間內(nèi)仍將占據(jù)數(shù)據(jù)存儲方式的主流,而包括DNA存儲、蛋白質(zhì)存儲和小分子代謝物存儲等形式的碳基生物存儲方式在技術(shù)層面尤其是成本方面還有很長的路要走。但是,縱觀數(shù)據(jù)存儲歷史可以發(fā)現(xiàn),隨著人類社會數(shù)據(jù)量的不斷增加,存儲介質(zhì)也在持續(xù)不斷地迭代變化。人類歷史的腳步不會停下,碳基生物存儲尤其是DNA存儲是我們不得不關(guān)注的重要前沿技術(shù)方向。
-
存儲
+關(guān)注
關(guān)注
13文章
4226瀏覽量
85578 -
DNA
+關(guān)注
關(guān)注
0文章
242瀏覽量
30975
原文標題:技經(jīng)觀察 | DNA存儲有望成為下一代存儲介質(zhì)的技術(shù)方向
文章出處:【微信號:drc_iite,微信公眾號:全球技術(shù)地圖】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論