哈佛大學(xué)研究人員提出一種用寡肽分子存儲(chǔ)信息的新方法,信息獨(dú)立于云端之外,安全性高,數(shù)據(jù)寫(xiě)入后無(wú)須額外能量即可穩(wěn)定存儲(chǔ)幾千年之久,檢索準(zhǔn)確率達(dá)到99.9%。
書(shū)籍可能被燒成灰,電腦可能被黑,DVD會(huì)降解無(wú)法讀取。盡管近年來(lái)信息存儲(chǔ)方式不斷進(jìn)步,但目前的信息存儲(chǔ)方式仍會(huì)遭到或簡(jiǎn)單或復(fù)雜的威脅的影響。無(wú)論是一場(chǎng)洪水、一把火,還是一次復(fù)雜的網(wǎng)絡(luò)攻擊,都可能讓記錄的珍貴信息化為烏有。
哈佛大學(xué)的信息服務(wù)中心Whitesides團(tuán)隊(duì)的新化學(xué)儲(chǔ)存方法(如下圖所示)需要的空間更少,而且無(wú)需輸入能量就可存儲(chǔ)大量數(shù)據(jù)。
到目前為止,Cafferty和他的團(tuán)隊(duì)已經(jīng)用這種方法記錄、存儲(chǔ)并“閱讀”了物理學(xué)家Richard Feynman的著名演講、Claude Shannon(他被稱為“信息理論之父”)和葛飾北齋的畫(huà)作《神奈川沖浪里》(右下)。到2020年,全球數(shù)字化檔案估計(jì)達(dá)到44萬(wàn)億Gb(是2013年的10倍),說(shuō)是“數(shù)字化海嘯”馬上就要來(lái)了一點(diǎn)也不為過(guò)。
隨著數(shù)據(jù)科學(xué)的持續(xù)繁榮,越來(lái)越多的信息在越來(lái)越小的空間中實(shí)現(xiàn)交互。即使是云存儲(chǔ),最終的空間也會(huì)被耗盡,無(wú)法阻擋所有黑客,同時(shí)要消耗大量能量。
蛋白質(zhì)分子存儲(chǔ)信息:能耗低、安全性高、保質(zhì)期超長(zhǎng)
現(xiàn)在,哈佛大學(xué)George Whitesides團(tuán)隊(duì)提出一種存儲(chǔ)信息的新方法,可以將數(shù)據(jù)穩(wěn)定存儲(chǔ)達(dá)數(shù)百萬(wàn)年之久,數(shù)據(jù)不與容易被破解的互聯(lián)網(wǎng)相連,數(shù)據(jù)一旦寫(xiě)入,就不會(huì)消耗能量。這個(gè)方案只需化學(xué)家、一些廉價(jià)分子和您寶貴的信息就可實(shí)現(xiàn)。
“想想看,用一茶匙蛋白質(zhì)就能保存紐約公共圖書(shū)館的全部?jī)?nèi)容,”Brian Cafferty博士說(shuō),他是描述該技術(shù)的論文的第一作者,目前在George Whitesides博士的實(shí)驗(yàn)室中擔(dān)任博士后研究員。同時(shí)參與該研究的還有美國(guó)西北大學(xué)的Milan Mrksich博士及其團(tuán)隊(duì)。該團(tuán)隊(duì)在ACS Central報(bào)告了他們的新方法。
“至少在現(xiàn)階段,我們認(rèn)為這種方法還不會(huì)與現(xiàn)有的數(shù)據(jù)存儲(chǔ)方式處于競(jìng)爭(zhēng)關(guān)系,”Cafferty說(shuō)?!拔覀冋J(rèn)為這個(gè)方法是對(duì)現(xiàn)有技術(shù)的補(bǔ)充,從初步目標(biāo)來(lái)看,我們的方法非常適合長(zhǎng)期存檔數(shù)據(jù)的存儲(chǔ)?!?/p>
論文一作Brian Cafferty
Cafferty的分子存儲(chǔ)工具可能無(wú)法取代云,但可以為DNA等生物儲(chǔ)存工具提供一種誘人的替代方案。最近,科學(xué)家們發(fā)現(xiàn)了DNA編碼的不僅僅是眼睛的顏色。研究人員現(xiàn)在能夠通過(guò)合成DNA鏈來(lái)記錄任何信息。
但是,雖然DNA與計(jì)算機(jī)芯片相比較小,但放在分子世界中來(lái)看,DNA的個(gè)頭就很大了。而且DNA的合成需要熟練且時(shí)常重復(fù)的勞動(dòng)。如果存儲(chǔ)每條消息都需要從頭開(kāi)始設(shè)計(jì),那么大分子存儲(chǔ)可能會(huì)成為一種耗時(shí)長(zhǎng)、成本高的方式。
不同分子量的寡肽注入“微孔”,以二進(jìn)制編碼區(qū)分
“我們開(kāi)始探索一種未從生物學(xué)中借鑒的新策略,”Cafferty說(shuō)?!巴ㄟ^(guò)使用有機(jī)化學(xué)和分析化學(xué)中常見(jiàn)技術(shù),開(kāi)發(fā)出一種使用低分子量的分子來(lái)編碼信息的方法?!?/p>
只需一次合成就可以生成足夠的小分子,一次編碼多個(gè)視頻,這種方法比基于DNA的方法更省力,更便宜。團(tuán)隊(duì)選擇了寡肽(兩個(gè)或多個(gè)結(jié)合在一起的肽),因?yàn)槠浞肿恿亢艿?,而且屬于性質(zhì)穩(wěn)定的常見(jiàn)化合物,其分子比DNA,RNA都要小。
由于組成寡肽的氨基酸數(shù)量和類型不同,它們的分子質(zhì)量是有差異的。當(dāng)不同的寡肽分子混合在一起時(shí),這種差異可以實(shí)現(xiàn)相互區(qū)分,就像字母表中的不同字母一樣。
將這些“字母”組成單詞會(huì)有點(diǎn)復(fù)雜:將不同質(zhì)量的寡肽存儲(chǔ)在384個(gè)“微孔”中,然后將寡肽混合物放置在金屬板的表面上,就像將墨水吸收存儲(chǔ)在書(shū)頁(yè)中一樣。如果想要讀取“寫(xiě)下”的內(nèi)容,可以通過(guò)質(zhì)譜儀查看其中一個(gè)微孔,按質(zhì)量對(duì)分子進(jìn)行分類??纯催@個(gè)孔中存在哪些寡肽、不存在哪些寡肽:即實(shí)現(xiàn)不同存儲(chǔ)內(nèi)容的區(qū)分。
然后,為了將混亂的分子翻譯成字母和單詞,團(tuán)隊(duì)使用二進(jìn)制編碼。例如,儲(chǔ)存字母“M”可以使用八種可能的寡肽中的四種,每種寡肽具有不同的質(zhì)量。微孔中存在的四種寡肽讀為“1”,而缺失的四種讀為“0”。這些分子二進(jìn)制代碼分別指向相應(yīng)的字母,如果存儲(chǔ)的信息是圖像,則指向相應(yīng)的像素。
使用寡肽存儲(chǔ)的32bits信息原理示意圖
使用這種方法,八種寡肽的混合物可以存儲(chǔ)一個(gè)字節(jié)的信息; 32種寡肽的混合物可以存儲(chǔ)四個(gè)字節(jié),以此類推。
現(xiàn)在,這種存儲(chǔ)方式的檢索準(zhǔn)確率為99.9%。平均“寫(xiě)入”速度為每秒8bits,“讀取”速度每秒20 bits。盡管“寫(xiě)入”速度遠(yuǎn)遠(yuǎn)超過(guò)了用合成DNA書(shū)寫(xiě)的速度,但對(duì)于大分子而言,“讀取”速度可能更快、更便宜。
分子存儲(chǔ)方式無(wú)須耗能,獨(dú)立于互聯(lián)網(wǎng)之外,安全性更高
未來(lái),還可以通過(guò)引入不同類別的分子,提高存儲(chǔ)的穩(wěn)定性和容量,并降低成本。實(shí)驗(yàn)中使用寡肽是定制的,因此價(jià)格較貴。但未來(lái)的圖書(shū)館可以購(gòu)買更便宜的分子(如烷硫醇),只需1美分就可以記錄1億比特的信息。
寡肽等分子具備復(fù)原能力。“在適當(dāng)?shù)臈l件下,寡肽可以在數(shù)百年甚至數(shù)千年的時(shí)間內(nèi)保持穩(wěn)定性?!痹诟邷睾透珊档那闆r下,這些分子可以在沒(méi)有光或氧的情況下存活下來(lái)。而且,黑客無(wú)法像攻破云存儲(chǔ)那樣竊取分子存儲(chǔ)的內(nèi)容,分子存儲(chǔ)只能通過(guò)人工訪問(wèn)。即使“小偷”發(fā)現(xiàn)數(shù)據(jù)藏匿,也需要一點(diǎn)化學(xué)知識(shí)才能實(shí)現(xiàn)代碼檢索。
Cafferty團(tuán)隊(duì)的可擴(kuò)展的分子存儲(chǔ)庫(kù)是一種穩(wěn)定的、零能耗、抗腐蝕的存儲(chǔ)可選方案,可用于未來(lái)的信息存儲(chǔ)。因此,當(dāng)未來(lái)一旦書(shū)被燒了、計(jì)算機(jī)被黑了,DVD讀不出來(lái)了,這些分子可能還會(huì)繼續(xù)存在,以提醒未來(lái)的人類,我們?cè)?jīng)是多么喜歡那些萌萌的貓咪視頻。
該研究由美國(guó)國(guó)防部高級(jí)研究計(jì)劃局(DARPA)資助。
-
存儲(chǔ)
+關(guān)注
關(guān)注
13文章
4226瀏覽量
85580 -
數(shù)字化
+關(guān)注
關(guān)注
8文章
8542瀏覽量
61582 -
數(shù)據(jù)科學(xué)
+關(guān)注
關(guān)注
0文章
164瀏覽量
10039
原文標(biāo)題:保質(zhì)幾千年!哈佛大學(xué)新研究用蛋白質(zhì)分子存儲(chǔ)數(shù)據(jù),比云更安全
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論