全球每年產(chǎn)生的數(shù)據(jù)需要4180億個(gè)1TB硬盤才能放下,若是把如此龐大的數(shù)據(jù)放到DNA上,只需 1kg DNA就夠了!最近一家公司將16G的維基百科存儲(chǔ)在了一個(gè)DNA分子上讓人驚嘆,DNA存儲(chǔ)已成為最受關(guān)注的新興技術(shù)之一,“我,就是數(shù)據(jù)”時(shí)代即將來臨。
“我,就是數(shù)據(jù)”時(shí)代悄然將至。
在科幻大片《超體》中,“女超人”Lucy憑借藥物的作用,大腦不斷被開發(fā),獲得了包括心靈感應(yīng)、瞬間吸收知識(shí)等技能。當(dāng)大腦開發(fā)到100%時(shí),已然達(dá)到了“I am everywhere”的至高境界。
Lucy最終化身為超級(jí)“U盤”
而目前我們正處于數(shù)據(jù)爆炸增長(zhǎng)的時(shí)代,現(xiàn)存的硬盤、3D內(nèi)存芯片等數(shù)據(jù)存儲(chǔ)方式已然出現(xiàn)“負(fù)荷過重”的跡象。若是要存儲(chǔ)全球的數(shù)據(jù)似乎是一件較為棘手的事情,更不要提做到像Lucy那般集“全宇宙數(shù)據(jù)于一身”了。
一種新的方式便應(yīng)運(yùn)而生——DNA數(shù)據(jù)存儲(chǔ)。
其實(shí),這種嘗試早就已經(jīng)開始了。
去年年底,法國(guó)一位16歲高中生Locatelli便將《古蘭經(jīng)》和《圣經(jīng)》中的部分內(nèi)容注入到了自己體內(nèi)。把希伯來語和阿拉伯語的字符轉(zhuǎn)換成DNA堿基的特定組合,然后用購買的病毒編輯到DNA鏈里,最后用注射器注入自己的大腿(詳細(xì)內(nèi)容見文末附錄)。
除了這位高中生之外,上周,一家位于波士頓的初創(chuàng)公司Catalog宣布,他們將維基百科英文版一共16G的所有文本存儲(chǔ)在了一個(gè)DNA分子上!
里面就是儲(chǔ)存了16G維基百科的DNA
他們相信生物分子的壽命將比最新的計(jì)算機(jī)存儲(chǔ)技術(shù)長(zhǎng)得多。
16G的維基百科,只需一個(gè)DNA分子便可輕松存儲(chǔ)
計(jì)算機(jī)存儲(chǔ)技術(shù)已經(jīng)從帶磁鐵的電線變成了硬盤,變成了3D存儲(chǔ)芯片。但是下一代存儲(chǔ)技術(shù)可能會(huì)使用與地球上的生命一樣古老的方法:DNA。
初創(chuàng)企業(yè)Catalog近日宣布,維基百科英文版的所有文本都被塞進(jìn)了我們身體使用的相同基因分子中。也就是說,他們將維基百科英文版一共16G的所有文本存儲(chǔ)在了一個(gè)DNA分子上!
Catalog用它的第一臺(tái)DNA書寫器完成了這項(xiàng)壯舉。
Catalog的DNA寫入機(jī)可以以每秒4兆比特的速度寫入數(shù)據(jù),但該公司希望使其速度至少提高1000倍。
至于說這個(gè)DNA書寫器有多大,呃,如果你先把家里的冰箱、烤箱扔掉,再打掉一部分櫥柜,這臺(tái)機(jī)器就可以很容易地安裝在你的房子里啦(機(jī)器的大小與一輛現(xiàn)代SUV差不多)。盡管它不太可能很快就將手機(jī)的閃存芯片推到一邊,但Catalog認(rèn)為,它對(duì)一些需要存檔數(shù)據(jù)的客戶已經(jīng)很有用了。
DNA鏈很小,很難管理,但是生物分子可以存儲(chǔ)除了控制細(xì)胞如何變成豌豆植物或黑猩猩的基因以外的其他數(shù)據(jù)。Catalog使用了比人類DNA短但更多的預(yù)制合成DNA鏈,因此它可以存儲(chǔ)更多的數(shù)據(jù)。
依靠DNA而不是最新的高科技小型化設(shè)備來存儲(chǔ)可能聽起來像是倒退了一步。但是DNA是緊密的,化學(xué)上是穩(wěn)定的,而且因?yàn)樗堑厍蛏飳W(xué)的基礎(chǔ),它可能不會(huì)像硬盤驅(qū)動(dòng)器或CD那樣過時(shí),也不會(huì)像軟盤驅(qū)動(dòng)器那樣消失。
誰在市場(chǎng)上購買這種存儲(chǔ)?Catalog有一個(gè)合作伙伴要宣布, Arch Mission基金會(huì)正試圖將人類知識(shí)儲(chǔ)存在不只是在地球上,甚至在太陽系的其他地方——就像SpaceX發(fā)射到軌道上的Elon Musk的Tesla Roadster一樣。除此之外,Catalog還未透露其他客戶是誰,或者是否會(huì)為其DNA寫入服務(wù)收費(fèi)。
該公司在一份聲明中說:“我們正在與政府機(jī)構(gòu)、產(chǎn)生大量測(cè)試數(shù)據(jù)的主要國(guó)際科學(xué)項(xiàng)目、石油天然氣、媒體和娛樂、金融和其他行業(yè)的主要公司進(jìn)行討論。”
總部位于波士頓的Catalog擁有自己的設(shè)備,可以在DNA中每秒記錄4兆比特的數(shù)據(jù)。優(yōu)化的速度應(yīng)該是當(dāng)前速度的三倍,讓人們?cè)谝惶靸?nèi)記錄125千兆字節(jié)——大約相當(dāng)于高端手機(jī)可以存儲(chǔ)的容量。
傳統(tǒng)的DNA測(cè)序產(chǎn)品已經(jīng)在生物技術(shù)市場(chǎng)上銷售,可以讀取DNA數(shù)據(jù)。“我們認(rèn)為這一全新的序列技術(shù)用例將有助于(大大)降低成本,”Catalog認(rèn)為計(jì)算業(yè)務(wù)是一個(gè)潛在的巨大市場(chǎng)。
Catalog首席執(zhí)行官Hyunjun Park和首席技術(shù)創(chuàng)新官Nathaniel Roquet于2016年創(chuàng)立了這家公司。當(dāng)時(shí),Park是麻省理工學(xué)院的博士后,Roquet是哈佛大學(xué)的研究生。
Catalog使用尋址系統(tǒng),這意味著客戶可以使用大型數(shù)據(jù)集。即使DNA以長(zhǎng)序列存儲(chǔ)數(shù)據(jù),目錄也可以使用分子探針讀取存儲(chǔ)在任何地方的信息。換句話說,它是一種像硬盤一樣的隨機(jī)存取存儲(chǔ)器,而不是像半個(gè)世紀(jì)前大型計(jì)算機(jī)鼎盛時(shí)期的磁帶盤那樣的順序存取。
盡管DNA數(shù)據(jù)可能會(huì)被宇宙射線破壞,但Catalog認(rèn)為它是一種比其他方法更穩(wěn)定的介質(zhì)。畢竟,我們有幾千年前滅絕動(dòng)物的DNA。我們打個(gè)賭,你抽屜里的U盤在25年后還會(huì)用嗎?
DNA存儲(chǔ)數(shù)據(jù)的意義何在?
近日,《科學(xué)美國(guó)人》與世界經(jīng)濟(jì)論壇聯(lián)合發(fā)布了2019年全球十大新興技術(shù),其中一項(xiàng)就是用DNA儲(chǔ)存數(shù)據(jù)。那么,用DNA存儲(chǔ)數(shù)據(jù)的意義何在呢?
據(jù)軟件公司Domo稱,2018年,谷歌每分鐘進(jìn)行388萬次搜索,人們?cè)赮ouTube上觀看了433萬個(gè)視頻,發(fā)送了159362760封電子郵件,推特了47.3萬次,在Instagram上發(fā)布了49000張照片。
到2020年,全球人均每秒將產(chǎn)生大約1.7兆字節(jié)的數(shù)據(jù),假設(shè)世界人口為78億,這相當(dāng)于每年約418個(gè)zettabytes。這么多的數(shù)據(jù)如果放在容量為1TB的硬盤上,需要4180億個(gè)硬盤才能放下!
如果是這樣的話,目前的數(shù)據(jù)存儲(chǔ)系統(tǒng)通撐不過一個(gè)世紀(jì)。此外,運(yùn)行數(shù)據(jù)中心需要消耗大量的能量。簡(jiǎn)而言之,我們將面臨一個(gè)嚴(yán)重的數(shù)據(jù)存儲(chǔ)問題,隨著時(shí)間的推移,這個(gè)問題將變得更加嚴(yán)重!
因此,硬盤存儲(chǔ)的一種替代方案——基于DNA的數(shù)據(jù)存儲(chǔ)才顯得尤為重要。由核苷酸A,T,C和G的長(zhǎng)鏈組成的DNA是生命的信息存儲(chǔ)材料。數(shù)據(jù)可以按照這些字母的順序存儲(chǔ),從而將DNA轉(zhuǎn)變?yōu)橐环N新的信息技術(shù)形式。
它已經(jīng)過常規(guī)排序(讀?。?,合成(寫入)并且可以輕松準(zhǔn)確地復(fù)制。DNA也是非常穩(wěn)定的,正如生活在50多萬年前的化石馬的完整基因組測(cè)序所證明的那樣,存儲(chǔ)它不需要太多能量。
但是,DNA的存儲(chǔ)容量是讓人驚訝的。DNA可以以遠(yuǎn)超過電子設(shè)備的密度精確存儲(chǔ)大量數(shù)據(jù)。例如,根據(jù)哈佛大學(xué)George Church及其同事于2016年發(fā)表在“Nature Materials”雜志上的計(jì)算,簡(jiǎn)單的大腸桿菌的存儲(chǔ)密度約為每立方厘米1019比特。
在這樣的密度下,一個(gè)邊長(zhǎng)約一米的DNA立方體可以很好地滿足全世界一年的數(shù)據(jù)儲(chǔ)存需求,換個(gè)維度講,1kg DNA就能儲(chǔ)存全球數(shù)據(jù)。
全球數(shù)據(jù)只需1kgDNA就能儲(chǔ)存
DNA數(shù)據(jù)存儲(chǔ)的前景不僅僅是理論上的。例如,2017年,哈佛大學(xué)的Church小組采用CRISPR DNA編輯技術(shù),將人手的圖像記錄到大腸桿菌的基因組中,并以高于90%的準(zhǔn)確率讀出。華盛頓大學(xué)和微軟研究院的研究人員已經(jīng)開發(fā)出一個(gè)完全自動(dòng)化的系統(tǒng),用于編寫、存儲(chǔ)和讀取DNA編碼的數(shù)據(jù)。包括微軟和Twist Bioscience在內(nèi)的一些公司正在致力于推進(jìn)DNA存儲(chǔ)技術(shù)。
與此同時(shí),DNA已經(jīng)被研究人員用來以不同的方式管理數(shù)據(jù),這些研究人員努力處理海量的數(shù)據(jù)。新一代測(cè)序技術(shù)的最新進(jìn)展使得數(shù)十億個(gè)DNA序列可以輕松同時(shí)讀取。有了這種能力,研究人員可以使用DNA序列的條形碼作為分子識(shí)別“標(biāo)簽”,以跟蹤實(shí)驗(yàn)結(jié)果。DNA條形碼正被用于大大加快化學(xué)工程、材料科學(xué)和納米技術(shù)等領(lǐng)域的研究步伐。例如,在佐治亞理工學(xué)院,James E. Dahlman的實(shí)驗(yàn)室正在迅速確定更安全的基因療法;其他人正在研究如何對(duì)抗耐藥性和防止癌癥轉(zhuǎn)移。
使DNA數(shù)據(jù)存儲(chǔ)變得通用的挑戰(zhàn)之一是讀取和寫入DNA的成本和速度,如果要與電子存儲(chǔ)競(jìng)爭(zhēng),則需要進(jìn)一步降低這些成本和速度。即使DNA沒有成為一種無所不在的存儲(chǔ)材料,它幾乎肯定會(huì)被用來以全新的方式生成信息,并長(zhǎng)期保存某些類型的數(shù)據(jù)。
DNA能夠存儲(chǔ)數(shù)據(jù),是否也可遺傳?
前不久,新智元報(bào)道了一篇文章——頂級(jí)學(xué)術(shù)期刊《CELL》同日連續(xù)發(fā)表兩篇重磅文章,研究人員在對(duì)線蟲的研究中發(fā)現(xiàn),記憶可以被遺傳,甚至持續(xù)3-4代!
在2016年的SXSW大會(huì)上,南加州大學(xué)教授Theodore Berger宣布了一個(gè)轟動(dòng)整個(gè)科技界的消息:
在對(duì)猴子、老鼠的實(shí)驗(yàn)中,通過人造海馬體完成了短時(shí)記憶向長(zhǎng)期儲(chǔ)存記憶“幾乎完美”的轉(zhuǎn)換,這項(xiàng)技術(shù)可以完成對(duì)人腦記憶的備份,并復(fù)制到其他人的大腦中。
這就意味著記憶有可能“遺傳”給后代。
而近日,愛思維爾(Elsevier)出版公司旗下的細(xì)胞出版社(Cell Press)雜志《CELL》同日發(fā)表了兩篇重磅文章——記憶居然真的可以遺傳!
文章地址:
https://www.cell.com/cell/fulltext/S0092-8674(19)30448-9
文章地址:
https://www.cell.com/cell/fulltext/S0092-8674(19)30552-5
這兩項(xiàng)重磅的研究結(jié)果表明:至少在線蟲(C.elegans)這樣的生物中,記憶可以被遺傳,且可以維持3-4代。堪稱顛覆認(rèn)知!
記憶的遺傳,或是另一種“永生”?
縱觀歷史,有無數(shù)人在尋找著永生不死的方式——他們或修煉自己的精神世界,或求助于丹藥、或修建宏偉的寢陵,想以此實(shí)現(xiàn)精神的延續(xù)和永存,但無一成真。
今天,我們借助科學(xué)發(fā)現(xiàn),人們對(duì)“永生”的研究也不斷在持續(xù)著。
新智元此前報(bào)道過《Nature重磅封面:復(fù)活死亡大腦!》——耶魯大學(xué)的最新研究表明,豬大腦在死亡4小時(shí)后成功復(fù)活,并維持了至少6小時(shí)。
這項(xiàng)研究掀起了一波道德倫理的輿論浪潮,有人擔(dān)心這是否就會(huì)是僵尸啟示錄的開始;但同時(shí)還有人認(rèn)為,讓一些偉人的大腦復(fù)活,實(shí)現(xiàn)意識(shí)和記憶的“永生”,將具有重大的意義。
而這次科學(xué)家們的發(fā)現(xiàn)可謂是顛覆了我們的認(rèn)知。
原來信息竟然可以通過神經(jīng)代代相傳,加之這次DNA可以存儲(chǔ)海量數(shù)據(jù),不知道這是不是另一種“永生”的方式呢?
附:16歲高中將《古蘭經(jīng)》和《圣經(jīng)》注入體內(nèi)
去年年底,法國(guó)一位16歲高中生Locatelli將《古蘭經(jīng)》和《圣經(jīng)》中的部分內(nèi)容注入到了自己體內(nèi)。他將文本轉(zhuǎn)換成了DNA,并注射到了自己的大腿上。
12月3日,他還將這項(xiàng)實(shí)驗(yàn)的文章發(fā)表到了Open Science Framwork(OSF)上。
論文地址:
https://osf.io/yj8xw/
從邏輯上來講,這項(xiàng)壯舉并不難。Locatelli首先用一個(gè)基本的系統(tǒng)將文本翻譯為構(gòu)成DNA的核酸。
在圣經(jīng)《創(chuàng)世紀(jì)》中,他將22個(gè)希伯來字母轉(zhuǎn)換成四種可能的核酸:胞嘧啶、胸腺嘧啶、鳥嘌呤或腺嘌呤。胞嘧啶和胸腺嘧啶分別代表五個(gè)字母,鳥嘌呤和腺嘌呤分別代表六個(gè)字母。
這張表是從《古蘭經(jīng)》的獨(dú)立(isolated)字母中汲取靈感而開發(fā)的
在阿拉伯語文本中,Locatelli去掉了28個(gè)字母中的5個(gè),并給了其中3個(gè)獨(dú)特的核酸,允許Ra和Sad共享胸腺嘧啶。在這兩種情況下,Locatelli都忽略空格、標(biāo)點(diǎn)符號(hào)和變音符號(hào)。
這張表的靈感來自希伯來字母和DNA密碼表
然后,他分別從VectorBuilder和ProteoGenix公司購買了定制的DNA鏈,以及用于將新DNA插入細(xì)胞的良性病毒。他買了一些生理鹽水和注射器就出發(fā)去參加了比賽。注射后,他只出現(xiàn)了輕微的過敏反應(yīng)。
Locatelli說:“我做這個(gè)實(shí)驗(yàn)是為了宗教和科學(xué)之間和平的象征?!?/p>
但是,加州大學(xué)洛杉磯分校的生物化學(xué)家Sriram Kosuri表示,他不能確定Locatelli的方法是否真的有效;無法評(píng)估病毒載體是否成功地將合成的DNA導(dǎo)入了Locatelli細(xì)胞。
這位少年的研究確實(shí)表明,在DNA中存儲(chǔ)任何類型的信息并不是一件很難的事情。這是一種非常高效的存儲(chǔ)方式,這就是為什么科學(xué)家們一直把它看作是在緊湊空間中安全存儲(chǔ)大量數(shù)據(jù)的一種方式。
到目前為止,盡管生物技術(shù)公司正在競(jìng)相尋找更便宜的方法,但制造用于數(shù)據(jù)存儲(chǔ)的合成DNA的成本高得令人望而卻步。
當(dāng)然,商業(yè)存儲(chǔ)的目標(biāo)是能夠?qū)⑵滢D(zhuǎn)換回可用的信息。從理論上講,如果新的DNA被正確地植入Locatelli的細(xì)胞中,細(xì)胞會(huì)像他自己的DNA一樣復(fù)制,也就是說他自己進(jìn)行了基因編輯,那么基于文本的DNA就可以被翻譯成文本。
然而,這可能并沒有發(fā)生。最先進(jìn)的醫(yī)學(xué)研究剛剛開始開發(fā)基因療法。即使人工合成的DNA被保存下來,最初的文本轉(zhuǎn)換也非常不精確,很難重現(xiàn)真實(shí)的文本。
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
6837瀏覽量
88754 -
計(jì)算機(jī)
+關(guān)注
關(guān)注
19文章
7383瀏覽量
87641 -
DNA
+關(guān)注
關(guān)注
0文章
242瀏覽量
30975
原文標(biāo)題:我,就是數(shù)據(jù):高中生把數(shù)據(jù)編入體內(nèi),1公斤DNA 未來可儲(chǔ)存全球數(shù)據(jù)
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論