繼AlphaGo在圍棋上碾壓人類后,DeepMind再放大招!這次戰(zhàn)場轉(zhuǎn)移到了基礎(chǔ)科學(xué)研究領(lǐng)域:蛋白質(zhì)折疊結(jié)構(gòu)的預(yù)測。在有蛋白質(zhì)結(jié)構(gòu)預(yù)測的“奧運(yùn)會”之稱CASP全球競賽上,DeepMind推出的AI工具AlphaFold以優(yōu)異成績碾壓了人類專家。
還記得在圍棋上碾壓人類棋手的AlphaGo嗎?現(xiàn)在,AlphaGo的締造者DeepMind又再另一領(lǐng)域碾壓了人類專家。
這個領(lǐng)域就是“蛋白質(zhì)折疊”,也就是蛋白質(zhì)結(jié)構(gòu)的精確預(yù)測!這是DeepMind首次將視角投向科學(xué)研究的基礎(chǔ)問題。在有蛋白質(zhì)結(jié)構(gòu)預(yù)測的“奧運(yùn)會”之稱CASP全球競賽上,DeepMind推出的AI工具AlphaFold以優(yōu)異成績碾壓了人類專家。
DeepMind匯集了來自結(jié)構(gòu)生物學(xué),物理學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域的專家,以應(yīng)用尖端技術(shù),僅根據(jù)其基因序列預(yù)測蛋白質(zhì)的3D結(jié)構(gòu)。
過去兩年來,DeepMind一直在研究開發(fā)AlphaFold,該研究建立在多年研究基礎(chǔ)上,使用大量的基因組數(shù)據(jù)來預(yù)測蛋白質(zhì)結(jié)構(gòu)。 AlphaFold生成的蛋白質(zhì)3D模型比之前的任何蛋白質(zhì)都更加準(zhǔn)確 - 在生物學(xué)的核心挑戰(zhàn)之一上取得了重大進(jìn)展。
什么是“蛋白質(zhì)折疊”問題?
蛋白質(zhì)是維持生命所必需的結(jié)構(gòu)復(fù)雜的大分子。我們的身體幾乎所有功能,包括肌肉收縮、感知光線或?qū)⑹澄镛D(zhuǎn)化為能量,都與一種或多種蛋白質(zhì)的移動和變化情況有關(guān)。蛋白質(zhì)由基因構(gòu)成,基因在我們的DNA中編碼。
對于任何給定的蛋白質(zhì),它的功能取決于其特有的3D結(jié)構(gòu)。比如構(gòu)成我們免疫系統(tǒng)的抗體蛋白質(zhì)是“Y形”的,類似于一種特殊的鉤子。通過抗體蛋白質(zhì)能夠鎖定病毒和細(xì)菌,檢測和標(biāo)記致病微生物,以便消滅它們。而膠原蛋白的形狀就像繩索,在軟骨、韌帶、骨骼和皮膚之間傳遞張力。
其他類型的蛋白質(zhì)包括CRISPR和Cas9,它們能夠像剪刀一樣,切割和粘貼DNA。還有抗凍蛋白,其3D結(jié)構(gòu)使其能夠與冰晶結(jié)合,防止生物體凍結(jié)。和核糖體一樣,可以像程序化的裝配線一樣,幫助自己構(gòu)建蛋白質(zhì)。
但是純粹從其基因序列中確定蛋白質(zhì)的三維形狀是一項(xiàng)復(fù)雜的任務(wù),挑戰(zhàn)在于DNA僅包含有關(guān)蛋白質(zhì)結(jié)構(gòu)塊序列的信息,這些結(jié)構(gòu)塊稱為氨基酸殘基,排布形成長鏈。預(yù)測這些長鏈按照何種方式折疊成蛋白質(zhì)的復(fù)雜3D結(jié)構(gòu),就是所謂的“蛋白質(zhì)折疊問題”。
蛋白質(zhì)越大,模型就越復(fù)雜和困難,因?yàn)榘被嶂g的相互作用更加復(fù)雜。有研究人員估計,以現(xiàn)有的條件的水平,要想準(zhǔn)確確定全部蛋白質(zhì)的3D結(jié)構(gòu),需要的時間可能比宇宙的壽命還要長。
為什么“蛋白質(zhì)折疊”很重要?
預(yù)測“蛋白質(zhì)折疊”的結(jié)構(gòu),對科學(xué)家來說是很有用的,可以通過這種方式了解蛋白質(zhì)在人體內(nèi)的作用,對阿爾茨海默氏癥,帕金森氏癥,亨廷頓氏癥和囊性纖維化等由蛋白質(zhì)折疊方式錯誤而引發(fā)的疾病的診斷和治療而言,這個問題就顯得更加重要。
通過研究蛋白質(zhì)折疊,能夠增進(jìn)我們對人體運(yùn)行機(jī)制的理解,使科學(xué)家能夠更有效地設(shè)計新的、高效的疾病療法。通過模擬和模型獲得更多關(guān)于蛋白質(zhì)形狀及其運(yùn)作方式的知識,也給新藥物的開發(fā)開辟了新的潛力,降低了與實(shí)驗(yàn)成本。最終得以改善全世界數(shù)百萬患者的生活質(zhì)量。
對蛋白質(zhì)折疊的理解也將有助于蛋白質(zhì)的設(shè)計,比如推進(jìn)生物降解酶技術(shù)的進(jìn)步,就可以通過對蛋白質(zhì)設(shè)計來實(shí)現(xiàn)。生物降解酶可以對塑料和石油等污染物實(shí)現(xiàn)控制管理,讓人們用更加環(huán)境友好的方式分解廢物。事實(shí)上,研究人員已經(jīng)開始設(shè)計細(xì)菌來分泌蛋白質(zhì),提高廢物的可降解度。
為了衡量人類在蛋白質(zhì)結(jié)構(gòu)測定技術(shù)上的新進(jìn)展,1994年,科學(xué)家發(fā)起了名為“蛋白質(zhì)結(jié)構(gòu)預(yù)測技術(shù)關(guān)鍵評估社區(qū)范圍實(shí)驗(yàn)”(CASP)的全球競賽,該比賽每兩年舉辦一次,現(xiàn)已成為領(lǐng)域內(nèi)評估蛋白質(zhì)結(jié)構(gòu)水平的“金標(biāo)準(zhǔn)”,堪稱蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域的“奧運(yùn)會”。
此次DeepMind讓AlphaFold參加本次盛會。比賽目標(biāo)是從主辦方給出氨基酸成分列表中預(yù)測蛋白質(zhì)的結(jié)構(gòu),這些表會在賽前幾個月內(nèi)每隔幾天發(fā)給參賽團(tuán)隊(duì)。提交最準(zhǔn)確預(yù)測信息的團(tuán)隊(duì)將獲勝。
結(jié)果首次參賽的AlphaFold就在98位參賽者中脫穎而出,以碾壓級優(yōu)勢一舉奪冠。在對總共43種蛋白質(zhì)的預(yù)測中,AlphaFold獲得了其中25種的最高分?jǐn)?shù),排名第二的隊(duì)伍獲得最高分?jǐn)?shù)的蛋白質(zhì)只有3種。
AI在“蛋白質(zhì)折疊”任務(wù)中大展身手
在過去半個世紀(jì)中,科學(xué)家們已經(jīng)能夠使用冷凍電子顯微鏡、核磁共振或X射線晶體學(xué)等技術(shù)來確定實(shí)驗(yàn)室中蛋白質(zhì)的形狀,但每種方法都依賴于大量的試驗(yàn),而且錯誤率不低,且成本高昂。越來越多的生物學(xué)家正在轉(zhuǎn)向了AI方法,作為解決這個困難問題的替代方法。
由于基因測序成本的快速降低,基因組學(xué)領(lǐng)域的數(shù)據(jù)非常豐富。因此,在過去幾年中,依賴于基因組數(shù)據(jù)的預(yù)測問題的深度學(xué)習(xí)方法變得越來越流行。
AlphaFold從頭開始對蛋白質(zhì)的形態(tài)結(jié)構(gòu)進(jìn)行建模,而沒有使用已經(jīng)解析的蛋白質(zhì)作為模板。結(jié)果在預(yù)測蛋白質(zhì)結(jié)構(gòu)的物理性質(zhì)時達(dá)到高準(zhǔn)確度,在此基礎(chǔ)上使用兩種不同的方法,來構(gòu)建完整蛋白質(zhì)結(jié)構(gòu)的預(yù)測。
基于深度學(xué)習(xí)的蛋白質(zhì)結(jié)構(gòu)預(yù)測新方法
這兩種方法都依賴于深度神經(jīng)網(wǎng)絡(luò),可以從蛋白質(zhì)的基因序列中預(yù)測其特性。該網(wǎng)絡(luò)預(yù)測指標(biāo)主要有兩個:(1)氨基酸對之間的距離(2)連接這些氨基酸的化學(xué)鍵之間的角度。這是對目前的一種常用技術(shù)的進(jìn)一步推進(jìn),該技術(shù)用于估計氨基酸對之間是否彼此接近。
DeepMind團(tuán)隊(duì)訓(xùn)練神經(jīng)網(wǎng)絡(luò),預(yù)測蛋白質(zhì)中每對殘基之間的距離的單獨(dú)分布。然后將這些概率進(jìn)行組合,形成相應(yīng)蛋白質(zhì)結(jié)構(gòu)預(yù)測的準(zhǔn)確度分?jǐn)?shù)。此外還訓(xùn)練了一個單獨(dú)的神經(jīng)網(wǎng)絡(luò),將所有的預(yù)測距離匯總,估計出預(yù)測結(jié)構(gòu)與實(shí)際結(jié)構(gòu)間的接近程度。
使用這些評分函數(shù),可以找到與預(yù)測相匹配的蛋白質(zhì)結(jié)構(gòu)。第一種方法建立在結(jié)構(gòu)生物學(xué)中常用的技術(shù)基礎(chǔ)上,用新的蛋白質(zhì)結(jié)構(gòu)片段反復(fù)替換原蛋白質(zhì)結(jié)構(gòu)片段。為此,研究團(tuán)隊(duì)訓(xùn)練了一個生成神經(jīng)網(wǎng)絡(luò)來發(fā)明新的蛋白質(zhì)片段,不斷提高預(yù)測的蛋白質(zhì)結(jié)構(gòu)的得分。
第二種方法通過梯度下降來優(yōu)化得分。梯度下降是機(jī)器學(xué)習(xí)中常用的技術(shù),可用于實(shí)現(xiàn)微小的,漸進(jìn)式的改進(jìn),最終產(chǎn)生高精確的結(jié)構(gòu)。研究人員將該技術(shù)用于整個蛋白質(zhì)長鏈上,而不是在組裝之前必須單獨(dú)折疊的碎片上,降低了預(yù)測過程的復(fù)雜度。
未來:繼續(xù)投入解決科學(xué)上的基礎(chǔ)性問題
DeepMind首次涉足蛋白質(zhì)折疊領(lǐng)域就獲得成功,表明機(jī)器學(xué)習(xí)體系具備無窮潛力,可以整合各種信息源,幫助科學(xué)家快速提出解決復(fù)雜問題的創(chuàng)造性解決方案。正如AI通過AlphaGo和AlphaZero等系統(tǒng)在圍棋上的突破一樣,希望在不遠(yuǎn)的未來,AI技術(shù)突破將幫助我們解決科學(xué)上的基礎(chǔ)性問題。
“對我們來說,這是一個非常關(guān)鍵的時刻,”DeepMind的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Demis Hassabis說?!斑@是一個燈塔項(xiàng)目,是我們在人員和資源方面,向解決現(xiàn)實(shí)世界中的重大基礎(chǔ)科學(xué)問題做出的第一次重大投入?!?/p>
Hassabis表示,未來還有很多工作要做。目前我們還沒有解決蛋白質(zhì)折疊問題,現(xiàn)在取得的結(jié)果只是第一步?!斑@是一個極具挑戰(zhàn)性的問題,但我們建立起了一個很優(yōu)秀的系統(tǒng),而且還有很多想法尚未真正實(shí)施?!?/p>
-
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5465瀏覽量
120891 -
DeepMind
+關(guān)注
關(guān)注
0文章
129瀏覽量
10812
原文標(biāo)題:AlphaGo后再出神作!DeepMind打造AlphaFold擊敗人類,精度碾壓人類專家!
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論