在生物醫(yī)學(xué)領(lǐng)域,DeepMind 又做出了具有里程碑意義的產(chǎn)品。
兩年一度的國際蛋白質(zhì)結(jié)構(gòu)預(yù)測競賽(CASP)的在周末正式公布最終結(jié)果。這個已經(jīng)進(jìn)行了 25 年的比賽項目,每屆都有來自世界各地的數(shù)百支團(tuán)隊參與,以促進(jìn)研究和衡量最新方法在提高預(yù)測準(zhǔn)確性方面的進(jìn)展。
據(jù)《衛(wèi)報》報道,DeepMind 花了兩年的時間做出來的“新生兒”AlphaFold 這次在 98 名參賽者中排名第一,它獲得了預(yù)測 43 種蛋白中的 25 種蛋白結(jié)構(gòu)的最高分,排名第二的隊伍只有其中 3 個獲得了預(yù)測最高分。CASP 的組織者稱 DeepMind “用計算方法在預(yù)測蛋白結(jié)構(gòu)中取得了前所未有的進(jìn)步”。
實際上,早在 2017 年 10 月,DeepMind 就表示他們對人工智能在藥物開發(fā)中的應(yīng)用感興趣,而新藥開發(fā)的重要一步就是對靶點蛋白質(zhì)三維結(jié)構(gòu)的精準(zhǔn)測算。
DeepMind 近日在博客中介紹了背后的技術(shù)原理。DeepMind 稱,通過采用跨學(xué)科方法,DeepMind 匯集了來自結(jié)構(gòu)生物學(xué)、物理學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域的專家,使用前沿技術(shù)在僅基于基因序列的基礎(chǔ)上預(yù)測蛋白質(zhì)的 3D 結(jié)構(gòu)。
蛋白折疊難題
眾所周知,蛋白質(zhì)是維持生命所必需的分子,帶有蛋白質(zhì)編碼的 DNA 片段則稱為基因,而蛋白質(zhì)的功能一般取決于其獨特的 3D 結(jié)構(gòu)。
例如,構(gòu)成人體免疫系統(tǒng)的抗體蛋白是“Y 形”的,形狀類似于獨特的鉤。通過鎖定病毒和細(xì)菌,抗體蛋白能夠檢測和標(biāo)記這些引發(fā)疾病的微生物并最終消滅它們。其他類型的蛋白質(zhì)包括 CRISPR 和 Cas9,它們會像剪刀一樣剪切并粘貼 DNA。
但純粹從蛋白質(zhì)的基因序列中找出三維形狀并不容易,其挑戰(zhàn)在于 DNA 僅包含有關(guān)蛋白質(zhì)構(gòu)建塊序列的信息——氨基酸殘基,它形成了長鏈,預(yù)測這些鏈如何折疊成蛋白質(zhì)的復(fù)雜 3D 結(jié)構(gòu)也就是所謂的“蛋白折疊問題”,是科學(xué)家們幾十年來都未曾解決的難題。
而預(yù)測蛋白質(zhì)的形狀有助于科學(xué)家了解它在體內(nèi)的作用,這也是診斷和治療由錯誤折疊的蛋白質(zhì)所引發(fā)疾病的基礎(chǔ),如阿爾茨海默氏癥、帕金森氏癥、亨丁頓氏舞蹈癥和囊腫性纖維化。
隨著科學(xué)家們通過模擬和模型獲得更多關(guān)于蛋白質(zhì)形狀及其運作方式的知識,它會在藥物發(fā)現(xiàn)中發(fā)揮作用,同時也能降低相關(guān)實驗成本,這將造福全世界數(shù)百萬患者。此外,對蛋白折疊的理解也將有助于生物可降解酶的發(fā)展,以此更容易分解廢物。
AI 能做什么?
在過去的五十年中,科學(xué)家們已經(jīng)能夠使用冷凍電子顯微鏡、核磁共振等技術(shù)來確定實驗室中的蛋白質(zhì)形狀,但這些方法的成本高達(dá)成千上萬美元,而人工智能方法恰是很好的替代方案。
過去幾年中,由于基因測序成本的快速降低以及基因組學(xué)領(lǐng)域豐富的大數(shù)據(jù),依賴于基因組數(shù)據(jù)預(yù)測問題的深度學(xué)習(xí)方法變得越來越流行。
DeepMind 的團(tuán)隊專注于從頭開始建模目標(biāo)形狀的難題,而不是使用先前解析的蛋白質(zhì)作為模板。總體而言,他們使用了兩種不同的方法來預(yù)測完整的蛋白質(zhì)結(jié)構(gòu)。
使用神經(jīng)網(wǎng)絡(luò)預(yù)測物理特性
這兩種方法都依賴于深度神經(jīng)網(wǎng)絡(luò),這些神經(jīng)網(wǎng)絡(luò)經(jīng)過訓(xùn)練可以從基因序列中預(yù)測蛋白質(zhì)的特性。
他們的神經(jīng)網(wǎng)絡(luò)預(yù)測的特性包括:(a)氨基酸對之間的距離和(b)連接這些氨基酸的化學(xué)鍵之間的角度。這是在常用技術(shù)基礎(chǔ)上的一大進(jìn)步,這些技術(shù)估計氨基酸對是否彼此接近。
他們訓(xùn)練了一個神經(jīng)網(wǎng)絡(luò)來預(yù)測蛋白質(zhì)中每對殘基之間的距離分布,然后將這些概率組合成評估蛋白質(zhì)結(jié)構(gòu)準(zhǔn)確度的分?jǐn)?shù)。他們還訓(xùn)練了一個單獨的神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)使用匯總了的所有距離分布來評估預(yù)測結(jié)構(gòu)與標(biāo)準(zhǔn)結(jié)構(gòu)的接近程度。
構(gòu)建蛋白結(jié)構(gòu)預(yù)測的新方法
使用這些評分函數(shù),能夠找到與他們的預(yù)測相匹配的結(jié)構(gòu)。他們的第一種方法建立在結(jié)構(gòu)生物學(xué)常用的技術(shù)上,并用新的蛋白質(zhì)片段反復(fù)替換蛋白質(zhì)結(jié)構(gòu)的片段。他們訓(xùn)練出了一種生成神經(jīng)網(wǎng)絡(luò)來構(gòu)建新片段,以此來不斷提升預(yù)測蛋白質(zhì)結(jié)構(gòu)的準(zhǔn)確度。
第二種方法是通過梯度下降方法來優(yōu)化準(zhǔn)確度,這種技術(shù)應(yīng)用在了整個蛋白鏈而不是在組合之前單獨折疊的片段中,這也降低了預(yù)測處理的復(fù)雜性。
“預(yù)測蛋白折疊形狀對解決很多世紀(jì)性難題有重要意義。它可以影響健康、生態(tài)、環(huán)境等任何涉及生命系統(tǒng)的問題。”在表達(dá)了對人工智能的信心后,雷丁大學(xué)的研究人員 Liam McGuffin 也理性表示,蛋白折疊問題目前只是邁出了第一步,這是一個極具挑戰(zhàn)性的問題,還有很多好想法沒能實施。
盡管 AlphaFold 沒有像“大哥”AlphaGo 橫空出世時那樣的熱度,但這并不能忽視 AlphaFold 對業(yè)界所具有的重要意義。
在 DeepMind 團(tuán)隊看來,AlphaFold 的初步成就表明了 AI 在科學(xué)發(fā)現(xiàn)中的實用性,機(jī)器學(xué)習(xí)系統(tǒng)能整合各種信息來源,以幫助科學(xué)家快速找到解決復(fù)雜問題的創(chuàng)造性解決方案。正如我們已經(jīng)看到 AI 如何通過 AlphaGo 和 AlphaZero 等系統(tǒng)幫助人們掌握復(fù)雜游戲。他們希望,AI 技術(shù)的突破有一天會幫助人類掌握基本的科學(xué)問題。
近來在 AI 在生物醫(yī)學(xué)領(lǐng)域的應(yīng)用,包括語音錄入病歷、醫(yī)療影像、健康管理等多領(lǐng)域已然取得了一些成績,但總體而言任重道遠(yuǎn),我們需要更多像 DeepMind 這樣的團(tuán)隊不斷地進(jìn)行探索。
-
人工智能
+關(guān)注
關(guān)注
1789文章
46669瀏覽量
237106 -
DeepMind
+關(guān)注
關(guān)注
0文章
129瀏覽量
10812
原文標(biāo)題:AlphaGo“兄弟”AlphaFold出世,背后用了哪些技術(shù)?
文章出處:【微信號:mcuworld,微信公眾號:嵌入式資訊精選】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論