一組來自 Alphabet ‘ sDeepmind 的計(jì)算生物學(xué)家利用人工智能從蛋白質(zhì)的氨基酸序列中預(yù)測(cè)蛋白質(zhì)的結(jié)構(gòu),解開了一個(gè)困擾科學(xué)家數(shù)十年的謎團(tuán)。
甚至不到一年后,一項(xiàng)新的研究提供了一個(gè)更強(qiáng)大的模型,能夠在一臺(tái)游戲電腦上在短短 10 分鐘內(nèi)計(jì)算出蛋白質(zhì)結(jié)構(gòu)。
The research 來自華盛頓大學(xué)( UW )的科學(xué)家們承諾加快藥物研發(fā),這可以解開治療癌癥等疾病的方法。
存在于身體的每一個(gè)細(xì)胞中,蛋白質(zhì)在許多過程中發(fā)揮作用,如凝血、激素調(diào)節(jié)、免疫系統(tǒng)反應(yīng)、視力以及細(xì)胞和組織修復(fù)。由長(zhǎng)鏈氨基酸相互作用形成折疊的三維結(jié)構(gòu)組成,蛋白質(zhì)的形狀決定其功能。
未折疊或錯(cuò)誤折疊的蛋白質(zhì)也被認(rèn)為會(huì)導(dǎo)致退化性疾病,包括囊性纖維化、阿爾茨海默病、帕金森病和亨廷頓病。了解和預(yù)測(cè)一種蛋白質(zhì)結(jié)構(gòu)是如何形成的,可以幫助科學(xué)家為許多此類疾病設(shè)計(jì)有效的干預(yù)措施。
華盛頓大學(xué)的研究人員通過創(chuàng)建一個(gè)同時(shí)考慮蛋白質(zhì)序列模式、氨基酸相互作用和可能的三維結(jié)構(gòu)的三軌神經(jīng)網(wǎng)絡(luò),開發(fā)了 RoseTTAFold 模型。
為了訓(xùn)練模型,研究小組使用不連續(xù)的蛋白質(zhì)片段,有 260 個(gè)獨(dú)特的氨基酸元素。具有the cuDNN – 加速 PyTorch 深度學(xué)習(xí)框架,以及 NVIDIA Geforce 2080 GPU ,這些信息在深度學(xué)習(xí)模型中來回流動(dòng)。然后這個(gè)網(wǎng)絡(luò)就可以推斷出蛋白質(zhì)的化學(xué)成分及其折疊結(jié)構(gòu)。
“ RoseTTAFold 的端到端版本需要在 RTX 2080 GPU 上大約 10 分鐘來生成少于 400 個(gè)殘基的蛋白質(zhì)的骨架坐標(biāo)。研究人員在研究報(bào)告中寫道:“ pyRosetta 版本需要 5 分鐘對(duì)單個(gè) NVIDIA RTX 2080 GPU 進(jìn)行網(wǎng)絡(luò)計(jì)算,用 15 個(gè) CPU 核生成所有原子結(jié)構(gòu)需要 1 小時(shí)。”。
預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)及其基本真值。信貸: UW / Baek 等人
這個(gè)工具不僅可以快速預(yù)測(cè)蛋白質(zhì),而且可以在有限的輸入下進(jìn)行預(yù)測(cè)。它也有能力超越簡(jiǎn)單的結(jié)構(gòu)進(jìn)行計(jì)算,預(yù)測(cè)由幾個(gè)結(jié)合在一起的蛋白質(zhì)組成的復(fù)合物。更復(fù)雜的模型在 24G 上計(jì)算大約 30 分鐘 NVIDIA Titan RTX 。
任何有興趣提交蛋白質(zhì)序列的人都可以使用公共服務(wù)器。這個(gè) 源代碼 科學(xué)界也可以免費(fèi)獲得。
“就在上個(gè)月,超過 4500 種蛋白質(zhì)被提交到我們新的網(wǎng)絡(luò)服務(wù)器上,我們通過 GitHub 網(wǎng)站提供了 RoseTTAFold 代碼。我們希望這個(gè)新工具將繼續(xù)有益于整個(gè)研究社區(qū),”華盛頓大學(xué)蛋白質(zhì)研究所的博士后學(xué)者 Minkyung Baek 說。
關(guān)于作者
Michelle Horton 是 NVIDIA 的高級(jí)開發(fā)人員通信經(jīng)理,擁有通信經(jīng)理和科學(xué)作家的背景。她在 NVIDIA 為開發(fā)者博客撰文,重點(diǎn)介紹了開發(fā)者使用 NVIDIA 技術(shù)的多種方式。
審核編輯:郭婷
-
NVIDIA
+關(guān)注
關(guān)注
14文章
4862瀏覽量
102722 -
人工智能
+關(guān)注
關(guān)注
1791文章
46691瀏覽量
237179
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論