傳統(tǒng)的藥物研發(fā)高度依賴藥化專家的個(gè)人經(jīng)驗(yàn)與創(chuàng)造力,不可避免地存在周期長(zhǎng)、成本高、成功率低等問(wèn)題。一個(gè)創(chuàng)新藥從研發(fā)到最后上市,需要花費(fèi)數(shù)十億美元和10~15年的時(shí)間 。鑒于種種痛點(diǎn),如何將人工智能(AI)藥物研發(fā)新范式應(yīng)用于藥物研發(fā)領(lǐng)域是制藥行業(yè)一直以來(lái)探索的革新方向。隨著近年來(lái)AI在各個(gè)領(lǐng)域的巨大成功,基于AI的藥物研發(fā)勢(shì)必成為醫(yī)藥行業(yè)的革命性力量,有望從根本上改變傳統(tǒng)的試錯(cuò)藥物設(shè)計(jì)流程,基于AI的藥物設(shè)計(jì)流程如圖1所示。
圖1. AI可以通過(guò)不同的方式進(jìn)行藥物開發(fā),包括藥物篩選、多向藥理學(xué)、藥物再純化、化學(xué)合成、藥物設(shè)計(jì)等
目前,基于AI的藥物設(shè)計(jì)的確取得了可喜的進(jìn)展。例如Insilico Medicine應(yīng)用深度學(xué)習(xí)技術(shù),發(fā)現(xiàn)了強(qiáng)效的DDR1抑制劑。英國(guó)Exscienceia公司開發(fā)了世界上第一個(gè)AI設(shè)計(jì)的藥物(DSP-1181),于2020年進(jìn)入第I期臨床試驗(yàn),2021年又開發(fā)了另外兩種臨床試驗(yàn)藥物。DeepMind的AlphaFold 則是另一個(gè)革命性的突破。其前所未有的結(jié)構(gòu)預(yù)測(cè)精度可以對(duì)基于結(jié)構(gòu)的藥物設(shè)計(jì)產(chǎn)生潛在的影響,特別是對(duì)于尚未從結(jié)構(gòu)上解決的新靶點(diǎn)。盡管在以AI為基礎(chǔ)的藥物開發(fā)方面取得了上述令人興奮的成果,但我們?nèi)匀粺o(wú)法確定這些早期成果能否轉(zhuǎn)化為更有效、成功率較高的藥物。藥物開發(fā)中的關(guān)鍵問(wèn)題是候選分子在臨床試驗(yàn)中的失敗。提高臨床試驗(yàn)的成功率可以說(shuō)是降低總成本的最深刻因素,超過(guò)其他階段的節(jié)省。主要挑戰(zhàn)是識(shí)別不僅有效而且不會(huì)引起毒性和其他意想不到的副作用的候選分子。AI如何對(duì)此有所幫助?我們需要重新思考如何將AI納入藥物開發(fā)途徑。在這方面,我們強(qiáng)調(diào)兩種范式,即主動(dòng)學(xué)習(xí)和可解釋的AI,作為基于AI的藥物發(fā)展的未來(lái)方向。作為一種數(shù)據(jù)驅(qū)動(dòng)的方法,基于AI的藥物研發(fā)的優(yōu)勢(shì)在于能夠挖掘大規(guī)模數(shù)據(jù)并提取對(duì)人類來(lái)說(shuō)可能不太顯著或過(guò)于復(fù)雜的模式。因此,如何真正利用數(shù)據(jù)的價(jià)值是構(gòu)建成功的AI模型的關(guān)鍵。將AI用于藥物開發(fā)過(guò)程的一個(gè)常規(guī)和流行的范式是,從實(shí)驗(yàn)數(shù)據(jù)(例如高通量篩選、試驗(yàn)/動(dòng)物驗(yàn)證數(shù)據(jù))中線性調(diào)用AI模型,以方便預(yù)測(cè)。
圖2.傳統(tǒng)的基于AI的藥物研發(fā)范式,AI與數(shù)據(jù)生成以線性方式連接
在這種范式中,AI模型通常被用來(lái)篩選潛在分子的虛擬庫(kù),并預(yù)測(cè)那些可能具有理想特性的虛擬庫(kù),這些特性可以通過(guò)下游實(shí)驗(yàn)加以驗(yàn)證。這種線性范式的主要局限在于新發(fā)現(xiàn)的效率:模型的預(yù)測(cè)雖然具有潛在的信息,但直到實(shí)驗(yàn)驗(yàn)證才是"受過(guò)訓(xùn)練的猜測(cè)"。不幸的是,用高通量篩選的巨大努力來(lái)徹底驗(yàn)證預(yù)測(cè)模型往往是不可行的。為了應(yīng)對(duì)這一挑戰(zhàn),逐漸得到認(rèn)可的一個(gè)很有前途的解決方案是主動(dòng)學(xué)習(xí),它是AI的一個(gè)子領(lǐng)域,將數(shù)據(jù)和計(jì)算緊密結(jié)合起來(lái),以改進(jìn)預(yù)測(cè)模型。主動(dòng)學(xué)習(xí)將傳統(tǒng)的基于AI的發(fā)展從線性過(guò)程轉(zhuǎn)變?yōu)榈妒饺鐖D3所示。
圖3.基于AI的藥物開發(fā)主動(dòng)學(xué)習(xí)范式,AI與數(shù)據(jù)生成形成迭代反饋回路
主動(dòng)學(xué)習(xí)不是將AI和實(shí)驗(yàn)生物學(xué)作為過(guò)程中的孤立工具,而是在兩者之間創(chuàng)建一個(gè)相互告知的互動(dòng)反饋回路,以改善整體結(jié)果。例如,在對(duì)初始公共數(shù)據(jù)集進(jìn)行訓(xùn)練并預(yù)測(cè)虛擬庫(kù)中分子的性質(zhì)后,AI模型可能會(huì)通過(guò)提出少數(shù)分子,包括預(yù)期成功的分子和預(yù)期失敗的分子來(lái)規(guī)劃下一步的步驟,以便進(jìn)行實(shí)驗(yàn)驗(yàn)證。使主動(dòng)學(xué)習(xí)具有吸引力的是藥物開發(fā)者可以迭代地利用AI生成的假設(shè)設(shè)計(jì)并執(zhí)行下一輪實(shí)驗(yàn)的迭代循環(huán):AI模型可以先推薦分子進(jìn)行合成和驗(yàn)證,驗(yàn)證結(jié)果再用于進(jìn)一步修正或加強(qiáng)模型的預(yù)測(cè)能力,模型的新預(yù)測(cè)告知另一個(gè)測(cè)試和分析周期。這些數(shù)據(jù)計(jì)算相互作用從而更有效地指導(dǎo)藥物開發(fā)者發(fā)現(xiàn)具有理想性質(zhì)的新分子。此外,數(shù)據(jù)計(jì)算循環(huán)還允許生成專門針對(duì)AI應(yīng)用程序的數(shù)據(jù)。相比之下,現(xiàn)有數(shù)據(jù)存在與數(shù)量或質(zhì)量相關(guān)的局限性,可能并不適用于每一種AI算法。許多AI驅(qū)動(dòng)的藥物發(fā)現(xiàn)公司,如Insitro已經(jīng)將AI與數(shù)據(jù)生成結(jié)合起來(lái)以發(fā)現(xiàn)新的治療藥物,而不是將其中一個(gè)放在另一個(gè)優(yōu)先位置上。除了能夠充分挖掘數(shù)據(jù)的價(jià)值之外,這種范式的另一個(gè)優(yōu)點(diǎn)是AI與人類智能之間的協(xié)同作用,醫(yī)學(xué)化學(xué)家可以引導(dǎo)AI更精確和更有創(chuàng)造性,AI可以增強(qiáng)專家發(fā)現(xiàn)改進(jìn)和新穎藥物的能力。然而,這需要對(duì)人類具有解釋力的AI模型,即揭示預(yù)測(cè)背后的內(nèi)在理?yè)?jù)。由于AI支持的藥物設(shè)計(jì)是一個(gè)高疊層決策問(wèn)題,因此,盡管模型的預(yù)測(cè)精度令人印象深刻,但對(duì)模型做出一定預(yù)測(cè)的原因的解釋卻要求很高。將機(jī)理可解釋性模型與高精度模型相結(jié)合是AI加速藥物發(fā)現(xiàn)的關(guān)鍵。了解成功的AI設(shè)計(jì)分子的機(jī)理解釋將引導(dǎo)未來(lái)的藥物設(shè)計(jì)。設(shè)計(jì)新藥本質(zhì)上是一個(gè)通過(guò)改變分子結(jié)構(gòu)來(lái)優(yōu)化藥理活性的問(wèn)題,識(shí)別與之相關(guān)的結(jié)構(gòu)元素至關(guān)重要。例如,在基于AI的抗體設(shè)計(jì)中,一個(gè)揭開抗體與抗原殘基之間存在相互作用的模型將解釋高性能抗體的結(jié)構(gòu)基礎(chǔ)。大多數(shù)現(xiàn)代AI模型,如深度神經(jīng)網(wǎng)絡(luò),都是“黑匣子”,回避了人腦的可達(dá)性,這可能會(huì)妨礙科學(xué)家評(píng)估AI生成假設(shè)的新穎性或可靠性。以Insilico公司AI發(fā)現(xiàn)的DDR1抑制劑為例:發(fā)現(xiàn)該化合物與市售藥物Ponatinib高度相似。Ponatinib是一種DDR1抑制劑,針對(duì)許多其他激酶,由于其潛在的副作用,被美國(guó)FDA給出盒裝警告。鑒于其與Ponatinib的驚人相似性,Insilico化合物的選擇性和安全性應(yīng)該受到質(zhì)疑。這個(gè)例子突出了AI模型的可解釋性和透明性對(duì)于藥物發(fā)現(xiàn)的重要性。
圖4. AI發(fā)現(xiàn)新DDR1抑制劑工作流程以及優(yōu)勢(shì)化合物結(jié)構(gòu)
最好的是,AI模型應(yīng)該揭示它如何達(dá)到特定的預(yù)測(cè),例如,基于哪些數(shù)據(jù)集來(lái)訓(xùn)練分子。了解AI預(yù)測(cè)的洞察力和邏輯性,將有助于科學(xué)家避免錯(cuò)誤原因的正確預(yù)測(cè),揭示對(duì)人類心靈過(guò)于微妙的警示??山忉孉I是機(jī)器學(xué)習(xí)共同體中一個(gè)活躍的方向,它在藥物開發(fā)中的應(yīng)用將有利于創(chuàng)造AI、實(shí)驗(yàn)生物學(xué)和人類反饋的迭代循環(huán)。幾十年來(lái),藥物開發(fā)一直都費(fèi)時(shí)費(fèi)力,且費(fèi)用昂貴。AI令人印象深刻突破使我們的思維定勢(shì)轉(zhuǎn)向設(shè)計(jì)藥物的新范式。我們預(yù)計(jì),未來(lái)十年基于AI的藥物開發(fā)將呈現(xiàn)出可解釋性AI方法和主動(dòng)學(xué)習(xí)算法的深度介入,這些方法迭代地改進(jìn)工作流程,產(chǎn)生科學(xué)家可以對(duì)藥物開發(fā)的每一個(gè)階段進(jìn)行監(jiān)控、分析和理解的可解釋性見解。
圖5.部分國(guó)內(nèi)AI制藥公司融資情況
2006年以來(lái),在高性能計(jì)算和深度學(xué)習(xí)的推動(dòng)下,人工智能發(fā)展迅速,進(jìn)入第三次浪潮,開始廣泛應(yīng)用于圖像分類、語(yǔ)音識(shí)別、知識(shí)問(wèn)答、人機(jī)對(duì)弈、無(wú)人駕駛等領(lǐng)域。也促使很多創(chuàng)業(yè)公司以及互聯(lián)網(wǎng)科技企業(yè)開始探索人工智能在藥物研發(fā)中的應(yīng)用。全球各大藥企紛紛布局AI藥物研發(fā),一些AI藥物研發(fā)公司借助這股浪潮紛紛開啟上市之路。
國(guó)內(nèi)AI制藥公司投資熱度也不斷高漲,多家公司兩輪融資時(shí)間間隔不超過(guò)一年,如晶泰科技從成立以來(lái),已累計(jì)完成 6輪融資,其中C 輪在當(dāng)時(shí)創(chuàng)下全球AI藥物研發(fā)領(lǐng)域單筆融資額的最高紀(jì)錄。互聯(lián)網(wǎng)科技巨頭也紛紛布局AI制藥領(lǐng)域,如阿里巴巴、騰訊、字節(jié)跳動(dòng)、百度、華為,他們依托自己的云計(jì)算服務(wù)平臺(tái),自主研發(fā)AI藥物設(shè)計(jì)算法,阿里在基因測(cè)序以及醫(yī)學(xué)診斷方面表現(xiàn)出優(yōu)勢(shì),騰訊在ADMET預(yù)測(cè)和分子合成路線預(yù)測(cè)方面的技術(shù)也日趨完善,國(guó)內(nèi)的AI制藥公司正處于萌發(fā)和快速成長(zhǎng)階段。
2020-2021上市的AI/計(jì)算制藥公司匯總
隨著各大AI制藥公司的茁壯成長(zhǎng),以及云計(jì)算平臺(tái)技術(shù)的進(jìn)步,我們相信未來(lái)AI制藥一定會(huì)有著巨大的進(jìn)步。這里我們?cè)僖淮翁峒盎?a href="http://ttokpm.com/soft/data/42-102/" target="_blank">AI技術(shù)的AlphaFold2,它被科學(xué)家認(rèn)為是AI技術(shù)在量變到質(zhì)變的一場(chǎng)革命。過(guò)去半個(gè)多世紀(jì),生物學(xué)家主要利用X射線晶體學(xué)或冷凍電鏡(cryo-EM)等實(shí)驗(yàn)技術(shù)來(lái)破譯蛋白質(zhì)的三維結(jié)構(gòu)。這些方法耗時(shí)長(zhǎng),失敗率高。如今,人類已經(jīng)發(fā)現(xiàn)生命體內(nèi)存在2億多個(gè)蛋白質(zhì),而其中只有約17萬(wàn)蛋白質(zhì)的結(jié)構(gòu)經(jīng)實(shí)驗(yàn)破解。AlphaFold2的問(wèn)世,在一年之內(nèi)就實(shí)現(xiàn)了預(yù)測(cè)這些蛋白質(zhì)中58%的結(jié)構(gòu),因?yàn)闊o(wú)固定結(jié)構(gòu)的氨基酸比例很大,58%的結(jié)構(gòu)預(yù)測(cè)已經(jīng)接近極限了。
諸如北鯤云這類易用、快速、經(jīng)濟(jì)的云超算平臺(tái)的普及,越來(lái)越多的藥物研發(fā)工作者可以非常方便
地
使用到這些最先進(jìn)的AI技術(shù)工具。北鯤云超算平臺(tái)部署了AlphaFold2工具,而且借助最新硬件資源(如NVIDIA A100),
預(yù)測(cè)2116個(gè)氨基酸的三維結(jié)構(gòu),只需要12個(gè)小時(shí)即可完成。
快速、低成本的特性可以實(shí)現(xiàn)規(guī)?;A(yù)測(cè),這無(wú)疑是AI制藥領(lǐng)域的一味催化劑。
借助北鯤云超算平臺(tái),科學(xué)研究已無(wú)需自己配備高性能的計(jì)算機(jī),只需要登錄北鯤云超算平臺(tái)在線操作即可,為科研的發(fā)展提供極大的助力。以下是北鯤云超算平臺(tái)比較吸引我的幾點(diǎn)優(yōu)勢(shì),供大家參考。
海量算力隨時(shí)調(diào)用,按需使用極大地節(jié)省計(jì)算成本
支持多種作業(yè)提交方式,操作簡(jiǎn)單
24小時(shí)在線服務(wù),技術(shù)咨詢?cè)敿?xì)耐心
計(jì)算任務(wù)進(jìn)度實(shí)時(shí)追蹤
數(shù)據(jù)分級(jí)分權(quán)治理,數(shù)據(jù)安全有保障
審核編輯 黃昊宇
-
AI
+關(guān)注
關(guān)注
87文章
29806瀏覽量
268103
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論