MIT的研究人員正在使用新的機(jī)器學(xué)習(xí)技術(shù), 通過減少治療膠質(zhì)母細(xì)胞瘤過程中毒性化療和放療的劑量,來提高患者的生活質(zhì)量。而膠質(zhì)母細(xì)胞瘤是一種最嚴(yán)重的腦癌。
膠質(zhì)母細(xì)胞瘤是一種出現(xiàn)在大腦或脊髓中的惡性腫瘤,成人的預(yù)后不超過五年?;颊弑仨毴淌苊吭路暖熀头枚喾N藥物的聯(lián)合治療法。醫(yī)學(xué)專業(yè)人員通常在安全范圍內(nèi)給予最大藥物劑量以盡可能縮小腫瘤。但是這些藥效強(qiáng)烈的副作用會使患者非常虛弱。
在斯坦福大學(xué)2018年醫(yī)學(xué)健康機(jī)器學(xué)習(xí)大會上發(fā)表的一篇論文中,麻省理工學(xué)院Media實(shí)驗(yàn)室的研究人員詳細(xì)介紹了一個模型,該模型可以使給藥方案毒性更小,但仍然有效。該模型以“自主學(xué)習(xí)”機(jī)器學(xué)習(xí)技術(shù)為動力,研究目前使用的治療方案,并反復(fù)調(diào)整劑量。最終,找到一個最佳的治療方案,可以盡可能降低毒性和劑量,而且仍然能夠?qū)⒛[瘤縮小到與傳統(tǒng)治療方案相當(dāng)?shù)某潭取?/p>
在對50名患者的模擬試驗(yàn)中,機(jī)器學(xué)習(xí)模型設(shè)計了治療周期,幾乎把所有的藥物劑量都降低了四分之一或一半,同時保持相同的效用使腫瘤縮小。多數(shù)情況下,它忽略了總劑量的限制,用一年給藥兩次替代每月給藥。
負(fù)責(zé)這項研究的Media實(shí)驗(yàn)室的項目負(fù)責(zé)人(PI)Pratik Shah說:“我們堅持的目標(biāo)是,一方面必須縮小腫瘤的大小,但同時也希望確保病人的生活質(zhì)量,不讓劑量毒性造成嚴(yán)重的疾病和有害副作用?!闭撐牡牡谝蛔髡呤荕edia實(shí)驗(yàn)室的研究員格Gregory Yauney。
鼓勵好的選擇
在這一研究中研究人員使用了一種被稱為強(qiáng)化學(xué)習(xí)(Reinforced Learning,RL )的技術(shù),該方法受到行為心理學(xué)的啟發(fā),在這種方法中,模型會偏愛那些可以帶來較好預(yù)期結(jié)果的行為。該技術(shù)利用人工智能“代理”,在不可預(yù)知的復(fù)雜環(huán)境中完成“動作”,以達(dá)到期望的“結(jié)果”。每當(dāng)它完成一個動作時,代理會收到一個“獎勵”或“懲罰”,這取決于該動作是否朝著結(jié)果進(jìn)行。然后,代理相應(yīng)地調(diào)整其動作以實(shí)現(xiàn)預(yù)期的結(jié)果。
獎勵和懲罰基本上被標(biāo)記為正數(shù)和負(fù)數(shù),比如+ 1或- 1。除其他因素外,所得的分?jǐn)?shù)取決于所采取的行動,根據(jù)結(jié)果的成功或失敗的概率計算得分。代理本質(zhì)上是試圖根據(jù)獎勵和懲罰值,從數(shù)值上優(yōu)化所有動作,在給定的任務(wù)中取得最大的結(jié)果分?jǐn)?shù)。
這種方法被Deep Mind用來訓(xùn)練計算機(jī)程序,該程序在2016年因擊敗了世界上最好的人類玩家之一而一舉成名。它還被用來訓(xùn)練無人駕駛汽車的行駛策略,例如并入車流或停車,在這個程序里,車輛會反復(fù)練習(xí),調(diào)整路線,直到正確。
研究人員將RL模型用于膠質(zhì)母細(xì)胞瘤的治療,該治療方案為替莫唑胺( TMZ ),普魯卡因、洛莫司汀和長春新堿( PVC )的聯(lián)合服藥療法,給藥時間長達(dá)數(shù)周或數(shù)月。
該模型梳理了傳統(tǒng)的給藥方案。這些方案在臨床上已經(jīng)使用了幾十年,并且基于動物試驗(yàn)和各種臨床試驗(yàn)制定。腫瘤學(xué)家使用這些既定的方案根據(jù)體重來預(yù)測患者的給藥劑量。當(dāng)模型探索該方案時,在每個計劃的給藥間隔里,比如每月一次,會先決定其中的一個動作。首先,它可以啟動或停止一個劑量。如果確定給藥,會決定是否需要給足所有劑量,或者僅僅一部分劑量就足夠了。在每一個動作中,都會查驗(yàn)另一個臨床模型——通常用于預(yù)測腫瘤因治療而帶來的體積變化——來看看這個動作是否會縮小平均腫瘤直徑。如果是的話,這個模型會得到獎勵。
然而,研究人員還必須確保該模型不僅僅為了最大療效而給出最大的劑量。任何時候模型選擇給予全部劑量時,它就會受到懲罰,因此它會選擇更少、更小的劑量。 “如果我們想做的只是縮小平均腫瘤直徑,放任它采取任何它想采取的行動,它將不負(fù)責(zé)任地給藥“,Shah說,“相反,我們需要減少那些一味的縮小腫瘤體積而產(chǎn)生的有害行為?!?/p>
Shah說,這是在論文中首次描述的非傳統(tǒng)的RL模型,它將行動(劑量)的潛在負(fù)面后果與結(jié)果(腫瘤減小)進(jìn)行權(quán)衡。傳統(tǒng)的RL模型致力于單一結(jié)果,例如為了贏得一場比賽,將采取一切使結(jié)果最大化的行動。這個模型在每一個動作中都有靈活性,它可以找到一種劑量,這種劑量不一定能獨(dú)立的最大限度地減少腫瘤體積,但能在最大限度地減少腫瘤體積和低毒性之間達(dá)到完美的平衡。他補(bǔ)充說,這種技術(shù)在醫(yī)學(xué)和臨床試驗(yàn)中有多種應(yīng)用,在這些領(lǐng)域,治療方法應(yīng)該被規(guī)范,以防止有害的副作用產(chǎn)生。
最佳方案
研究人員在50名病人身上訓(xùn)練了這個模型,這些病人是從先前接受過傳統(tǒng)治療方法的膠質(zhì)母細(xì)胞瘤病人的大型數(shù)據(jù)庫中隨機(jī)挑選出來的。對于每個病人,該模型進(jìn)行了大約20,000次試錯測試。訓(xùn)練完成后,該模型學(xué)習(xí)最佳方案的參數(shù)。當(dāng)應(yīng)用于新的病人時,使用這些參數(shù),并根據(jù)研究人員要求的各種限制來制定新的方案。
研究人員隨后在50名新的模擬患者身上測試了該模型,并將結(jié)果與那些使用了TMZ和PVC的常規(guī)治療方案的病人進(jìn)行了比較。當(dāng)沒有劑量懲罰時,該模型設(shè)計了和人類專家?guī)缀跸嗤姆桨?。然而,考慮小劑量和大劑量的懲罰時,它大大降低了劑量的頻率和效力,同時也減少了腫瘤的大小。
研究人員還設(shè)計了一個模型來單獨(dú)治療每個病人,也可以對一組病人進(jìn)行治療,并取得了類似的結(jié)果。按照已有的方法整個患者群體都是使用了相同的給藥方案,但是腫瘤的大小、病史、基因譜和生物標(biāo)記物的差異都會影響患者的治療方案。Shah說,在傳統(tǒng)的臨床試驗(yàn)設(shè)計和其他治療中,這些變量沒有被考慮在內(nèi),這通常會導(dǎo)致在大范圍病人中對治療效果反應(yīng)不佳。
“我們不斷的優(yōu)化模型,來給不同的患者給出個性化的用藥方案。模型可以給這個人四分之一劑量,給那個人一半劑量,或許那個病人不需要服藥了。這是這項工作中最激動人心的部分,通過使用非正統(tǒng)的機(jī)器學(xué)習(xí)架構(gòu)進(jìn)行一人試驗(yàn)來產(chǎn)生精確的基于藥物的治療?!盨hahs說。
研究人員表示,該模型比傳統(tǒng)的靠眼睛觀察來給藥、觀察患者反應(yīng)然后做出相應(yīng)調(diào)整的方法有了重大飛躍。人不具備機(jī)器查看大量數(shù)據(jù)后所獲得的深度感知,所以人類來處理的的話,過程是緩慢、乏味且不精確的。讓計算機(jī)在數(shù)據(jù)中尋找模式(讓人來做的話會花費(fèi)大量時間來篩選),并使用這些模式來尋找最佳劑量?!?/p>
這項工作可能會引起美國食品和藥物管理局(FDA)的特別興趣,F(xiàn)DA正在尋找利用數(shù)據(jù)和人工智能開發(fā)健康技術(shù)的方法。法規(guī)仍然需要建立,但是毫無疑問,在短時間內(nèi),F(xiàn)DA會想出如何適當(dāng)?shù)貙彶檫@些“技術(shù)”,以便它們可以用于日常的臨床項目。"關(guān)于人工智能用于預(yù)測給藥劑量的其他報道,可以參見我們公眾號里以前的一篇推送,關(guān)于器官移植患者接受免疫制劑給藥劑量的報道>>在實(shí)現(xiàn)了檢查病、開藥方后,AI還將告訴你該如何吃藥—解讀最佳藥物組合和給藥計量
-
模型
+關(guān)注
關(guān)注
1文章
3115瀏覽量
48660 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8353瀏覽量
132315 -
強(qiáng)化學(xué)習(xí)
+關(guān)注
關(guān)注
4文章
265瀏覽量
11197
原文標(biāo)題:MIT研究人員通過機(jī)器學(xué)習(xí)算法幫助控制藥物劑量,陪伴病人與腦癌抗?fàn)?/p>
文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論