昨天,備受關(guān)注的全球首場(chǎng)神經(jīng)影像人機(jī)大戰(zhàn)在國(guó)家會(huì)議中心舉行,在腦腫瘤和腦血管影像判讀比賽中,醫(yī)療AI最終以高出20%的準(zhǔn)確率戰(zhàn)勝25名人類(lèi)醫(yī)生。如果這款A(yù)I產(chǎn)品投入實(shí)用,核磁檢查的出片速度將從現(xiàn)在的幾天縮短至幾分鐘。
2018年6月29日-30日,一場(chǎng)AI vs人類(lèi)醫(yī)生的“讀片大戰(zhàn)”在北京國(guó)家會(huì)議中心展開(kāi)。
這場(chǎng)比賽由國(guó)家神經(jīng)系統(tǒng)疾病臨床醫(yī)學(xué)研究中心、首都醫(yī)科大學(xué)人腦保護(hù)高精尖創(chuàng)新中心和中國(guó)卒中學(xué)會(huì)聯(lián)合主辦,是全球首場(chǎng)神經(jīng)影像人工智能人機(jī)大賽。
參加比賽的雙方,AI這邊是一個(gè)名叫“BioMind 天醫(yī)智”的系統(tǒng),由國(guó)家神經(jīng)系統(tǒng)疾病臨床醫(yī)學(xué)研究中心與首都醫(yī)科大學(xué)人腦保護(hù)高精尖創(chuàng)新中心、北京安德醫(yī)智科技有限公司共同研發(fā),號(hào)稱全球首款CT、MRI神經(jīng)影像人工智能輔助診斷產(chǎn)品。
人類(lèi)這邊,則由25名全球神經(jīng)影像領(lǐng)域頂尖專(zhuān)家、學(xué)者和優(yōu)秀臨床醫(yī)生組成,他們中有擁有幾十年臨床工作積累的影像學(xué)大咖,也有有志于AI系統(tǒng)研究的青年科技人才。經(jīng)過(guò)前期招募、預(yù)賽及定向邀請(qǐng)選拔而出。
經(jīng)過(guò)緊張激烈的角逐,在兩輪比賽中,BioMind分別以87%、83%的準(zhǔn)確率,戰(zhàn)勝醫(yī)生戰(zhàn)隊(duì)66%、63%的準(zhǔn)確率。值得一提的是,兩輪比賽BioMind均僅用15分鐘左右時(shí)間便答完所有題目,而醫(yī)生戰(zhàn)隊(duì)幾乎答到最后一秒。
醫(yī)生隊(duì)伍緊張討論
A組比賽結(jié)果
神經(jīng)影像人工智能人機(jī)大賽賽制介紹
據(jù)了解,大賽將分A、B組進(jìn)行,內(nèi)容包括:顱內(nèi)腫瘤CT、MRI(核磁)影像判讀;腦血管疾病CT、MRI影像判讀及血腫預(yù)測(cè);腦血管?。íM窄、微出血、梗死、腦白質(zhì)病變、腔隙灶、血腫)病灶標(biāo)識(shí),出血體積及梗死體積測(cè)量。
A組比賽中,有15名人類(lèi)醫(yī)生,包括此前全國(guó)線上預(yù)賽產(chǎn)生的優(yōu)勝者6名、國(guó)內(nèi)神經(jīng)疾病排名前列的專(zhuān)家7名,以及國(guó)外知名醫(yī)院專(zhuān)家2名。本組試題共225題,人類(lèi)選手每人回答15題,AI 回答225題,最終以人類(lèi)選手整體成績(jī)與AI對(duì)比。
B組比賽由10名人類(lèi)神經(jīng)影像領(lǐng)域“大咖”(國(guó)內(nèi)神經(jīng)疾病排名前列醫(yī)院專(zhuān)家8名+知名醫(yī)院的專(zhuān)家2名)和AI比賽。其中,每名人類(lèi)選手都與AI一樣,完成30道題的挑戰(zhàn),最終將以人類(lèi)選手整體成績(jī) VS AI成績(jī)。
A組試題為首都醫(yī)科大學(xué)附屬北京天壇醫(yī)院神經(jīng)影像學(xué)中心主任高培毅教授從天壇醫(yī)院腦腫瘤病例庫(kù)中隨機(jī)挑選,B組為首都醫(yī)科大學(xué)附屬北京天壇醫(yī)院常務(wù)副院長(zhǎng)王擁軍教授從國(guó)家神經(jīng)系統(tǒng)疾病臨床醫(yī)學(xué)研究中心腦出血病例庫(kù)隨機(jī)挑選,兩組試題均非AI訓(xùn)練試題,為保證試題的保密性,北京市長(zhǎng)安公證處的公證人員為試題挑選、封存進(jìn)行了公證。
賽前,公證人員正式為試題解封,并交付本次決賽評(píng)審專(zhuān)家,進(jìn)行最終題目抽取。據(jù)了解,由于本次比賽使用的病例均為首都醫(yī)科大學(xué)附屬北京天壇醫(yī)院病例庫(kù)中回顧性病例,因此,最終評(píng)判結(jié)果以醫(yī)院最終病理結(jié)果為準(zhǔn)。為保證準(zhǔn)確性,選手開(kāi)始答題后,評(píng)委對(duì)試題結(jié)果進(jìn)行二次審核。
最終,在A組比賽中:225例判讀,AI用15分鐘準(zhǔn)確率達(dá)87%,15位醫(yī)生用30分鐘準(zhǔn)確率達(dá)66%;B組比賽中,10名頂尖醫(yī)生對(duì)戰(zhàn)AI,同樣完成30道腦血腫擴(kuò)大預(yù)測(cè)試題,AI以83% VS 63% 準(zhǔn)確率勝出。
獲勝醫(yī)療AI:每個(gè)腫瘤背后都學(xué)習(xí)了1000個(gè)病例,基本掌握50種顱腦腫瘤
參加比賽的AI——BioMind天醫(yī)智,是由國(guó)家神經(jīng)體系疾病臨床醫(yī)學(xué)研討中心和首都醫(yī)科大學(xué)人腦維護(hù)高精尖立異中心等一起研制的全球首款CT、MRI神經(jīng)印象人工智能輔佐確診產(chǎn)品。
在參加比賽前,它已經(jīng)跟著北京天壇醫(yī)院神經(jīng)影像學(xué)中心主任高培毅學(xué)習(xí)了半年。
對(duì)于本次比賽AI學(xué)生取得的成績(jī),高培毅并不意外,他介紹說(shuō),通過(guò)對(duì)北京天壇醫(yī)院近十年來(lái)接診的數(shù)萬(wàn)余神經(jīng)系統(tǒng)相關(guān)疾病病例影像的系統(tǒng)學(xué)習(xí),“BioMind天醫(yī)智”在腦膜瘤、膠質(zhì)瘤等常見(jiàn)病領(lǐng)域的磁共振影像診斷能力相當(dāng)于一個(gè)高級(jí)職稱醫(yī)師級(jí)別的水平,實(shí)力不容小覷。
“每種腫瘤背后,它都學(xué)習(xí)了1000個(gè)病例,目前基本上已經(jīng)掌握了50種顱腦腫瘤,這是任何一名醫(yī)生都難以實(shí)現(xiàn)的。”
北京天壇醫(yī)院,作業(yè)人員正在調(diào)試“BioMindTM”天醫(yī)智
在近期“人機(jī)大戰(zhàn)”決賽備戰(zhàn)中,高培毅還為提高AI體系應(yīng)戰(zhàn)表現(xiàn)打開(kāi)集訓(xùn)。300多個(gè)病例,陪練醫(yī)師們需10小時(shí)以上時(shí)刻才做完結(jié),AI只需不到半小時(shí)。除了學(xué)習(xí)速度外,它的安穩(wěn)性也顯著逾越人類(lèi)?!安恢览?,也不受外界攪擾要素的影響。不像醫(yī)師會(huì)被心情、狀況、時(shí)刻地址等外界要素打擾,然后影響描繪準(zhǔn)確性。它永久堅(jiān)持鎮(zhèn)定,水平安穩(wěn)?!?/p>
不過(guò),他對(duì)自己AI學(xué)生的表現(xiàn)還不太滿意?!皩?duì)它的比賽成績(jī)不夠滿意,我認(rèn)為它的準(zhǔn)確率應(yīng)該在90%以上,”高培毅說(shuō),接下來(lái)他們將對(duì)AI的“丟分”原因進(jìn)行研究分析。
戰(zhàn)勝25位醫(yī)生≠戰(zhàn)勝人類(lèi)醫(yī)生,AI和專(zhuān)業(yè)醫(yī)師仍然存在差距
關(guān)于這次比賽結(jié)果,中國(guó)科學(xué)院院士、第三軍醫(yī)大學(xué)病理學(xué)研究所所長(zhǎng)、西南醫(yī)院病理科主任卞修武表示,“我希望大家不要產(chǎn)生對(duì)立性思維,因?yàn)闊o(wú)論醫(yī)生勝還是人工智能勝,對(duì)于醫(yī)療界和廣大患者都是一件大好事。”卞修武認(rèn)為,人工智能更聚焦于某一細(xì)分領(lǐng)域,但醫(yī)生有其系統(tǒng)性的學(xué)習(xí),所以人工智能如果能作為一個(gè)幫手幫助醫(yī)生工作,將會(huì)是醫(yī)生的一大福利。
美國(guó)卡內(nèi)基梅隆大學(xué)(CMU)計(jì)算機(jī)科學(xué)學(xué)院副教授馬堅(jiān)告訴新智元,AI對(duì)一些特定的問(wèn)題在特定的時(shí)間內(nèi)比人做得更好,這類(lèi)事情之前也發(fā)生過(guò),這可能是又一個(gè)有意思的案例。但是,通過(guò) AI 和幾個(gè)醫(yī)生的比賽的結(jié)果,就說(shuō)AI戰(zhàn)勝某個(gè)整個(gè)的職業(yè)領(lǐng)域肯定不妥。
馬堅(jiān)表示,目前AI對(duì)單一數(shù)據(jù)源的分類(lèi)可能做的不錯(cuò),但是如何從復(fù)雜的多模態(tài)數(shù)據(jù)中有效綜合作出診斷和治療意見(jiàn),AI可能還有非常多問(wèn)題要解決,而且,這還涉及到更多社會(huì)學(xué)意義上的問(wèn)題,譬如AI和醫(yī)生以及病人互相間信任、溝通的問(wèn)題。
BioMind的老師高培毅也表示,“覺(jué)得它容易就能代替醫(yī)師的人,把醫(yī)師的作業(yè)看得太簡(jiǎn)略了?!盇I在大數(shù)據(jù)深度學(xué)習(xí)方面確實(shí)具有巨大的優(yōu)勢(shì),不過(guò)在實(shí)踐確診中,放射科醫(yī)師仍具有很強(qiáng)的不行代替性。
“除了影像查看,一個(gè)合格的放射科醫(yī)師還需求看化驗(yàn)單、體檢單,問(wèn)詢宗族史、個(gè)人病史,了解患者從前接受過(guò)的藥物、醫(yī)治、反響。歸納以上狀況后,才敢做出確診?!盇I或許能夠代替“看片匠”的任務(wù),但不可能成為一個(gè)真實(shí)的醫(yī)師。
王擁軍也以為,人工智能使用能夠?qū)⑨t(yī)師們從單調(diào)、重復(fù)的作業(yè)中解放出來(lái),然后騰出更多時(shí)刻進(jìn)行開(kāi)發(fā)性作業(yè)。
此外,現(xiàn)在AI在神經(jīng)體系印象確診方面,仍徹底依賴于數(shù)據(jù)真實(shí)性和質(zhì)量的支撐,在缺少大數(shù)據(jù)支撐的疑難病、稀有病確診范疇,AI和專(zhuān)業(yè)醫(yī)師之間仍存在距離。
使用AI輔助,核磁檢查結(jié)果有望縮短至幾分鐘
王擁軍表示,這次向全球招募神經(jīng)科醫(yī)師打開(kāi)“人機(jī)大賽”,意圖主要是為了驗(yàn)證天醫(yī)智確診的準(zhǔn)確性。
目前,全國(guó)影像科人才資源地域性分配不均衡問(wèn)題十分突出。以腦腫瘤為例,北京天壇醫(yī)院每年手術(shù)量約為一萬(wàn)例,而在大部分底層醫(yī)院,這個(gè)數(shù)字可能只停留在兩位數(shù)。大多數(shù)患者即便在底層做了查看,仍是會(huì)挑選帶著片子到三甲大醫(yī)院來(lái)看,有的在“上流”的過(guò)程中重復(fù)屢次拍片,形成資源糟蹋。假如底層醫(yī)院能使用AI技能為確診賦能,讓底層醫(yī)師在讀片確診上與大醫(yī)院具有平等水準(zhǔn),提高醫(yī)治功率,就能削減患者不必要的醫(yī)治環(huán)節(jié)和經(jīng)濟(jì)損失,也能減輕大醫(yī)院壓力。
此外,在天壇醫(yī)院,天醫(yī)智有用發(fā)掘信息與疾病的潛在聯(lián)絡(luò)的才干還可輔佐醫(yī)師對(duì)疾病做出更為精準(zhǔn)的猜測(cè),如猜測(cè)患者血腫后是否會(huì)大出血的準(zhǔn)確度,可從人為判別的60%提高至90%,輔佐醫(yī)療團(tuán)隊(duì)提早為患者可能遇到的風(fēng)險(xiǎn)供給處理方案。
這次比賽,醫(yī)療AI表現(xiàn)出了速度快、準(zhǔn)確率高的結(jié)果,令人贊嘆的同時(shí),更多人關(guān)心的是它未來(lái)將給神經(jīng)醫(yī)學(xué)帶來(lái)哪些改變——人腦疾病真的可以實(shí)現(xiàn)電腦診斷嗎?
高培毅介紹說(shuō),一個(gè)CI病例背后,可能是近千張片子,天壇醫(yī)院一個(gè)影像大夫每天讀片診斷的時(shí)間甚至達(dá)到18個(gè)小時(shí)。按照“BioMind天醫(yī)智”目前的速度,一個(gè)大夫一天的工作量,它只需要400-500秒,也就是不到10分鐘的時(shí)間。
“現(xiàn)在患者到醫(yī)院做核磁,結(jié)果都要等第二天以后才能拿到。如果讓AI來(lái)做,那么核磁結(jié)果基本上立等可取,幾分鐘就行”。
北京天壇醫(yī)院院長(zhǎng)王擁軍介紹說(shuō),目前已經(jīng)向國(guó)家藥監(jiān)局提交申請(qǐng),希望在臨床中應(yīng)用這款A(yù)I產(chǎn)品,提高基層醫(yī)院影像診斷準(zhǔn)確率,同時(shí)也提高影像判讀速度,為患者節(jié)約時(shí)間。
不必?fù)?dān)心機(jī)器在臨床技術(shù)上超越人類(lèi)醫(yī)生
北京大數(shù)醫(yī)達(dá)有限公司創(chuàng)始人、CMU博士鄧侃在了解到這項(xiàng)比賽后,給出了如下的點(diǎn)評(píng):
以往司機(jī)必須具備三種能力,第一種是規(guī)劃路徑的導(dǎo)航能力,熟悉地圖,能夠規(guī)劃從起點(diǎn)到終點(diǎn)的合理路徑。第二種是駕駛汽車(chē)的操作能力,包括踩油門(mén)、踩剎車(chē)、轉(zhuǎn)方向盤(pán)等等。第三種是對(duì)交通實(shí)況,迅速做出判斷的能力,譬如避讓行人,如何處理其它車(chē)輛超車(chē)。
有了導(dǎo)航軟件以后,司機(jī)們不再需要熟記地圖,不再需要第一種能力。隨著無(wú)人駕駛技術(shù)的發(fā)展,不久的將來(lái),司機(jī)們也不再需要第二種和第三種能力。
隨著人工智能醫(yī)療技術(shù)的發(fā)展,人類(lèi)醫(yī)生也將不再像以往那樣,依賴臨床經(jīng)驗(yàn)的個(gè)人積累,而是越來(lái)越依賴電腦的提示。
讀片是醫(yī)療過(guò)程中,診斷的一個(gè)環(huán)節(jié)。輸入是檢查設(shè)備生成的影像,輸出是文字版的檢查報(bào)告,檢查報(bào)告中包括兩部分,一個(gè)是檢查所見(jiàn),列出檢查影像中需要關(guān)注的特征標(biāo)志物。另一個(gè)是檢查結(jié)果,根據(jù)檢查特征標(biāo)志物,判斷患者罹患的疾病。
昨天北京舉辦了一場(chǎng)AI vs人類(lèi)神經(jīng)科醫(yī)生的讀片大賽,在A組比賽中,225例判讀,AI 系統(tǒng)用 15分鐘完成讀片,準(zhǔn)確率達(dá)87%,15位醫(yī)生用30分鐘準(zhǔn)確率達(dá)66%;B組比賽中,10名頂尖醫(yī)生對(duì)戰(zhàn)AI,同樣完成30道腦血腫擴(kuò)大預(yù)測(cè)試題,AI 系統(tǒng)以83% vs 人類(lèi)醫(yī)生 63% 準(zhǔn)確率勝出。
昨天的比賽,人工智能系統(tǒng)以 20% 的顯著優(yōu)勢(shì),戰(zhàn)勝人類(lèi)醫(yī)生。這說(shuō)明,在某幾類(lèi)疾病的讀片中,人工智能確實(shí)比人類(lèi)智能更有優(yōu)勢(shì)。而且,不久的將來(lái),在其它疾病的讀片中,機(jī)器也勢(shì)必超越人類(lèi)。
整個(gè)診斷過(guò)程,包括問(wèn)診、體檢、化驗(yàn)、檢查。讀片只是檢查這個(gè)單個(gè)環(huán)節(jié)。不久的將來(lái),機(jī)器勢(shì)必在診斷和治療全過(guò)程,而不僅僅是讀片單個(gè)環(huán)節(jié),超越人類(lèi)。人工智能醫(yī)療,下一步的發(fā)力點(diǎn),一定是診斷和治療的全過(guò)程的整合,把問(wèn)診、體檢、化驗(yàn)、檢查全部串連起來(lái)。
人類(lèi)醫(yī)生會(huì)失業(yè)嗎?醫(yī)療界有句名言,“To Cure Sometimes, To Relieve Often, To Comfort Always,有時(shí)是治愈;常常是幫助;總是去安慰”。也許機(jī)器在治愈和幫助方面,確實(shí)比人類(lèi)醫(yī)生更精準(zhǔn),但是患者需要關(guān)懷,需要安慰,醫(yī)生提供的“話療”,哪怕是無(wú)聲的一個(gè)同情的眼神,機(jī)器能難替代人類(lèi)醫(yī)生。
不用擔(dān)心機(jī)器在臨床技術(shù)方面超越人類(lèi),就像不用擔(dān)心導(dǎo)航軟件和無(wú)人駕駛技術(shù),超越人類(lèi)司機(jī)一樣。歷史經(jīng)驗(yàn)表明,機(jī)器取代人類(lèi),完成繁瑣的工作,讓人類(lèi)騰出手去,完成更精巧的工作。全球人口發(fā)展的歷史也表明,隨著機(jī)器的普及和進(jìn)步,人類(lèi)人口非但沒(méi)有下降,反而不斷增加。
-
神經(jīng)系統(tǒng)
+關(guān)注
關(guān)注
0文章
82瀏覽量
12979 -
AI
+關(guān)注
關(guān)注
87文章
29862瀏覽量
268154 -
人工智能
+關(guān)注
關(guān)注
1791文章
46698瀏覽量
237190
原文標(biāo)題:全球首場(chǎng)神經(jīng)影像人機(jī)對(duì)決:AI戰(zhàn)勝25位醫(yī)界“最強(qiáng)大腦”!
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論