新型人臉識(shí)別軟件可助力罕見(jiàn)病診斷
將人工智能(AI)用于醫(yī)療輔助診斷早已經(jīng)不是什么新鮮事,僅AI醫(yī)學(xué)影像輔助診療一項(xiàng)就有非常多的應(yīng)用場(chǎng)景。然而,近日來(lái)自美國(guó)波士頓一家名為FDNA的數(shù)字醫(yī)療公司的研究人員大開(kāi)腦洞,提出用深度學(xué)習(xí)技術(shù)僅僅通過(guò)“看面相”,就能幫助醫(yī)生識(shí)別罕見(jiàn)基因疾病,并付諸實(shí)踐。他們的研究于1月7日登上了《自然—醫(yī)學(xué)》雜志,引起業(yè)內(nèi)關(guān)注。
中醫(yī)講究“望聞問(wèn)切”,其中望即有“望五官知五臟”“望痰辨病”等含義。如果AI能“學(xué)會(huì)”這本領(lǐng),相信很容易獲得人們青睞。不過(guò),深度學(xué)習(xí)是一項(xiàng)比較“吃”數(shù)據(jù)的技術(shù),而罕見(jiàn)病恰恰是臨床醫(yī)學(xué)上數(shù)據(jù)貧乏的領(lǐng)域。FDNA公司研究人員試圖依靠AI望五官辨識(shí)基因異常引發(fā)的罕見(jiàn)病,行得通嗎?
猜測(cè)準(zhǔn)確率達(dá)65%
發(fā)表在《自然—醫(yī)學(xué)》上的這篇文章提出了一種深度學(xué)習(xí)算法Deep Gestalt,它通過(guò)一款名為Face2Gene的App在智能終端發(fā)揮作用。據(jù)論文介紹,該App依靠深度學(xué)習(xí)算法和類腦神經(jīng)網(wǎng)絡(luò)來(lái)區(qū)分人類照片中與先天性和神經(jīng)發(fā)育障礙有關(guān)的獨(dú)特面部特征,然后利用從照片中推斷出的模式,定位出可能的診斷結(jié)果,并提供可能的綜合征遺傳病選項(xiàng)。
在實(shí)驗(yàn)開(kāi)始之前,F(xiàn)DNA公司首席技術(shù)官Yaron Gurovich帶領(lǐng)研究者們首先訓(xùn)練人工智能系統(tǒng)來(lái)區(qū)分“Cornelia de Lange綜合征”和“Angelman綜合征”,這兩種疾病患者都有區(qū)別于其他疾病的明顯面部特征;同時(shí),研究人員還訓(xùn)練該模型對(duì)“Noonan綜合征”的不同基因形式進(jìn)行分類。接下來(lái),研究者們給該算法模型輸入了涵蓋216種不同綜合征的 17000多張確診病例的圖像。
論文顯示,在對(duì)502 張不同圖像上的新面孔進(jìn)行測(cè)試時(shí),F(xiàn)ace2Gene的最佳診斷猜測(cè)準(zhǔn)確率達(dá)到65%。如果考慮多個(gè)預(yù)測(cè)結(jié)果,則Face2Gene 的top10準(zhǔn)確率可以達(dá)到約90%。
這個(gè)結(jié)果顯然有其一定的醫(yī)學(xué)意義。FDNA 首席醫(yī)療官、該論文的共同作者之一Karen Gripp使用該算法幫助診斷了一名4歲女童的Wiedemann Steiner 綜合征——這是由一種叫作 KMT2A 的基因變異引起的罕見(jiàn)疾病。Gripp 在研讀了相關(guān)病例報(bào)告之后得知,該疾病會(huì)導(dǎo)致兒童牙齒過(guò)早生長(zhǎng)。
由于年齡較小,這名小患者除了掉落大部分乳牙并長(zhǎng)出多個(gè)恒牙,很多典型的軀體癥狀尚未顯現(xiàn)。Gripp將該女童的照片上傳至Face2Gene后,軟件上出現(xiàn)了“Wiedemann Steiner 綜合征”;接著,Gripp 用靶向DNA 測(cè)試進(jìn)一步確診了這一結(jié)果。
雖然Gripp最終依靠的是DNA檢測(cè)進(jìn)行確診,但這名醫(yī)生認(rèn)為,該AI 方法可以幫助醫(yī)生縮小病癥范圍,節(jié)約了昂貴的多基因檢測(cè)費(fèi)用。
目前,F(xiàn)ace2Gene這款A(yù)pp處于開(kāi)放下載狀態(tài),全世界的醫(yī)療專家都可以免費(fèi)使用它。當(dāng)然,這也是FDNA公司想要獲取更多數(shù)據(jù)的策略,它需要更多數(shù)據(jù)來(lái)訓(xùn)練模型,使Face2Gene能夠駕輕就熟地幫助醫(yī)生辨別患者可能的基因遺傳病。
Yaron Gurovich介紹,現(xiàn)在該項(xiàng)目的數(shù)據(jù)庫(kù)中已有大約15萬(wàn)張照片。而隨著更多醫(yī)療專家將病人的照片上傳到該App,該項(xiàng)目的準(zhǔn)確率也得到略微提升。
質(zhì)疑:結(jié)論并不令人信服
并非沒(méi)有質(zhì)疑。在記者的采訪中,長(zhǎng)年致力于罕見(jiàn)病治療研究的中科院生物物理研究所研究員劉光慧告訴《中國(guó)科學(xué)報(bào)》,罕見(jiàn)病種類太多,AI難以達(dá)到100%識(shí)別。
“一般的罕見(jiàn)病都有特殊面容,比如兒童早衰癥及成人早衰癥患者,面容都很特殊,通過(guò)AI識(shí)別有一定道理,這是一個(gè)很好的方向?!眲⒐饣坜D(zhuǎn)而說(shuō)道,“但也有很多罕見(jiàn)病沒(méi)有特殊面容或面容特征不明顯,那么AI可能還不能做到100%識(shí)別。”
言外之意,如果在上述4歲女童案例中,換一種面容特征不那么明顯的罕見(jiàn)病來(lái)測(cè)試,F(xiàn)ace2Gene則可能會(huì)失靈;而如果Face2Gene一開(kāi)始就判斷錯(cuò)了,那么最終到底能不能省下多基因檢測(cè)費(fèi),則又另當(dāng)別論了。
更重要的是,該論文中的結(jié)論并不十分令人信服。
“502個(gè)圖的測(cè)試集,分了200個(gè)類,top10 的準(zhǔn)確率達(dá)到90%——假設(shè)數(shù)據(jù)平均,每個(gè)類僅兩張圖片可測(cè)試,這樣的結(jié)果我不認(rèn)為能得到‘識(shí)別遺傳病準(zhǔn)確率91%’的結(jié)論。”有質(zhì)疑者認(rèn)為,該論文結(jié)論稍顯草率。
更有專業(yè)人士指出,該結(jié)論有“過(guò)擬合”之嫌,在實(shí)測(cè)中不一定可以達(dá)到這樣的準(zhǔn)確率。通常,在一些統(tǒng)計(jì)中,為了得到一致假設(shè)而使假設(shè)變得過(guò)度嚴(yán)格,就會(huì)出現(xiàn)“過(guò)擬合”,而要避免過(guò)擬合的發(fā)生,通常需要使用增大數(shù)據(jù)量和測(cè)試樣本集的方法對(duì)分類樣本進(jìn)行評(píng)價(jià)。
對(duì)此,中科院自動(dòng)化所研究員、生物識(shí)別與安全技術(shù)研究中心主任李子青(注:該文引用了李子青團(tuán)隊(duì)的一篇深度學(xué)習(xí)研究論文)對(duì)《中國(guó)科學(xué)報(bào)》記者談了他的看法。他指出,這篇文章提供了三個(gè)實(shí)驗(yàn)結(jié)果:其中兩個(gè)實(shí)驗(yàn)是從已確診綜合征的人臉圖像中,識(shí)別出一種特定的綜合征;另一個(gè)是區(qū)分Noonan綜合征的兩個(gè)子類型。可喜的是,三個(gè)都超過(guò)了門診專家的準(zhǔn)確性。但這篇文章所解決的問(wèn)題,是從已確診的人臉圖像進(jìn)一步分類或區(qū)分子型;從深度學(xué)習(xí)和模式識(shí)別角度來(lái)看,都不算難。
李子青認(rèn)為,真正有挑戰(zhàn)的是綜合征篩查,即從普通人群發(fā)現(xiàn)有綜合征的人,并對(duì)大規(guī)模人群診斷達(dá)到一定的準(zhǔn)確度。這個(gè)問(wèn)題更加有臨床診斷意義,并且技術(shù)上比該文所處理的問(wèn)題的難度要大很多。
對(duì)于深度學(xué)習(xí)算法而言,李子青認(rèn)為“只要有數(shù)據(jù),總可以訓(xùn)練出一個(gè)東西”,而至于效果如何,首先是取決于算法——在合理算法基礎(chǔ)上,就是拼數(shù)據(jù)和計(jì)算資源。至于如何判斷實(shí)效?則要看其推廣性及泛化性。他表示認(rèn)同記者的這一觀點(diǎn):罕見(jiàn)病病例少,數(shù)據(jù)難獲取,模型的推廣性不容易保證,這種方法的大眾普查中應(yīng)用還不成熟。
技術(shù)風(fēng)險(xiǎn)仍存
一般而言,只有訓(xùn)練數(shù)據(jù)集夠好,算法才足夠好用。從這個(gè)評(píng)價(jià)尺度上,F(xiàn)ace2Gene的技術(shù)存在風(fēng)險(xiǎn)。對(duì)此,牛津大學(xué)計(jì)算生物學(xué)家Christoffer Nellker很是認(rèn)同。他認(rèn)為,尤其是涉及到那些全球患者人數(shù)極少的罕見(jiàn)疾病時(shí),數(shù)據(jù)集的封閉化、商業(yè)化“會(huì)威脅到這項(xiàng)技術(shù)的主要潛在優(yōu)勢(shì)”。
此外,訓(xùn)練數(shù)據(jù)過(guò)于集中導(dǎo)致的種族偏見(jiàn)(大部分為白人)也是一大問(wèn)題。2017年的一份兒童智力障礙研究表明,F(xiàn)ace2Gene 對(duì)唐氏綜合征的識(shí)別率在比利時(shí)白人小孩中為80%,而在剛果黑人小孩中僅為37%。對(duì)此,Yaron Gurovich意識(shí)到“這個(gè)問(wèn)題需要解決”,但他也認(rèn)為隨著訓(xùn)練數(shù)據(jù)集變得更加多樣化,算法對(duì)非洲面孔的識(shí)別準(zhǔn)確率會(huì)隨之提升,“偏見(jiàn)會(huì)越來(lái)越少”。
除了數(shù)據(jù)量的問(wèn)題外,數(shù)據(jù)維度也非常重要。匯醫(yī)慧影創(chuàng)始人兼CEO柴象飛在接受《中國(guó)科學(xué)報(bào)》記者采訪時(shí)說(shuō),有時(shí)更多維度的數(shù)據(jù)比簡(jiǎn)單更大的數(shù)據(jù)更能幫助算法模型更精準(zhǔn)地預(yù)測(cè)結(jié)果。
不過(guò),科大訊飛智慧醫(yī)療事業(yè)部總經(jīng)理陶曉東向《中國(guó)科學(xué)報(bào)》提出了類似算法在臨床上常被忽略掉的另一個(gè)技術(shù)風(fēng)險(xiǎn),“這一波人工智能過(guò)度依賴于數(shù)據(jù),忽略了很多數(shù)據(jù)之外的信息”。
“深度學(xué)習(xí)解決問(wèn)題的基本思路,到目前為止還都沒(méi)有什么太大的突破?!碧諘詵|對(duì)記者說(shuō),在醫(yī)療領(lǐng)域里尤其如此,“你不可能像ImageNet那樣獲得幾百萬(wàn)、上千萬(wàn)的訓(xùn)練數(shù)據(jù)”。因此,最基礎(chǔ)的醫(yī)學(xué)理論,應(yīng)該被考慮在內(nèi)。
“連基本的解剖信息都沒(méi)有用在深度學(xué)習(xí)的框架里?!碧諘詵|說(shuō),這是值得目前如火如荼的“AI+醫(yī)療”深思的。
柴象飛對(duì)此也表示贊同,他對(duì)記者說(shuō),一些基于經(jīng)驗(yàn)或常識(shí)的推理對(duì)于模型更精準(zhǔn)地接近真相也非常重要,這或許對(duì)于數(shù)據(jù)樣本偏少的罕見(jiàn)病模型意義更大。
-
醫(yī)療
+關(guān)注
關(guān)注
8文章
1790瀏覽量
58627 -
人工智能
+關(guān)注
關(guān)注
1790文章
46670瀏覽量
237111 -
人臉識(shí)別
+關(guān)注
關(guān)注
76文章
4002瀏覽量
81678
原文標(biāo)題:觀五官知罕見(jiàn)病,AI“望診”靠譜嗎
文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論