寫在前面
前些天某當(dāng)紅流量明星吸煙的消息在網(wǎng)上引起熱議,談起青少年吸煙尤其是在公共場所吸煙,持不贊成甚至批評態(tài)度的人占了絕大多數(shù)。吸煙以及所產(chǎn)生的二手煙會對人體的呼吸系統(tǒng)造成傷害,是肺癌的重要致病因素之一。
據(jù)統(tǒng)計(jì)主動/被動吸煙者肺癌的發(fā)病率比普通人高20~25倍,所以對大家來說定期對肺進(jìn)行深度地檢查顯得特別的重要。借著這個(gè)機(jī)會,在這里我們和大家分享一些業(yè)余期間在肺部疾病的AI診斷上的實(shí)踐和探索,希望讓大家能夠了解AI在肺部診斷上的技術(shù)應(yīng)用,也能夠?qū)ξ鼰?二手煙說再見,更好地珍惜自己的身體。
為什么要用AI來診斷?
肺癌在中國乃至全球范圍內(nèi),都是發(fā)病率及死亡率最高的惡性腫瘤,其早期的表現(xiàn)形式是直徑不超過30mm的肺內(nèi)圓形或不規(guī)則形結(jié)節(jié)。肺結(jié)節(jié)檢測當(dāng)前主要通過電子計(jì)算機(jī)斷層掃描(CT)檢查來實(shí)現(xiàn),低劑量的CT已經(jīng)成為當(dāng)前主流的肺結(jié)節(jié)檢查工具。
然而通過醫(yī)生來診斷肺結(jié)節(jié)當(dāng)前存在兩方面的困難:1)CT圖像是分辨率高的三維斷層掃描成像,數(shù)據(jù)量非常大,每位檢查者都會生成上百張圖像序列,導(dǎo)致了醫(yī)生診斷速度慢;2)肺部結(jié)節(jié)大部分尺寸很小肉眼不易發(fā)現(xiàn),而不同醫(yī)生的經(jīng)驗(yàn)存在差異,導(dǎo)致檢測結(jié)果容易出現(xiàn)偏差。所以引入AI技術(shù)輔助醫(yī)生進(jìn)行肺結(jié)節(jié)的定位和識別從而提升對肺結(jié)節(jié)的檢測率顯得尤為重要。
AI如何來診斷?
對肺結(jié)節(jié)的診斷屬于一種特殊的分類/檢測任務(wù),基于深度學(xué)習(xí)的圖像分類和目標(biāo)檢測算法被廣泛地應(yīng)用在肺結(jié)節(jié)檢測中。當(dāng)前業(yè)界比較常用的是采用預(yù)檢測+精檢測的診斷方式來進(jìn)行肺結(jié)節(jié)的檢測。
在預(yù)檢測過程中,一般使用深度卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)肺結(jié)節(jié)的初步定位,在實(shí)際應(yīng)用中,我們常用U-net網(wǎng)絡(luò)來實(shí)現(xiàn)肺結(jié)節(jié)的分割,或者使用Faster R-CNN網(wǎng)絡(luò)來實(shí)現(xiàn)肺結(jié)節(jié)的檢測。無論是分割網(wǎng)絡(luò)還是檢測網(wǎng)絡(luò),我們最終的目的都是為了獲取候選的肺結(jié)節(jié)區(qū)域,從而產(chǎn)生高召回率候選結(jié)節(jié)池,盡可能地降低肺結(jié)節(jié)的漏檢率。
在精檢測過程中,一般用深度卷積神經(jīng)網(wǎng)絡(luò)對預(yù)檢測得到的候選結(jié)節(jié)區(qū)域進(jìn)行分類以區(qū)分肺結(jié)節(jié)的真假性,比如使用ResNet和基于Inception的一系列分類網(wǎng)絡(luò),在這一步中我們希望能夠通過深度學(xué)習(xí)模型更精確地識別肺結(jié)節(jié),從而降低誤判率。
在實(shí)際的肺部CT檢查中,每位檢查者采集的是肺部的斷面或立體圖像,往往通常是連續(xù)的上百張圖像序列,這些圖像提供了肺部的完整三維信息。在醫(yī)生的診斷過程中,往往會同時(shí)參考多幅CT圖像來綜合判斷,一組典型的肺部CT圖像如上圖所示。
所以為了構(gòu)建連續(xù)圖像序列之間的上下文信息,模擬醫(yī)生的診斷方式,常常會將基于2D圖像理解的網(wǎng)絡(luò)擴(kuò)展為基于3D圖像理解的網(wǎng)絡(luò)。即先利用3D U-net來實(shí)現(xiàn)連續(xù)圖像序列的分割,或者利用3D Fast R-CNN來實(shí)現(xiàn)連續(xù)圖像序列的檢測,再利用3D CNN來完成最終的結(jié)節(jié)分類。
讓AI診斷得更準(zhǔn)更快
上一節(jié)我們介紹了常用的肺結(jié)節(jié)AI檢測方式,但是現(xiàn)有的方法仍然有三個(gè)問題擺在我們面前:
1)預(yù)檢測+精檢測的兩步建模方式在檢測速度上不能讓人滿意,同時(shí)結(jié)構(gòu)也不夠優(yōu)雅,如何能夠設(shè)計(jì)出結(jié)構(gòu)優(yōu)雅速度理想的模型?
2)連續(xù)的肺部CT圖像序列,圖像之間的關(guān)系信息對最終結(jié)果的診斷非常重要,如何能夠更好地對這些圖像之間的關(guān)系進(jìn)行建模?
3)對單獨(dú)的一張CT圖像,因?yàn)榻Y(jié)節(jié)所占的位置往往都很小,如何能夠讓模型將更多的注意力集中在這些目標(biāo)上,提升檢測的精度?
針對上述三個(gè)問題,我們分別做了一些探索。對于第一個(gè)問題,我們采用3D SSD檢測框架來取代以往的兩步建模方式,直接通過一個(gè)深度網(wǎng)絡(luò)輸出結(jié)節(jié)的位置和類別。SSD是一種單階段的目標(biāo)檢測算法,通過一個(gè)網(wǎng)絡(luò)中直接回歸出目標(biāo)的類別和位置,因此檢測速度很快。
SSD利用了Faster R-CNN的候選框概念,同時(shí)在檢測的過程中,使用了不同卷積層上對應(yīng)的候選框來檢測不同大小的目標(biāo)。由于肺結(jié)節(jié)的尺寸很小,所以我們進(jìn)一步加入了特征金字塔網(wǎng)絡(luò)結(jié)構(gòu)(FPN),促進(jìn)了SSD的不同卷積層之間的信息傳遞,從而保證極小結(jié)節(jié)的檢測效果。
對于第二個(gè)問題,我們在網(wǎng)絡(luò)結(jié)構(gòu)中引入群卷積,考慮各個(gè)特征通道之間的關(guān)系,讓模型自主地去學(xué)習(xí)價(jià)值較高的特征圖,同時(shí)群卷積的使用也大幅提升了模型的性能。對于第三個(gè)問題,我們引入自然語言處理中流行的注意力機(jī)制,對于通過群卷積得到的貢獻(xiàn)程度較高的特征圖,引導(dǎo)網(wǎng)絡(luò)去關(guān)注圖中的一些關(guān)鍵信息,弱化一些造成干擾的背景因素。群卷積和注意力機(jī)制模塊的具體計(jì)算流程如上圖所示。
最后,我們把這三個(gè)問題的解決方案融合在一起,提出了一種基于群卷積和注意力機(jī)制的SSD檢測模型 Group-Attention SSD(GA-SSD),完整的檢測框架如上圖所示。我們的方法在漏檢率和誤檢率上都勝過當(dāng)前的方法。我們可視化了部分肺結(jié)節(jié)檢測的結(jié)果,可以看出對于一些很小的結(jié)節(jié),我們的模型依然可以檢測得很好。
寫在最后
不管是主動吸煙和被動吸二手煙都會讓我們的肺受到傷害,利用AI來實(shí)現(xiàn)肺結(jié)節(jié)的檢測可以較好地提升肺部檢查的準(zhǔn)確性。通過這篇文章我們介紹了肺結(jié)節(jié)AI檢測的常用技術(shù),也進(jìn)一步分享了我們在AI檢測肺結(jié)節(jié)上的一些研究成果,更多的細(xì)節(jié)大家可以在arXiv上搜索《Group-attention single-shot detector (GA-SSD): Finding pulmonary nodules in large-scale CT images》進(jìn)行查看。最后祝大家都有一個(gè)健康的身體,這樣才能更好地感受生活的美好。
-
AI
+關(guān)注
關(guān)注
87文章
29806瀏覽量
268103 -
圖像分類
+關(guān)注
關(guān)注
0文章
89瀏覽量
11897 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5463瀏覽量
120890
原文標(biāo)題:一根煙上熱搜,先讓AI看看你的肺
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論