發(fā)布日期:2017-10-31
癌癥,猶如黑暗中的魔鬼,帶給人們恐懼與絕望。而肺癌,在我國(guó)作為發(fā)病率、死亡率最高的一類癌癥,傷害著無(wú)數(shù)家庭。在我國(guó)每年都有近60萬(wàn)人死于肺癌。然而,癌癥的死亡率與首次發(fā)現(xiàn)癌癥的時(shí)期緊密相關(guān),早期肺結(jié)節(jié)篩查可以為無(wú)數(shù)人免去痛苦與折磨。上海交通大學(xué)人工智能實(shí)驗(yàn)室徐奕教授、倪冰冰教授、楊小康教授、朱禹萌同學(xué)等人與點(diǎn)內(nèi)科技合作,利用深度學(xué)習(xí)搭建的肺結(jié)節(jié)自動(dòng)定位篩查系統(tǒng),能夠有效檢測(cè)肺 CT 影像中包含微小結(jié)節(jié)、磨玻璃等各類結(jié)節(jié),并降低假陽(yáng)性誤診的發(fā)生,實(shí)現(xiàn)「早發(fā)現(xiàn),早診斷,早治療,早痊愈」的愿望。該算法獲得了天池大數(shù)據(jù)比賽的第一名,這個(gè)比賽吸引了全國(guó)兩千多支參賽團(tuán)隊(duì),總獎(jiǎng)池高達(dá)百萬(wàn),面向全社會(huì)各大醫(yī)院、高校、公司、研究所參加。
團(tuán)隊(duì)利用計(jì)算機(jī)視覺領(lǐng)域卷積神經(jīng)網(wǎng)絡(luò)技術(shù)來(lái)解決肺結(jié)節(jié)檢測(cè)問(wèn)題,并在多個(gè)層面上進(jìn)行創(chuàng)新。1)結(jié)合物體檢測(cè)與分割算法提取候選結(jié)節(jié),產(chǎn)生高召回率候選結(jié)節(jié)池。2)使用假陽(yáng)性衰減網(wǎng)絡(luò),并采取多尺度集成學(xué)習(xí)的網(wǎng)絡(luò)模型提高檢測(cè)精度,衰減假陽(yáng)性比例。3)在數(shù)據(jù)的處理上,采取生成對(duì)抗網(wǎng)絡(luò)進(jìn)行了數(shù)據(jù)增廣,提高了訓(xùn)練的有效性。
算法框架如圖
數(shù)據(jù)預(yù)處理
通過(guò)旋轉(zhuǎn)平移等幾何變換針對(duì)有限數(shù)量的正樣本做數(shù)據(jù)多樣性增廣,類似于醫(yī)生通過(guò)不同的視角、不同的上下文去分析結(jié)節(jié)區(qū)域,并利用生成對(duì)抗網(wǎng)絡(luò)(GAN),從隨機(jī)噪聲中產(chǎn)生新的結(jié)節(jié)正樣本,學(xué)習(xí)生成新形態(tài)的結(jié)節(jié)樣本,深度增廣數(shù)據(jù)的多樣性,提升模型泛化能力。
結(jié)節(jié)預(yù)檢測(cè)
建立 3D-Unet 網(wǎng)絡(luò)結(jié)構(gòu),該分割網(wǎng)絡(luò)主要功能是提取疑似候選結(jié)節(jié),最大化敏感度,降低漏檢率。 其網(wǎng)絡(luò)輸入三個(gè)維度的數(shù)據(jù)特征,可從多個(gè) Z 軸維度「觀察」,正如醫(yī)生結(jié)合多個(gè)平面觀察結(jié)節(jié),從而充分學(xué)習(xí)肺內(nèi)部正常紋理和非正常紋理的區(qū)別,捕捉到結(jié)節(jié)多樣性特征,比如毛玻璃結(jié)節(jié)密度比周圍略高、呈云霧狀性,純實(shí)性結(jié)節(jié)實(shí)性密度較高,類似單獨(dú)分離的蛋黃等。
結(jié)節(jié)精檢測(cè)
結(jié)節(jié)精檢測(cè)采用三種模型分別預(yù)測(cè)候選結(jié)節(jié)概率,并根據(jù)模型間權(quán)重比例給出最終概率的方法。主要優(yōu)勢(shì)在于,負(fù)樣本經(jīng)歷由易至難的學(xué)習(xí)過(guò)程,分割網(wǎng)絡(luò)和后續(xù)假陽(yáng)性衰減網(wǎng)絡(luò)相輔相成。多結(jié)構(gòu)類型的模型 Ensemble,且單一網(wǎng)絡(luò)性能良好,類似于多個(gè)醫(yī)生獨(dú)立閱片的過(guò)程,綜合給出閱片結(jié)果。
結(jié)果
這一算法在阿里云與英特爾聯(lián)合舉辦的天池醫(yī)療 AI 大賽中大獲全勝,以 0.732 的成績(jī)從兩千多組強(qiáng)勁隊(duì)伍中脫穎而出,在比賽最為重要的復(fù)賽賽程中排名第一。
根據(jù)算法訓(xùn)練出的模型能夠更好地處理不同形態(tài)的結(jié)節(jié)特征,達(dá)到很好的檢測(cè)效果,在 400 例小結(jié)節(jié)測(cè)試數(shù)據(jù)上,F(xiàn)ROC 曲線如圖所示:
值得注意的是,該算法診斷 20 萬(wàn)張肺結(jié)節(jié)片需要 10 分鐘,遠(yuǎn)遠(yuǎn)少于醫(yī)生人工診斷的時(shí)間,在提升準(zhǔn)確率的同時(shí),節(jié)約了醫(yī)生的時(shí)間,真正在診斷流程上做好了醫(yī)生的助手。團(tuán)隊(duì)也將算法真正投入到上海各大醫(yī)院進(jìn)行試驗(yàn)與使用,嵌入醫(yī)生診斷流程當(dāng)中,真正造?;颊?。
來(lái)源:機(jī)器之心(微信號(hào) almosthuman2014)