醫(yī)學頂刊BMJ打臉谷歌:AI取代醫(yī)生檢測乳腺癌還遠著呢 ?
目前的證據(jù)還不足以判斷AI在乳腺癌篩檢計劃中的準確性。
榮偉 發(fā)自 凹非寺
量子位 報道 | 公眾號 QbitAI
去年,Google Health宣稱開發(fā)的AI實現(xiàn)了新突破:
在乳腺癌篩查上的準確性,大大超過放射科醫(yī)生。
這一研究成果還登上了Nature。
AI這么強,放射科醫(yī)生們是不是該下崗了?
9月2日,發(fā)表在醫(yī)學頂刊BMJ(英國醫(yī)學雜志)上的一項研究,給放射科醫(yī)生們注射了一劑強心針:
目前的證據(jù)表明,AI在乳腺癌篩檢上,距離臨床應(yīng)用還有很長的路要走。
目前,AI還遠遠沒有強到能讓放射科醫(yī)生下崗。
AI到底準不準?
研究人員來自英國華威大學的健康科學部門。
受英國國家篩查委員會委托,他們對AI在乳腺癌篩查項目中檢測乳腺癌的準確性進行了調(diào)查。
研究人員回顧了自2010年以來開展的12項研究,共涉及瑞典、美國、德國、荷蘭和西班牙131822名婦女的數(shù)據(jù)。
其中,3項研究報告了AI作為X光片輔助閱讀工具的測試準確性,9項研究報告了AI作為獨立系統(tǒng)的測試準確性。
所有研究評估的AI都使用了深度學習卷積神經(jīng)網(wǎng)絡(luò)。

規(guī)模最小的6項研究發(fā)現(xiàn),AI比單個放射科醫(yī)生更準確。
不過這6項研究中,5項的放射科醫(yī)生是在實驗室環(huán)境下檢查的乳房X光照片,并不能推廣到臨床實踐中。
其余的研究中,與美國放射科醫(yī)生的單次讀片相比,AI的準確性都低于臨床應(yīng)用的預期。
到底是什么原因造成了AI篩查乳腺癌不準,研究人員稱目前還沒有確切答案。
來自瑞典篩查項目的68008名婦女的DREAM挑戰(zhàn)發(fā)現(xiàn),表現(xiàn)最好的AI的特異性都不及單個的放射科醫(yī)生(88% v 96.7%)。
當AI閾值被設(shè)定為與人類的靈敏度相匹配時,特異性表現(xiàn)也不及兩名放射科醫(yī)生的一致決策(81% v 98.5%)。
即使從數(shù)據(jù)集中選出八個表現(xiàn)最好的AI,它們集合方法的特異性也仍然不如放射科醫(yī)生(92.5% v 96.7%,P<0.001)。
一項在此基礎(chǔ)上的更廣泛研究使用了三個商業(yè)可用AI,并給它們設(shè)定了與放射科醫(yī)生的特異性相當?shù)拈撝怠?/p>
結(jié)果發(fā)現(xiàn),與第一位讀片的放射科醫(yī)生的靈敏度(77.4%)相比,一個AI的靈敏度較高(81.9%,p = 0.03),另外兩個的靈敏度較低(67%,67.4%) 。
與兩名放射科醫(yī)生的共識(85% ,p = 0.11)相比,三個AI的靈敏度都較低。
在歐洲兩項最大的回顧性隊列研究中,36個AI的準確性均比不上兩位放射科醫(yī)生的共識,其中34個的準確性甚至低于單人讀片。
小規(guī)模研究中有希望的結(jié)果,在大規(guī)模研究中沒有得到重復。
最后,研究人員得出結(jié)論:
目前的證據(jù)還不足以判斷AI在乳腺癌篩檢計劃中的準確性,而且還不清楚在臨床應(yīng)用中AI在哪些方面是最有益的。
取代還是賦能?
過分依賴AI,也可能會加劇乳腺癌篩查帶來的危害。
例如,微鈣化一般與較低等級的原位導管癌有關(guān)。
AI如果不同程度上檢測到了更多的微鈣化,就可能會改變?nèi)橄俸Y查中檢測到的疾病譜。
在這種情況下,AI可能會增加過度診斷和過度治療的比率,讓篩查的危害大過效益。
為此,研究人員在論文中專門指出:
AI的特異性并不足以在乳腺癌篩查項目中取代放射科醫(yī)生。
不過,AI雖然取代不了人類,卻可以應(yīng)用在降低乳腺癌的漏檢率上。
4項研究表明,在較低的特異性閾值下,AI可以達到較高的靈敏度,因此可能適合于分流哪些婦女應(yīng)該接受放射學檢查。
3項報告AI作為讀片輔助工具的研究顯示,有AI輔助讀片的放射科醫(yī)生在平均靈敏度上均高于獨立讀片的放射科醫(yī)生。

當然,這還需要進一步的研究以確定最合適的閾值。
與放射科醫(yī)生相互補充而不是競爭,可能這才是AI目前最有意義的定位。
國外也有網(wǎng)友應(yīng)和:
增強放射科醫(yī)生的能力,讓他們更加準確和有效,而不是試圖把他們排除在外,這樣的AI公司未來才會做得最好。

他提到的Rad AI是一家總部位于美國伯克利的AI公司,團隊由放射學和人工智能的專家共同組成。

如何幫放射科醫(yī)生提高生產(chǎn)力,減少倦怠感?
Rad AI給出了這樣的解決辦法:
由放射科醫(yī)生口述,Rad AI識別他們的語言生成定制化的報告觀后感。
不僅口述的字數(shù)可以減少35%,報告和建議也能更加保持一致。

Rad AI官網(wǎng)介紹,這可為放射科醫(yī)生平均每天節(jié)省60+分鐘。
論文地址
https://www.nature.com/articles/s41586-019-1799-6
https://www.bmj.com/content/374/bmj.n1872
參考鏈接
https://news.ycombinator.com/item?id=28394834
https://www.radai.com/product.html