淺層循環(huán)神經(jīng)網(wǎng)絡(luò)CORnet-S:最像大腦的物體識(shí)別高手
嚴(yán)冰冰 發(fā)自 凹非寺
量子位 報(bào)道 | 公眾號(hào) QbitAI
深層卷積人工神經(jīng)網(wǎng)絡(luò)(Deep Convolutional ANN)是近年來(lái)視覺(jué)處理領(lǐng)域的寵兒,它們起源于簡(jiǎn)單的淺層網(wǎng)絡(luò)(如八層結(jié)構(gòu)的AlexNet),進(jìn)化出多層級(jí)、多分支的復(fù)雜結(jié)構(gòu)(如NASNet、ResNet)。
這些深層的前饋神經(jīng)網(wǎng)絡(luò)雖然在物體識(shí)別測(cè)試中表現(xiàn)卓越,但都存在局限。
- 太過(guò)復(fù)雜:層級(jí)太多,難以與大腦視覺(jué)系統(tǒng)的腹側(cè)通路結(jié)構(gòu)對(duì)應(yīng)。
- 太不復(fù)雜:缺少具有生物學(xué)意義的大腦構(gòu)造(如循環(huán)結(jié)構(gòu)),難以匹配大腦復(fù)雜的神經(jīng)動(dòng)態(tài)。
這些深層ANN繼續(xù)進(jìn)化,是否會(huì)變得越來(lái)越不像真實(shí)的大腦?
為了回答這個(gè)問(wèn)題,MIT的DiCarlo實(shí)驗(yàn)室推出線(xiàn)上測(cè)試平臺(tái)Brain-Score,評(píng)估ANN與大腦在物體識(shí)別過(guò)程中的相似程度,同時(shí)與多方合作,開(kāi)發(fā)淺層網(wǎng)絡(luò)CORnet系列。
其中,最優(yōu)秀的是CORnet-S選手,它的構(gòu)造與大腦的解剖結(jié)構(gòu)更加對(duì)應(yīng),且在機(jī)器學(xué)習(xí)評(píng)估中表現(xiàn)優(yōu)異,是迄今為止靈長(zhǎng)類(lèi)視覺(jué)腹側(cè)通路的最佳模型,為視覺(jué)處理領(lǐng)域ANN的開(kāi)發(fā)與對(duì)大腦功能的深入理解提供了新思路。
構(gòu)造:簡(jiǎn)潔輕便、模擬大腦
CORnet-S由4個(gè)層級(jí)組成,分別對(duì)應(yīng)大腦視覺(jué)腹側(cè)通路中的V1、V2、V4與IT區(qū)域,在第4層之后增加一個(gè)線(xiàn)性分類(lèi)解碼器,對(duì)應(yīng)從IT區(qū)域信號(hào)輸出到行為選擇的處理過(guò)程。
△CORnet-S對(duì)應(yīng)大腦視覺(jué)腹側(cè)通路的4個(gè)區(qū)域;來(lái)源:arXiv:1909.06161 [cs.CV]
CORnet-S的每個(gè)層級(jí)都是一個(gè)簡(jiǎn)單的經(jīng)典卷積神經(jīng)網(wǎng)絡(luò),由卷積、激活、非線(xiàn)性化、歸一化、池化等步驟組成,其中V2、V4、IT區(qū)域的回路結(jié)構(gòu)一致,但神經(jīng)數(shù)目不同。
△CORnet-S參數(shù);來(lái)源:https://doi.org/10.1101/408385
CORnet-S增加了層級(jí)內(nèi)部循環(huán)的特征,其中V2與IT區(qū)域重復(fù)2次,V4區(qū)域重復(fù)4次,并且增加了跳躍連接。
△來(lái)源:arXiv:1909.06161 [cs.CV]
層級(jí)內(nèi)部循環(huán),即將該層級(jí)的輸出作為輸入重新進(jìn)入該層級(jí),多次重復(fù)后得到最終的輸出,模擬腦區(qū)內(nèi)部循環(huán)。
優(yōu)勢(shì):Brain-Score與ImageNet雙高分
Brain-Score平臺(tái)從以下幾個(gè)方面評(píng)估ANN性能:
- 神經(jīng)信號(hào)預(yù)測(cè):ANN是否能準(zhǔn)確預(yù)測(cè)神經(jīng)元(猴腦內(nèi)88處V4區(qū)域位點(diǎn)與168處IT區(qū)域位點(diǎn))對(duì)圖像輸入的信號(hào)反應(yīng);
- 行為預(yù)測(cè):ANN與人類(lèi)在核心物體識(shí)別中的行為模式是否一致(注意:此處評(píng)估行為的一致性,即同對(duì)同錯(cuò),而非準(zhǔn)確性);
- 物體識(shí)別時(shí)間(OST):ANN與大腦內(nèi)IT區(qū)域神經(jīng)元(猴腦內(nèi)424處IT區(qū)域位點(diǎn))得到圖像分類(lèi)信息所需時(shí)間是否一致;
- 前饋簡(jiǎn)易度:評(píng)估ANN結(jié)構(gòu)的復(fù)雜程度,以最長(zhǎng)通路的卷積層數(shù)為標(biāo)準(zhǔn),相同參數(shù)的區(qū)域內(nèi)循環(huán)算作1,如CORnet-S為4層,非常簡(jiǎn)單。
在Brain-Score平臺(tái)上可以看到,相比其他的視覺(jué)處理人工神經(jīng)網(wǎng)絡(luò),CORnet-S得分最高,在ImageNet測(cè)試中也名列前茅,是淺層網(wǎng)絡(luò)中表現(xiàn)最好的。綜合考慮ANN的前饋簡(jiǎn)易度因素,CORnet-S也十分具有優(yōu)勢(shì)。
△CORnet-S在Brain-Score與ImageNet評(píng)估中得分很高,且結(jié)構(gòu)簡(jiǎn)單;來(lái)源:arXiv:1909.06161 [cs.CV]
研究者進(jìn)一步探索發(fā)現(xiàn),循環(huán)是CORnet-S在評(píng)估中表現(xiàn)優(yōu)異的關(guān)鍵因素,區(qū)域內(nèi)循環(huán)次數(shù)、瓶頸層設(shè)定與跳躍連接是關(guān)鍵參數(shù)。另外,相比前饋網(wǎng)絡(luò),CORnet-S與猴腦內(nèi)物體識(shí)別時(shí)間的相關(guān)程度更高(r=0.19, p<1e-8),可以部分抓取IT區(qū)域的神經(jīng)元?jiǎng)討B(tài),而這一點(diǎn)是前饋神經(jīng)網(wǎng)絡(luò)無(wú)法做到的。
△CORnet-S的關(guān)鍵參數(shù);來(lái)源:arXiv:1909.06161 [cs.CV]
總結(jié)
CORnet-S的發(fā)展不僅打破了傳統(tǒng)的深層網(wǎng)絡(luò)開(kāi)發(fā)思路,也為神經(jīng)生物學(xué)家深入理解大腦結(jié)構(gòu)與功能提供了新的可能性。值得注意的是,目前CORnet-S的設(shè)定中不包含層級(jí)間循環(huán)與反饋,且不包括對(duì)應(yīng)大腦結(jié)構(gòu)中視網(wǎng)膜與外側(cè)膝狀體(IGN)的區(qū)域,這些現(xiàn)存的缺陷都為它未來(lái)的發(fā)展提供了想象空間。
傳送門(mén)
論文連接:
https://arxiv.org/abs/1909.06161
CORnet家族開(kāi)源地址:
https://github.com/dicarlolab/cornet
— 完 —