圓圈在動(dòng)嗎?這個(gè)騙過人眼的動(dòng)圖火了,LeCun解釋原理:和CNN對(duì)抗攻擊類似
「類似CNN的結(jié)構(gòu)都有盲點(diǎn)」
金磊 發(fā)自 凹非寺
量子位 報(bào)道 | 公眾號(hào) QbitAI
都說「眼見為實(shí)」,但真是這樣嗎?
先來看下這張動(dòng)圖。
是不是感覺這2個(gè)圓圈,會(huì)隨著箭頭方向移動(dòng)?
然而事實(shí)卻是:
它們沒有發(fā)生任何改變。
而就是這樣一張動(dòng)圖,近日卻在網(wǎng)上引發(fā)了熱烈的討論。
連深度學(xué)習(xí)三巨頭之一的LeCun大神,也出面發(fā)表言論:
大腦的對(duì)抗性樣本。
每個(gè)類似CNN的結(jié)構(gòu)……都有盲點(diǎn)……會(huì)被愚弄。
那么這張動(dòng)圖到底暗含什么玄機(jī)?又為何讓LeCun作出如此評(píng)價(jià)?
「忽悠」大腦的動(dòng)圖
對(duì)此,很多網(wǎng)友還是選擇相信自己的眼睛,認(rèn)為得它們就是在動(dòng);也有堅(jiān)持說沒動(dòng)的。
于是他們找到各種辦法來證明。
最簡單的方法就是擋住箭頭,效果是這樣的。
「恐怕這種幻覺與箭頭無關(guān)」,這位網(wǎng)友評(píng)價(jià)道。
接著,其他人便采取了更加「科學(xué)」的方法——畫線。
可以明顯看到,圓圈的轉(zhuǎn)動(dòng)確實(shí)沒有超過標(biāo)記線。
那是不是箭頭發(fā)生了移動(dòng),才產(chǎn)生的錯(cuò)覺呢?
也有人做了實(shí)驗(yàn)。
也不難看出,箭頭位置沒有發(fā)生變化,而且第一個(gè)實(shí)驗(yàn)也證明了與箭頭無關(guān)。
那這到底是怎么一回事?LeCun給出了正解:
它們是靜態(tài)的。
黃色區(qū)域的外側(cè),有一條藍(lán)色的細(xì)線;藍(lán)色區(qū)域外側(cè),則有一條黃色的細(xì)線。
網(wǎng)友將圓圈放大后,也發(fā)現(xiàn)了這個(gè)隱藏的「貓膩」。
LeCun繼續(xù)補(bǔ)充道:
你的視網(wǎng)膜→MT視覺通路,將圓周運(yùn)動(dòng)中的高對(duì)比度邊緣,解釋成了與邊緣正交的運(yùn)動(dòng)。
例如CNN在「工作過程」中,也會(huì)提取圖像中的一些邊緣信息/特征。
而這也正是LeCun在文章開頭處評(píng)價(jià)的由來——大腦的對(duì)抗性樣本。
他認(rèn)為:
每一個(gè)類似CNN的架構(gòu),無論是人工的還是自然的,都有盲點(diǎn)。
它們會(huì)被訓(xùn)練數(shù)據(jù)分布之外的輸入所愚弄。
LeCun說這話并不是空穴來風(fēng),而是在AI(尤其是計(jì)算機(jī)視覺)*相關(guān)的研究中,諸如此類的「忽悠」現(xiàn)象屢見不鮮。
「忽悠」AI的對(duì)抗性樣本
對(duì)抗性樣本,簡單來說就是:
對(duì)輸入數(shù)據(jù)樣本,添加一些人無法觀察到的干擾,導(dǎo)致模型以高置信度給出一個(gè)錯(cuò)誤的輸出。
一個(gè)非常經(jīng)典的例子就是圖像分類。
例如一張已經(jīng)被分類為「熊貓」的圖片,在加入一些干擾后,我們?nèi)祟惾庋凼菬o法察覺輸出圖像產(chǎn)生的變化。
但在AI眼里卻截然不同,并以高置信度將輸出圖像分類為「長臂猿」。
至于其原理,可以引用Deep Neural Networks are Easily Fooled: High Confidence Predictions for Unrecognizable Images這篇文章中的圖來示意:
一種方法是從一個(gè)類別的樣本出發(fā),添加一些「小修改」,然后模型就會(huì)把修改后的樣本,判定為另一類。
另外一種方法,就是利用分類不確定性。比如圖中除了最上面部分的空間可以認(rèn)為是數(shù)據(jù)存在概率極低的區(qū)域,從實(shí)際應(yīng)用的角度甚至可以認(rèn)為是完全不關(guān)心的區(qū)域。
而這樣的對(duì)抗性樣本,不僅僅是在圖像分類任務(wù)中存在,在自動(dòng)駕駛中也是常見的。
例如「一個(gè)膠帶就把特斯拉忽悠瘸了」。
用一條2英寸的膠帶,成功欺騙2016年版特斯拉的攝像頭系統(tǒng),誘使其出現(xiàn)了50英里/小時(shí)(80公里/小時(shí))的異常加速。
欺騙后的效果是這樣的:
而這樣的問題,也成為了自動(dòng)駕駛的一個(gè)安全隱患。
網(wǎng)友:LeCun,你說的不對(duì)
最后,對(duì)于LeCun說「大腦的對(duì)抗性樣本」這句話,也成了網(wǎng)友們熱議的一個(gè)焦點(diǎn)。
有網(wǎng)友非常直白地說:
這并不是一個(gè)很好的對(duì)抗性樣本。
也有網(wǎng)友提出質(zhì)疑:
這是人類視覺系統(tǒng)的一個(gè)對(duì)抗性例子,還是一個(gè)特征?
這看起來像是我們泛化能力的產(chǎn)物。
對(duì)此,你怎么看?
參考鏈接:
https://twitter.com/ylecun/status/1331590066272153600
- 商湯林達(dá)華萬字長文回答AGI:4層破壁,3大挑戰(zhàn)2025-08-12
- 商湯多模態(tài)大模型賦能鐵路勘察設(shè)計(jì),讓70年經(jīng)驗(yàn)“活”起來2025-08-13
- 以“具身智能基座”為核,睿爾曼攜全產(chǎn)品矩陣及新品亮相2025 WRC2025-08-11
- 哇塞,今天北京被機(jī)器人人人人人塞滿了!2025-08-08