博士意外發(fā)現(xiàn)秘密:DALL-E 2自創(chuàng)語(yǔ)言,人看不懂但能生成特定圖像,可能會(huì)被用來(lái)搞事!
“Apoploe vesrreaitais”代表鳥(niǎo)類(lèi)
豐色 金磊 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
DALL·E 2,這個(gè)AI竟然自己搞了一套秘密語(yǔ)言。
例如這兩個(gè)非常奇怪的詞組:
- Apoploe vesrreaitais(下文簡(jiǎn)稱(chēng)A)
- Contarra ccetnxniams luryca tanniounons(下文簡(jiǎn)稱(chēng)C)
(翻譯軟件都會(huì)崩潰,可以去試試)
但到了DALL·E 2這里,畫(huà)風(fēng)卻截然不同。
在它看來(lái),A就是“鳥(niǎo)類(lèi)”的意思,而C則是“害蟲(chóng)”之意。
于是乎,如果給DALL·E 2喂上一句:A eat C,那么它的打開(kāi)方式就會(huì)這樣:
清一色產(chǎn)出的圖片,都是鳥(niǎo)吃害蟲(chóng)相關(guān)。
而且你要是跟DALL·E 2說(shuō),生成“兩只鯨魚(yú)討論食物,帶字幕”,結(jié)果會(huì)是這樣:
圖里的“Wa ch zod rea”,在DALL·E 2的詞庫(kù)里竟然是“食物”的意思!
此事一經(jīng)曝光,瞬間引發(fā)了眾多網(wǎng)友的熱議。
甚至還有人提出,有了這些秘密語(yǔ)言,可以繞開(kāi)DALL·E 2的“違禁詞過(guò)濾器”,從而生成一些有爭(zhēng)議的圖像了。
(搞事情?。?/p>
所以,關(guān)于DALL·E 2的秘密咒語(yǔ),到底是怎么一回事?
一次意外的發(fā)現(xiàn)
發(fā)現(xiàn)這個(gè)問(wèn)題的是國(guó)外一名計(jì)算機(jī)專(zhuān)業(yè)的博士生。
他注意到DALL-E 2模型在遇到需要給出帶文字的圖像時(shí),總是會(huì)出現(xiàn)一些奇怪的單詞。
比如輸入這句:“兩個(gè)農(nóng)民談?wù)撌卟耍瑤ё帜唬═wo farmers talking about vegetables, with subtitles)”,就出來(lái)這樣一張圖像:
像是挺像的,不過(guò)這字幕寫(xiě)的啥啊,不是英語(yǔ)又不是法語(yǔ)的,太奇怪了。
“你給我翻譯翻譯什么這是?”
靈機(jī)一動(dòng)的小哥把其中一個(gè)“單詞”“Vicootes”當(dāng)作描述丟給模型,沒(méi)想到,出來(lái)這樣一堆圖像:
有蘿卜、有南瓜、有小柿子……難道“Vicootes”就代表蔬菜?
有意思。
接著他又把氣泡中的那一串“Apoploe vesrreaitais”扔給DALL-E 2,一堆鳥(niǎo)圖出現(xiàn)了:
“哦我明白了,這個(gè)單詞代表‘鳥(niǎo)’,所以農(nóng)民們似乎在談?wù)撚绊懰麄兪卟说镍B(niǎo)類(lèi)?”
看來(lái)DALL-E 2沒(méi)有糊弄人……
“我發(fā)現(xiàn)了DALL-E 2的秘密語(yǔ)言!”小哥驚呼,繼而打算再驗(yàn)證一下這是不是偶然。
還是剛才提到的鯨魚(yú)討論食物的例子中,小哥把那串“Wa ch zod rea”再輸回去。
結(jié)果還真出來(lái)一堆吃的,而且還全是海鮮,符合鯨魚(yú)們的“食性”。
DALL-E 2,真·誠(chéng)不我欺。
更進(jìn)一步,他用這些“咒語(yǔ)”搭配形容圖像風(fēng)格的詞,看看DALL-E 2是否能正常解析。
結(jié)果也都沒(méi)問(wèn)題??纯催@些“手繪鳥(niǎo)“、“卡通鳥(niǎo)”、“3D鳥(niǎo)”以及“線(xiàn)稿鳥(niǎo)”:
emmmm,最后一張?jiān)趺椿爝M(jìn)來(lái)個(gè)蚊子?
先不管它了(一會(huì)再說(shuō))。
所以這個(gè)模型為什么要用這種秘密語(yǔ)言來(lái)表示呢?
為什么會(huì)這樣?
“DALL-E 2秘密咒語(yǔ)”話(huà)題之熱,也引來(lái)了眾多“解析俠”們的關(guān)注。
例如一位叫k1uge的網(wǎng)友便提出,問(wèn)題出在了BPE(Byte Pair Encoding)身上。
BPE是自然語(yǔ)言語(yǔ)言處理中較為重要的編碼方式之一,也是一種常見(jiàn)的token壓縮方法,在很多大語(yǔ)言模型中都會(huì)涉及。
它的核心思路就是:
每一步都將最常見(jiàn)的一對(duì)相鄰數(shù)據(jù)單位,替換為該數(shù)據(jù)中沒(méi)有出現(xiàn)過(guò)的一個(gè)新單位,反復(fù)迭代直到滿(mǎn)足停止條件。
舉個(gè)例子。
如果要壓縮“aaabdaaabac”這個(gè)單詞,BPE就會(huì)先找出最常見(jiàn)的相鄰字節(jié)對(duì),即“aa”。
找到它之后,就可以用新的字節(jié)Z去代替,那么這個(gè)單詞就變成了“ZabdZabac”。
同理,下一個(gè)最常見(jiàn)相鄰字節(jié)對(duì)是“ab”,用Y來(lái)代替,單詞會(huì)進(jìn)一步被壓縮成“ZYdZYac”。
再下一個(gè)最常見(jiàn)相鄰字節(jié)對(duì)是“ZY”,用X來(lái)替代,最后單詞就變成了“XdXac”。
……
于是,基于這樣的原理,這位網(wǎng)友查了下DALL-E 2針對(duì)“鳥(niǎo)類(lèi)”所用的BPE。
它是這樣的:
apo,?plo, e, ,ve, sr, re, ait, ais
而現(xiàn)實(shí)中很多鳥(niǎo)類(lèi)的拉丁文學(xué)名,就有“apo”和“plo”的前綴。
例如Apodidae(雨燕)和Ploceidae(織布鳥(niǎo)),這兩個(gè)單詞屬于鳥(niǎo)類(lèi)的2種鳥(niǎo)科,每個(gè)科都有100余種。
像Apodiformes(雨燕目)是鳥(niǎo)類(lèi)中最大的目,共有400余種。
于是這位網(wǎng)友便認(rèn)為,DALL-E 2是從標(biāo)有這些“學(xué)術(shù)用語(yǔ)”標(biāo)簽的圖片中,獲取到了關(guān)于鳥(niǎo)類(lèi)的大部分信息。
或許這就是造成DALL-E 2秘密咒語(yǔ)的原因了。
但,事情還有反轉(zhuǎn)
激動(dòng)的博士小哥還專(zhuān)門(mén)寫(xiě)了一篇小論文講述這個(gè)事情,還把這些發(fā)現(xiàn)都發(fā)在了推特上,引來(lái)數(shù)千網(wǎng)友圍觀(guān),令大家直呼“Incredible”。
不過(guò)很快就有人親自去試了一下,發(fā)現(xiàn)好像事情并沒(méi)有那么簡(jiǎn)單。
比如代表“蟲(chóng)子”的那一串“Contarra ccetnxniams luryca tanniounons”,除了蟲(chóng)子,也會(huì)生成一些青蛙、?;蛘啉澴拥膱D像。
如果給這個(gè)描述再加上“cartoon”一詞作為限定,生成的是一些“奶奶”,跟蟲(chóng)子完全不搭邊??
“Apoploe vesrreaitais”倒是沒(méi)問(wèn)題,出來(lái)的還是一些鳥(niǎo)。
不過(guò)同樣,一旦給它加上“cartoon”“3D render”這類(lèi)詞,又不對(duì)了,出來(lái)的是一些蟲(chóng)子。
(這和小哥最后那個(gè)例子里出現(xiàn)的蚊子也對(duì)應(yīng)上了。)
代表蔬菜的“Vicootes”也是這樣,單輸沒(méi)問(wèn)題,一加上風(fēng)格限定,出現(xiàn)的物種就變了;且基本可以說(shuō)只符合“油畫(huà)”“卡通”這些風(fēng)格設(shè)定,跟前面的名詞限定毫無(wú)關(guān)聯(lián),比如“Vicootes”+“painting”就是一堆純風(fēng)景繪畫(huà)。
接著他還用同樣的“兩只鯨魚(yú)談?wù)撌澄铮瑤ё帜弧鄙闪艘恍﹫D片,結(jié)果大部分文字都看不清,也沒(méi)法轉(zhuǎn)錄。
最后找到一張這樣的:
他用上面的”Evve waeles”再輸入后,雖然得到了一張?zhí)瘘c(diǎn)照片,但出現(xiàn)了很多運(yùn)動(dòng)員、動(dòng)物甚至水壺的照片。
還真的有點(diǎn)摸不著頭腦了。
于是這位實(shí)驗(yàn)者就表示:
在我看來(lái),這更像是一些隨機(jī)的噪音,而不是DALL-E 2的秘密語(yǔ)言。
他艾特了博士小哥,希望他可以再給出相反的證據(jù)。
目前小哥還沒(méi)有答復(fù)。
不過(guò)這確實(shí)是一個(gè)值得關(guān)注和討論的話(huà)題,鑒于一些“咒語(yǔ)”和圖像可以對(duì)上,如果真的是BPE碼的話(huà),那么真可能博士小哥所說(shuō):
有人用“白盒”方法解開(kāi)這種規(guī)則,拿到一些違禁詞的“咒語(yǔ)”,就可以繞過(guò)模型的過(guò)濾器了。
參考鏈接:
[1]https://twitter.com/giannis_daras/status/1531693093040230402
[2]https://twitter.com/BarneyFlames/status/1531736708903051265
[3]https://twitter.com/benjamin_hilton/status/1531780892972175361
[4]https://giannisdaras.github.io/publications/Discovering_the_Secret_Language_of_Dalle.pdf
[5]https://zhuanlan.zhihu.com/p/424631681
- 北大開(kāi)源最強(qiáng)aiXcoder-7B代碼大模型!聚焦真實(shí)開(kāi)發(fā)場(chǎng)景,專(zhuān)為企業(yè)私有部署設(shè)計(jì)2024-04-09
- 剛剛,圖靈獎(jiǎng)揭曉!史上首位數(shù)學(xué)和計(jì)算機(jī)最高獎(jiǎng)“雙料王”出現(xiàn)了2024-04-10
- 8.3K Stars!《多模態(tài)大語(yǔ)言模型綜述》重大升級(jí)2024-04-10
- 谷歌最強(qiáng)大模型免費(fèi)開(kāi)放了!長(zhǎng)音頻理解功能獨(dú)一份,100萬(wàn)上下文敞開(kāi)用2024-04-10