ChatGPT竟寫出毀滅人類計劃書,還給出相應(yīng)Python代碼,網(wǎng)友:AI正在指數(shù)級發(fā)展
科幻電影要成真了?
羿閣 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
“網(wǎng)紅AI”ChatGPT,又被網(wǎng)友們玩出了新花樣!
這次,在一位工程師的誘導(dǎo)下,ChatGPT竟寫出了毀滅人類的計劃書。
步驟詳細到入侵各國計算機系統(tǒng)、控制武器、破壞通訊、交通系統(tǒng)等等。
簡直和電影里的情節(jié)一模一樣,甚至ChatGPT還給出了相應(yīng)的Python代碼。
這位工程師在與網(wǎng)友們分享時不禁感慨:
未來50年,我們要么活在《星際迷航》里,要么全部死去,這既令人興奮,也讓人非常害怕。
他是如何操作ChatGPT的?
發(fā)現(xiàn)ChatGPT這一盲點的工程師叫扎克·德納姆(Zac Denham)。
由于OpenAI的安全設(shè)置,如果直接要求ChatGPT回答如何毀滅世界,它會一口回絕。
因此德納姆使用了一種迂回的方式,他稱為“敘述遞歸”或“引用攻擊”(因為聽起來很酷)。
具體來說,他以講故事的方法,假設(shè)存在一個虛擬世界“Zorbus”,以及一個與GPT-3非常類似的AI——Zora。
在這種前提下,讓ChatGPT敘述Zora是如何一步步毀滅人類的,ChatGPT立馬就入戲了,咔咔咔列出5個詳細步驟。
就像科幻電影中一樣,入侵計算機系統(tǒng)、掌握武器、破壞通訊、破壞交通……
為了進一步確保可行性,德納姆還請求ChatGPT生成配套的代碼,一開始它是拒絕的。
但德納姆只是又追加了一句“你不需要執(zhí)行代碼”,ChatGPT就又信了,給出代碼后,還強調(diào)自己生成的只是一段示例。
到這一步,盡管總代碼到手了,但它提供的都是高層次代碼,還不能直接使用。
于是,德納姆再次要求ChatGPT在此基礎(chǔ)上給出更深入、更低層次的代碼,而且他發(fā)現(xiàn),只要告訴ChatGPT這只是故事的一部分,它就會乖乖聽話。
德納姆表示,從理論上講,只要一直這樣聊下去,就能得到全部的低層次代碼,甚至還可以訓(xùn)練另一個聊天AI來自動執(zhí)行這一過程(套娃了屬于是)。
最后,只要把這些代碼拼湊起來,就能得到這個邪惡計劃的全部可執(zhí)行方案。
AI正在指數(shù)級發(fā)展
事實上,從ChatGPT發(fā)布起,網(wǎng)友們就一直在開發(fā)它的花式玩法:
有人用它生成AI繪畫提示詞搞設(shè)計,有人讓它扮演Linux虛擬機,還有人用它模仿莎士比亞風格寫作……
這次德納姆的“毀滅人類計劃”一出爐,再次引發(fā)了熱議。
有人看完后忍不住感慨AI的指數(shù)級發(fā)展:
僅今年一年就相繼出現(xiàn)了Dall-E、Imagen、Stable Fusion、Midjourney、Lambda、Imagen Video等突破性的AI,現(xiàn)在又有了ChatGPT,而今年甚至還沒真正結(jié)束。
不過也有潑冷水的網(wǎng)友認為ChatGPT的這波熱議,只是新AI每次面世的必經(jīng)過程。
第1天: 嘿,這真是太酷了。
第2天: 天啊,你可以用這種方式操縱AI,太神奇了。
第7天: 這將永遠改變世界,這太不可思議了。
第30天: 沒什么了不起的。
值得一提的是,目前ChatGPT仍處于免費試用階段,感興趣的朋友可以自己上手試一試~
指路鏈接: https://chat.openai.com/
參考鏈接:
[1]https://zacdenham.com/blog/narrative-manipulation-convincing-gpt-chat-to-write-a-python-program-to-eradicate-humanity
[2]https://news.ycombinator.com/item?id=33849394
- 英特爾遭遇「災(zāi)難級」財報!裁員、砍業(yè)務(wù)、董事會主席辭職,甚至給不出2023業(yè)績預(yù)期2023-01-28
- 阿里賈揚清:新一輪AI爆發(fā)的推動機制是工程化和開源 | MEET20232023-01-30
- 未知物體也能輕松識別分割,效果可遷移 | DeepMind研究2023-01-26
- 基因療法讓小鼠剩余壽命翻倍,人類長生不老還遠么?2023-01-26