谷歌通用AI智能體發(fā)布,3D游戲玩法要變天了
10秒內(nèi)完成簡單任務(wù)
西風(fēng) 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
谷歌DeepMind號稱打造出了首個能在廣泛3D虛擬環(huán)境和視頻游戲中遵循自然語言指令的通用AI智能體。
名為SIMA,不是NPC,是可以成為玩家拍檔,幫忙干活打雜的那種。

比如,在《模擬山羊3》(Goat Simulator 3)中當(dāng)司機開開車:

在《幸福工廠》(Satisfactory)中挖礦石:

在《瓦爾海姆》(Valheim)中尋找水源:

在《無人深空》中(No Man’s Sky)駕駛宇宙飛船射擊小行星收集資源:


……
SIMA全稱Scalable Instructable Multiworld Agent,顧名思義可擴展、可指導(dǎo)、多世界。
之前,谷歌DeepMind在AI+游戲方面也做過許多工作,比如推出能和人類玩家打PK、會玩《星際爭霸II》的AlphaStar系統(tǒng)。
而SIMA被DeepMind稱作是一個“新的里程碑”,主打從適用單一游戲轉(zhuǎn)向通用多種游戲,且可遵循語言指令。

SIMA一公開,網(wǎng)友們也是討論熱烈。
讓它們替我完成無聊繁瑣的任務(wù),這樣我就可以直接做有趣的部分,而不必花幾個小時培育chocobos獲取隨機召喚。

嗯…《最終幻想》(Final Fantasy)玩家無疑了。
專業(yè)《模擬山羊》玩家在此刻也懵了:

最近這一連串的AI進(jìn)展也是整的網(wǎng)友們措不及防,直呼“慢一點”:

10秒內(nèi)完成的簡單任務(wù)
接下來再來看一波SIMA的表現(xiàn)。
為了讓SIMA接觸到更多游戲環(huán)境,開發(fā)團隊表示目前已與八家游戲工作室合作,在九款不同的視頻游戲上訓(xùn)練和測試了SIMA。


當(dāng)前的SIMA已在600個基本技能上進(jìn)行了評估。

基本操作、交互、使用菜單都會:

簡單的任務(wù),10秒內(nèi)可完成。

各種場景都能適應(yīng):

除此外,谷歌DeepMind還發(fā)布了一份技術(shù)報告,一起來看看里面都有啥。
未見過的游戲也會玩
SIMA的整體架構(gòu)是將預(yù)訓(xùn)練視覺模型與自監(jiān)督學(xué)習(xí)的Transformer相結(jié)合。
從用戶那里接收語言指令,并從環(huán)境中獲取圖像觀察結(jié)果,然后將它們映射為鍵盤和鼠標(biāo)動作。
具體架構(gòu)如下圖:

開發(fā)人員收集了一個既包括精選研究環(huán)境又包括商業(yè)視頻游戲的大型多樣化游戲數(shù)據(jù)集。
此外,他們還用Unity創(chuàng)建的一個新環(huán)境,名為“the Construction Lab”。在這個環(huán)境中,智能體需要使用積木構(gòu)建雕塑,這考驗了它們對物體的操縱能力和對物理世界的理解。
數(shù)據(jù)收集包含多種方法,比如讓不同成對的人類玩家的互動,其中一名玩家觀察并指導(dǎo)另一名玩家,以此來捕獲語言指令;讓玩家自由玩游戲,觀察他們的操作,并記錄下可能導(dǎo)致其游戲行為的指令。

通過在不同的游戲世界中學(xué)習(xí),SIMA能夠?qū)⒄Z言與游戲行為相結(jié)合。

不需要訪問游戲源代碼,也不需要定制API,僅需要兩個輸入:屏幕上的圖像和用戶提供的簡單的自然語言指令。
然后SIMA就會使用鍵盤和鼠標(biāo)輸出來控制游戲角色以執(zhí)行這些指令,這一操作與人類類似,也就意味著SIMA有潛力與任何虛擬環(huán)境互動。

在評估測試中,研究人員表示SIMA在九個3D游戲集上接受訓(xùn)練,表現(xiàn)顯著優(yōu)于僅在單個游戲上專門訓(xùn)練的智能體。
而且SIMA在未訓(xùn)練過的游戲中的表現(xiàn)和專門使用該游戲數(shù)據(jù)集訓(xùn)練過的智能體表現(xiàn)一樣好。
也就是說,SIMA在全新環(huán)境中具備泛化能力。
此外測試結(jié)果還顯示,SIMA的性能依賴于語言。在一個控制測試中,智能體沒有接受任何語言訓(xùn)練或指令,它就會出現(xiàn)無目的的操作,不遵循指令。
而且,和人類玩家相比較,SIMA水平還是差一點。
更多細(xì)節(jié),感興趣的家人們可以查看技術(shù)報告。
參考鏈接:
[1]https://deepmind.google/discover/blog/sima-generalist-ai-agent-for-3d-virtual-environments/
[2]https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/sima-generalist-ai-agent-for-3d-virtual-environments/Scaling%20Instructable%20Agents%20Across%20Many%20Simulated%20Worlds.pdf
- 多人有聲視頻一體化生成!用百度最新AI生成營銷視頻,現(xiàn)在1.4元/5秒2025-08-22
- 馬斯克一覺醒來,Space X在京開賣了2025-08-21
- 離譜!現(xiàn)在的Agent都卷成100個成團了?3分鐘并行干完5個復(fù)雜任務(wù),還能隨時改需求2025-08-18
- 國家級AI創(chuàng)新應(yīng)用賽事殺瘋了!超200萬元獎金池+全場景賽道,沖線團隊速來2025-08-15