2:0!Dota2世界冠軍被OpenAI碾壓,全程人類只推掉兩座外塔
OG太菜?還有好消息一條:現(xiàn)在,你行你也能上。
夏乙 曉查 假裝發(fā)自 舊金山
量子位 出品 | 公眾號 QbitAI
2:0!
AI向Dota界卷土重來,一下子把Dota 2世界冠軍打得落花流水,在剛剛結(jié)束的三局兩勝比賽中輕松獲勝。
兩局比賽加在一起,人類只推掉了AI兩座外塔。最慘烈的第二局,人類直到最后擊殺人頭數(shù)還是個位數(shù)。
這是OpenAI Five Finals。是AI與人類冠軍的終極決戰(zhàn),也是它的期末大考。
對決的雙方,勝者是多次擊敗人類玩家的AI戰(zhàn)隊代表OpenAI Five;敗者是(理論上)人類最強Dota 2戰(zhàn)隊,去年的TI 8冠軍OG。
不要驚訝,畢竟,現(xiàn)在,距“Dota世界杯”TI8上接連輸給人類職業(yè)選手兩局,已過去231天。如果AI在這期間連續(xù)不斷地訓(xùn)練,已經(jīng)相當于苦練了231×180=41580年的電子競技。
和TI8上相比,AI體現(xiàn)出了更優(yōu)秀的團戰(zhàn)操作,亂逛、空放大招之類的bug也沒再出現(xiàn),進化非常明顯。
同時,OpenAI還展示了比碾壓、進化更重要的新能力:他們的AI不僅會和人類對抗,還能與人類合作組隊一起打Dota!原來的對手,已經(jīng)可以做陪練了。
另外,如果你對今天的人類代表OG不滿意,OpenAI還開放了競技場,任何人都能注冊,組團挑戰(zhàn)AI或者體驗一把和AI做隊友的感覺。
這就是現(xiàn)實版的你行你上??!
人類一敗涂地
OG究竟是怎樣輸給AI的呢?
看比賽之前,我們先來了解一下這次決戰(zhàn)的規(guī)則。
比賽在7.21版本上進行,OpenAI賽前宣布,規(guī)則限制和去年8月TI8上一樣,然而今天比賽開始時展示的規(guī)則還是略有不同:
英雄池包含17個英雄,不知道從之前的18個之中去掉了哪個:斧王、水晶室女、死亡先知、撼地神牛、矮人直升機、巫妖、惡魔巫師、死靈法師、痛苦女王、剃刀、隱刺、影魔、斯拉克、矮人火槍手、斯溫、潮汐獵人、冥界亞龍、巫醫(yī)。
沒有召喚單位和幻象。
之前對圣劍、魔瓶、掃描的限制都沒有提到。
好了,正片時間到:一起來看今天的決戰(zhàn)。
雙方三局兩勝。
第一局
AI(天輝):火槍、飛機、冰女、死亡先知、斯溫
人類(夜魘):小牛、巫醫(yī)、毒龍、隱刺、影魔
選完陣容,OpenAI Five認為自己有67.6%的勝率。
剛剛開局,OpenAI Five拿下一血,而人類軍團也很快殺掉了AI方的冰女。之后,雙方前期在人頭數(shù)上一直不相上下。AI一直在經(jīng)濟上保持總體領(lǐng)先,但最富有的英雄,卻一直是人類的大哥影魔。
這也能看出雙方策略上的明顯區(qū)別:OG是3核心+2輔助的傳統(tǒng)人類打法,而AI的5個英雄經(jīng)濟分配相對平均,比較“大鍋飯”。
經(jīng)過幾番激烈的推進和團戰(zhàn),游戲進行到19分鐘左右,AI對自身勝率的預(yù)測已經(jīng)超過了90%。自信心爆棚的AI一鼓作氣攻上了人類的高地。
OG緊接著選擇了分路推進,幾位解說推測,這是為了盡可能分散AI,防止它們抱團推進,然而并沒有奏效太長時間。
然而,堅持到38分鐘,人類方的小牛剛剛買活,AI的最后一波總攻已經(jīng)推掉了人類的基地。
OpenAI Five贏下第一局?,F(xiàn)場,也是一片掌聲。
這場比賽中,AI展現(xiàn)了清奇的思路:出門裝就選擇兩個大藥,后續(xù)的裝備也更傾向于買補給品,而不是提高自身屬性。
另外,我們前邊提到的“大鍋飯”政策,以及在比賽前期就頻繁買活,都和人類職業(yè)選手的習慣大不相同。
第二局
AI(天輝):冰女、飛機、斯溫、巫醫(yī)、毒龍
人類(夜魘):火槍、小牛、死亡先知、小魚人、萊恩
選完英雄,AI對自身勝率的預(yù)測是60.8%,略低于上一局的陣容。
比賽前兩分鐘,雙方都在一片祥和中各自帶線,然而沒想到,人類中單Topson很快就送出了一血。
之后,人類代表們以驚人的速度潰敗。
5分鐘時,AI的信心就已經(jīng)大幅上升,預(yù)測自己有80%的勝率;7分鐘,AI推掉了上路一塔;10分鐘,AI就已經(jīng)領(lǐng)先人類4000金幣,多推了兩座塔,還為自己預(yù)估了95%的勝率。
11分鐘,AI已經(jīng)攻上了OG的高地。
僅僅21分鐘,OG的基地被推掉,OpenAI Five輕松拿下第二局。直到比賽結(jié)束,OG拿下人頭還是個位數(shù),被AI打成了46:6。
雖然這一局贏得異常輕松,不過對局過程中還是能看出AI在細節(jié)上有一些不足。比如說面對在復(fù)雜樹林中繞來繞去的人類,AI就無能為力。今天的比賽中,Ceb就靠繞樹林救了自己一命。
對于0:2輸給AI這個結(jié)局,OG是不太服氣的。戰(zhàn)隊創(chuàng)始人“大爹”N0tail在賽后采訪中說,讓他打10局,他們有把握找到戰(zhàn)勝AI的辦法;打上50局,就能一直穩(wěn)贏了。
網(wǎng)友們也不太買賬。AI贏OG,我不服!
大家認為,你們OG壓根就沒好好玩!
在第一局中,OpenAI前期有略微的劣勢,然后開始發(fā)力,到第二局幾乎就是一直碾壓OG。比賽前后期落差太大,不像是職業(yè)Dota選手的水平。
很多網(wǎng)友看完比賽后表達了對Ti8冠軍OG的參賽態(tài)度不滿:簡直看不下,”我行我上啊”!
他們認為OG和AI的比賽就是在瞎打,打不過AI就送人頭、不打錢,賣裝備,毫無職業(yè)態(tài)度。
既然OG在亂打,自然也不能證明AI有多厲害。有人甚至直接開始嘲諷OpenAI:
他們應(yīng)該感謝OG,是OG想盡辦法讓弱智的AI看起來不那么弱智了。
或許是OpenAI早就想到了會有眾多網(wǎng)友不服,他們接下來所公布進展中,有一項就能解決這個“不服”的問題。
新能力:和人類組團打Dota
贏下兩局之后,AI并沒有休息。它開始展現(xiàn)自己的新能力:
做人類的隊友!
是的,現(xiàn)在,AI可以和人類配合著打Dota了。贏下OG之后,AI又開始與人類合作組隊,進入了下一局比賽。
這個環(huán)節(jié)的兩支隊伍,都由兩名人類主播和3只AI組成,英雄選擇如下:
天輝:
飛機、斯溫、毒龍三個AI
冰女、死亡先知兩名人類
夜魘:
火槍、剃刀、萊恩 – 三個AI
小牛、痛苦女王 – 兩名人類
這場比賽的一血,就是人類與AI合作的結(jié)果:天輝方人類控制的冰女和身旁的AI隊友合作,殺死了對面人類控制的小牛。
而人類和AI的配合也并非一直完美。
Open的Psyho透露,OpenAI Five并沒有經(jīng)歷過與人類合作打Dota的訓(xùn)練,不過,由于AI的隊伍本來也是由5個神經(jīng)網(wǎng)絡(luò)組成,它們之間也沒有特別的通信渠道,與人類合作對它們來說應(yīng)該也不成問題。
然而實際比賽中,人類的體驗可能并不好。人類不能向AI隊友喊話,沒有真正的溝通和配合。國外網(wǎng)友評價說,這種感覺就像線上遇到了大神,他卻不帶你飛。
你行你上!
秀完碾壓和合作,OpenAI公布了一個眾多網(wǎng)友期待已久大好消息:
你也能和AI打一局了!
“OG太菜,我行我上”也終于可以付諸實踐。
OpenAI開放一個專門的競技場,名叫OpenAI Five Arena。人類用戶在這個平臺上既可以組團對抗AI,也可以和AI組隊比賽。
游戲?qū)⒂谔窖髸r間4月18日下午6點(北京時間4月19日上午9點)正式上線,4月21日結(jié)束。現(xiàn)在,用戶已經(jīng)可以到這個平臺注冊了。
地址:https://arena.openai.com/
目測等到游戲上線后,還會有排行榜實時更新出來。
兩年快速進化
到今天為止,OpenAI的Dota AI誕生兩年,已經(jīng)幾次震驚世人。
它最早誕生于2017年3月,同年8月在TI7邀請賽最后第一次一鳴驚人。當時,它1V1對戰(zhàn)人類頂尖高手,讓NAVI戰(zhàn)隊的烏克蘭職業(yè)DOTA2選手Dendi幾分鐘就打出了GG。
很多人類表示不服,只會用影魔中單1V1當然難以服眾。
然而AI進化十分迅速。
到2018年6月底,AI就掌握了5V5技能。OpenAI為它起了個新名字:OpenAI Five。
之后僅僅過了一個多月,OpenAI Five就在8月6日擊敗了超凡5級別(天梯MMR積分6500以上)的人類半職業(yè)戰(zhàn)隊。
再過半個月,就是它上一次亮相了。
那是在231天前的TI8上,AI所玩的Dota已經(jīng)和今天一樣復(fù)雜,然而它的表現(xiàn)并不亮眼。
當時,AI接連兩天先后對戰(zhàn)人類職業(yè)戰(zhàn)隊paiN Gaming和”中國退役大神隊”,都是一敗涂地,也暴露了不少缺陷:
比如說,當時的OpenAI Five隊伍之中沒有角色分配,無論是1號位還是輔助,打法都差不多;又比如,它總是對自己的勝率預(yù)測過高,還會胡亂插眼空放大招,而且一遇到劣勢,就會表現(xiàn)得“手足無措”。
然而,比賽技術(shù)后仍有人類“帶路黨”堅信:“這可能是職業(yè)隊唯一一次贏ai了?!?/p>
現(xiàn)在,231天過去了,我們看到AI在很多方面都有巨大進步。
最明顯的當然要數(shù)它的新能力:與人類組隊打比賽。
除此之外,AI這次也沒有出現(xiàn)TI8版本的那些壞毛病,比如亂逛、空放大招等等,對勝率的估算也相對合理。
但是胡亂插眼這個毛病,在今天的比賽中依然明顯。看來經(jīng)過幾萬年修煉,AI依然對插眼毫無興趣。
去年TI8結(jié)束后,OpenAI研究員David Farhi曾經(jīng)向量子位透露過他們的推測:通過強化學(xué)習自我對局訓(xùn)練出來的AI,其實并不會買眼,買眼的行為是人類通過硬編碼強制AI完成的。而亂插眼,很可能是因為AI想要把它隨便丟在什么地方,爭取一個空白的物品欄。
5個LSTM,修煉45000年
AI的快速進化,其實是刻苦訓(xùn)練的結(jié)果,也就是不斷的自我對局。
OpenAI CTO Greg Brockman賽前說,他們的AI相當于已經(jīng)練習了45000年Dota。
OpenAI之前也說過,AI每天的訓(xùn)練量相當于人類打180年游戲;之前輸給過OpenAI的MoonMeanderated則說,AI一天要打200萬場比賽。
這樣的訓(xùn)練量,遠非人類能及,當然對計算力的需求也大到嚇人:它們的日常訓(xùn)練,需要256塊P100 GPU和12.8萬個CPU核心。
這支“飯量驚人”的OpenAI Five戰(zhàn)隊,包含5個智能體(agent),每一個都是包含1024個節(jié)點的單層LSTM,能夠通過V社(Valve)的Bot API觀察當前游戲狀態(tài),控制英雄去移動、攻擊、施放技能、使用道具。
它們能夠觀察到的信息和人類差不多,包括自身、隊友和敵人的狀況,比如位置、血量、攻擊力、護甲、攜帶物品、能力等等。
這些信息,對于智能體來說是一個包含20000數(shù)值的列表,而它判斷之后發(fā)出的行動指令,是8個值的列表。
如果要以一種擬人的方式描述,AI“眼中”的游戲大概是這個樣子:
選手們的訓(xùn)練,使用的是擴展版的近端策略優(yōu)化(PPO)方法,這也是OpenAI現(xiàn)在默認的強化學(xué)習訓(xùn)練方法。這些智能體的目標是最大化未來獎勵的指數(shù)衰減和。
既然是5個智能體,當然還要讓它們能作為一支隊伍相互配合。為此,OpenAI設(shè)計了一個“團隊精神”超參數(shù)來統(tǒng)一控制。這個超參數(shù)的范圍在0到1之間,決定了選手對與自身獎勵函數(shù)和隊友平均獎勵函數(shù)的關(guān)注程度分配。
本期人類代表
最后,為不太熟悉OG的朋友簡單介紹一下今天的人類代表。
OG,就是去年TI8上3:2擊敗PSG.LGD,拿下冠軍的那支隊伍,現(xiàn)在的陣容和去年奪冠時一樣:
一二號位Ana(Anathan Pham)
Ana以刷錢能力著稱,甚至有“世界第一打野”之稱,而對線能力是他的短板。這位澳洲華裔選手,去年TI8之后休息了一段時間,今年3月剛剛正式歸隊。
一二號位Topson(Topias Taavitsainen)
他是2018年剛剛加入OG的新人,曾經(jīng)在歐服天梯上排名第一,可謂“路人王”。他迅速從毫無大賽經(jīng)驗的業(yè)余玩家,成為TI8冠軍。因此,他在眾多職業(yè)選手中顯得“思路清奇”,卻也常被批評“發(fā)揮不穩(wěn)定”。
三號位Ceb(Sébastien Debs)
Ceb,又叫7ckngMad,原本是OG的教練,2018年3月,當時的中單Resolut1on離隊后,他先是入隊做替補,又正式成為戰(zhàn)隊里的職業(yè)選手。
四號位JerAx(Jesse Vainikka)
2016年,JerAx從Liquid轉(zhuǎn)入OG,在現(xiàn)在的OG陣容里算是一名老將。他曾被稱為“歐洲土貓王”,也是一名非常擅長掌控游戲節(jié)奏、帶起前期優(yōu)勢的輔助。
五號位N0tail(Johan Sundstein)
N0tail也被國內(nèi)網(wǎng)友稱為“大爹”,是OG創(chuàng)始人,去年剛剛從1號位轉(zhuǎn)到5號位。
最后,量子位想說,如果你也對上面5名人類代表不滿意,趕快去OpenAI Five Arena注冊吧!
— 完 —
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關(guān)村。期待有才氣、有熱情的同學(xué)加入我們!相關(guān)細節(jié),請在量子位公眾號(QbitAI)對話界面,回復(fù)“招聘”兩個字。
量子位 QbitAI · 頭條號簽約作者
?’?’ ? 追蹤AI技術(shù)和產(chǎn)品新動態(tài)
- 14年,50%市場份額,一家中國公司何以在丹麥成功?2019-03-06
- 百度正用谷歌AlphaGo,解決一個比圍棋更難的問題2019-03-06
- 全球首例無人車撞人致死事故判決:Uber無罪,安全員要進一步調(diào)查2019-03-06
- SpaceX載人龍飛船意外爆炸,據(jù)稱幾乎被完全摧毀2019-04-22