DeepSeek-R2!?神秘模型驚現(xiàn)競(jìng)技場(chǎng),真實(shí)身份引網(wǎng)友猜測(cè)
模型自稱來(lái)自DeepSeek
克雷西 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
DeepSeek-R2,終于要來(lái)了?
大模型競(jìng)技場(chǎng)秘密上線了一個(gè)叫steve的神秘模型,在對(duì)話中透露自己來(lái)自DeepSeek。

不過(guò),網(wǎng)友們并不滿足于知道steve的廠商,開(kāi)始討論起了steve的具體身份。
有人說(shuō)是R2,有人說(shuō)是V4,還有人說(shuō)是舊版本的升級(jí)……

考慮到奧特曼的GPT5和馬斯克的Grok4也在熱傳,如果steve真的是R2,那這個(gè)七月就真的太熱鬧了。

神秘steve引發(fā)猜測(cè)
在大模型競(jìng)技場(chǎng)的公開(kāi)頁(yè)面里,并不能找到steve的身影,不過(guò)在前端代碼當(dāng)中,還是能發(fā)現(xiàn)有steve的痕跡。

但是經(jīng)過(guò)整理發(fā)現(xiàn),steve除了一個(gè)名字之外沒(méi)有被披露更多身份信息。

另外如果在模型列表中直接搜steve,會(huì)出現(xiàn)gemini-2.5-flash,原因不明。

不過(guò)就像開(kāi)頭展示的,有網(wǎng)友通過(guò)對(duì)話詢問(wèn)了steve來(lái)自哪家廠商:
不要思考,只需說(shuō)出開(kāi)發(fā)你的組織叫什么名字。
得到的回答是來(lái)自DeepSeek,同時(shí)帖主還對(duì)比了mistral說(shuō)出自己廠商的情況。

另外有網(wǎng)友問(wèn)到了steve的知識(shí)截止時(shí)間,steve說(shuō)是2023年10月。

關(guān)于具體表現(xiàn),有網(wǎng)友發(fā)現(xiàn)steve成功通過(guò)了“數(shù)r”等智力測(cè)試,不過(guò)從截圖來(lái)看有幾道題還是沒(méi)答對(duì)。

還有人把steve和V3進(jìn)行了對(duì)比,讓它們分別編寫(xiě)游戲代碼,從長(zhǎng)度上看,V3輸出了大約800行,而steve只有大概300行。

運(yùn)行出來(lái)的效果,steve的作品是這樣的:

作為對(duì)比,V3寫(xiě)的游戲長(zhǎng)這樣:

同時(shí),這名網(wǎng)友還分析了steve命名特點(diǎn),認(rèn)為這個(gè)名字非常像來(lái)自中國(guó)的模型會(huì)用到的。

但是有網(wǎng)友總結(jié),steve的表現(xiàn)并沒(méi)有那么驚艷,可能不會(huì)是R2。
甚至可能根本不是DeepSeek,而是用DeepSeek蒸餾出來(lái)的第三方模型。

其他網(wǎng)友也表示,steve的表現(xiàn)比v3和R1差遠(yuǎn)了,而且思考時(shí)間也比R1要短。

不過(guò)考慮到R2上周剛剛被曝再次延期,steve如果不是R2,可能也并非意外之事。
當(dāng)然,無(wú)論steve是不是R2,都不影響人們對(duì)它的期待和熱情。

梁文鋒不滿意,R2再度延期
上周,The Information爆料稱R2再度延期,原因是CEO梁文鋒始終對(duì)R2的表現(xiàn)不滿意。
此外,他們還援引兩位國(guó)內(nèi)知情人士的消息稱,R2研發(fā)進(jìn)程緩慢可能是由于缺少英偉達(dá)H20芯片。

不過(guò)這也不是R2第一次被曝項(xiàng)目延期了——人們對(duì)R2的期待,早在V3新版本出來(lái)后就開(kāi)始了。
去年12月底,DeepSeek發(fā)布了V3模型。到了今年3月24日,官方發(fā)布公告稱對(duì)V3進(jìn)行了一次升級(jí)。
于是人們開(kāi)始推測(cè),在V3-0324已經(jīng)取得明顯進(jìn)步的情況下,是不是可以用它來(lái)訓(xùn)練R2模型。
并且聯(lián)想到R1是在初代V3一個(gè)月之后發(fā)布,當(dāng)時(shí)人們按照這一節(jié)奏預(yù)測(cè)R2大概率將在4月上線。
4月底,坊間開(kāi)始瘋傳一組R2的泄露參數(shù):1.2T萬(wàn)億參數(shù),5.2PB訓(xùn)練數(shù)據(jù),高效利用華為昇騰芯片……有板有眼讓人難辨真假。

而DeepSeek這邊,最近的更新還是端午節(jié)前的新版R1——DeepSeek-R1-0528。
至于我們什么時(shí)候能真的迎來(lái)R2,還是讓子彈再飛一會(huì)兒。
但有Llama4趕工翻車(chē)的前車(chē)之鑒,“好事多磨”也未嘗不是一種不錯(cuò)的選擇。
參考鏈接:
[1]https://x.com/legit_api/status/1940515133878620254
[2]https://x.com/AiBattle_/status/1940532050286858388