国产冒白浆视频,抱着cao才爽免费视频,胸大美女又大又黄的网站,中文国产日韩欧美二视频,亚洲日本国产综合高清,又大又粗又硬又硬免费日批视频 ,国产二区不卡自拍,777免费人成影院,亚洲成AⅤ人网站,香蕉网站永久在线视频

谷歌AI獲IMO“唯一金牌”，硅谷夾道祝賀，奧特曼丟人又丟人

克雷西 2025-07-22 09:38:24 來源：量子位

馬斯克發(fā)推祝賀

克雷西發(fā)自凹非寺
量子位 | 公眾號 QbitAI

谷歌Gemini拿下了IMO金牌，而且是官方認(rèn)證的那種。

經(jīng)過IMO官方裁判評分，Gemini新模型答對了6道題中的5道，以35分的成績斬獲金牌。

斬獲金牌的是Gemini的一個進階版本，搭載了新的思考模式，后期會開放給Google AI Ultra訂閱用戶——也就月付1400元那種。

去年三天摘銀，今年4.5小時奪金，DeepMind的數(shù)學(xué)成績可以說是突飛猛進。

除了DeepMind CEO哈薩比斯、谷歌CEO劈柴哥給團隊發(fā)來賀電，馬斯克也發(fā)推表示了祝賀。

DeepMind這波可謂是被各界夾道祝賀，做得體面又周到。

但DeepMind被夸得越好，OpenAI就越發(fā)相形見絀，同樣是AI參賽IMO，秘密搞事情也就算了，還為了營銷跟人類青少年搶風(fēng)頭。

奧特曼治下的OpenAI，最近除了丟人就丟人了。

DeepMind官宣AI拿下IMO金牌

DeepMind公告顯示，Gemini新模型做對了今年IMO六道題中的五道，獲得了35分。

并且這一成績，也獲得了IMO主席Gregor Dolinar的親自認(rèn)證：

我們可以確認(rèn)，谷歌DeepMind已達到人們夢寐以求的里程碑，獲得了35分（滿分42分）——堪稱金牌。
他們的解決方案在很多方面都令人驚嘆。IMO評分員認(rèn)為這些解決方案清晰、精準(zhǔn)，而且大多數(shù)都易于理解。

不僅評分遵循IMO未公開的規(guī)則，所用時間標(biāo)準(zhǔn)也和人類選手完全一致——4.5小時之內(nèi)答完交卷。

而去年DeepMind的銀牌成績，是用AlphaProof和AlphaGeometry一起做了三天才獲得的。

這次不僅用時更短，答題過程也是全程自然語言、端到端完成，不再像去年那樣專門修改題目格式。

DeepMind高級科學(xué)家兼IMO團隊負責(zé)人Thang Luong表示，這與去年相比是一個范式轉(zhuǎn)變。

此外，DeepMind研究員、布朗大學(xué)教授Junehyuk Jung介紹，在今年的第三題中，很多人類選手使用了研究生水平的方案（IMO為高中競賽），但Gemini僅使用了初等數(shù)論知識就給出了自洽的證明。

Jung還表示，Gemini沒答對的最后一題，是一開始方向就錯了，不過人類選手中做對這道題的也只有五個人。

順便說一下，谷歌已經(jīng)將Gemini做對的五道題的答案完整公開（鏈接見文末），有興趣的話可以驗證一下~

這次DeepMind用來參賽的，是一款暫未公開的全新模型，搭載了Deep Think推理模式。

DeepMind介紹，Gemini Deep Think是一種針對復(fù)雜問題的增強型推理模式，融合了其最新的一些研究技術(shù)，包括并行思維。

這種模式使模型能夠同時探索并組合多種可能的解決方案，最終得出最終答案，而不是追求單一的線性思維鏈。

為了充分利用Deep Think的推理能力，DeepMind額外訓(xùn)練了 Gemini 的這一版本，使其能夠利用更多多步推理、問題求解和定理證明數(shù)據(jù)。

此外DeepMind還為Gemini提供了精選的高質(zhì)量數(shù)學(xué)題庫，并在其指令中添加了一些關(guān)于如何解答IMO題目的通用提示和技巧。

如哈薩比斯所說，該模型已經(jīng)提供給數(shù)學(xué)家等人群進行小范圍測試，后續(xù)會開放給Google AI Ultra訂閱用戶使用。

當(dāng)然，DeepMind今天的官宣，也是獲得了各種稱贊。

DeepMind宣布成績，被硅谷夾道歡迎

包括來自友商的稱贊在內(nèi)，DeepMind獲得了整個硅谷的夾道歡迎。

除了開頭馬斯克那句簡單的Congrats之外，還有Meta AI科學(xué)家稱贊Gemini給出了清晰、精準(zhǔn)、非常適合自學(xué)的解決方案。

受歡迎的原因，不僅是表現(xiàn)優(yōu)秀，也包括谷歌對IMO規(guī)則的尊重。

Gemini參加挑戰(zhàn)是受到了IMO官方邀請，所有規(guī)則標(biāo)準(zhǔn)都和人類一致。

并且，DeepMind也遵守了IMO官方的要求，沒有急于宣布結(jié)果。

仔細研究哈薩比斯的推文，只字未提OpenAI，但又處處在針對OpenAI。

哈薩比斯的三條回復(fù)，主要強調(diào)了這么幾點：官宣是沒有搶跑的，成績是IMO認(rèn)證的，模型也是未來可用的。

這三點，剛好和搶先宣布奪金結(jié)果被錘的OpenAI形成了鮮明對比。

IMO評審團和協(xié)調(diào)員們普遍認(rèn)為，AI開發(fā)商在IMO期間（尤其是閉幕式之前）宣布成績是“粗魯且不恰當(dāng)?shù)摹薄?/p>

除了公告發(fā)布時間的問題，OpenAI到底得沒得金牌也有爭議。

領(lǐng)導(dǎo)DeepMind超級推理團隊的Thang Luong補充，IMO內(nèi)部其實有一份官方評分指南，外部無法獲取。沒有基于該指南的評分就沒有資格獲得獎牌。

這屆IMO共6道題，每題7分。金牌線35分，OpenAI自報的成績也剛剛過線，即使是解答過程中微小的扣分都可能讓OpenAI從金牌跌到銀牌。

有網(wǎng)友評價：OpenAI一如既往的為了炒作什么都干得出來。沒有官方分?jǐn)?shù)，沒有耐心，也沒有羞恥心。

此外，OpenAI參賽用的模型也是未公開版本，并且可能以后也不會公開。

總之是處處和谷歌對比鮮明。

OpenAI研究員回應(yīng)質(zhì)疑

針對以上這些質(zhì)疑，OpenAI研究員Noam在給谷歌送出祝福后，也順帶進行了回應(yīng)：

首先，Noam解釋OpenAI沒和IMO官方合作不是沒收到邀請，而是OpenAI自己拒絕了。

其次是關(guān)于作答過程和評分的權(quán)威性，Noam表示沒有使用RAG或者任何工具，而打分是由3位IMO獲獎?wù)呓o出的。

同時Noam還公開了OpenAI模型的回答，表示任何人都可以檢查。

最后是關(guān)于宣發(fā)時間，Noam表示公布成績之前和IMO董事會成員進行過溝通，后者要求等到頒獎儀式之后再發(fā)布，OpenAI表示接受。

而OpenAI官宣的時間是在太平洋時間凌晨1點，彼時頒獎已經(jīng)結(jié)束，OpenAI沒有被要求需要等到更晚的時間再發(fā)布。

雖然Noam的解釋獲得了部分網(wǎng)友的認(rèn)可，但說一千道一萬，網(wǎng)友還是表示傾向于站在谷歌這一邊。

總之最近的OpenAI，除了丟人還是丟人。

小扎磨刀霍霍，奧特曼人丟了。

谷歌同場競技，奧特曼丟人了。

Gemini回答：
https://storage.googleapis.com/deepmind-media/gemini/IMO_2025.pdf
OpenAI回答：
https://github.com/aw31/openai-imo-2025-proofs/
參考鏈接：
[1]https://deepmind.google/discover/blog/advanced-version-of-gemini-with-deep-think-officially-achieves-gold-medal-standard-at-the-international-mathematical-olympiad/
[2]https://arstechnica.com/ai/2025/07/google-deepmind-earns-gold-in-international-math-olympiad-with-new-gemini-ai/
[3]https://x.com/demishassabis/status/1947337615054671882
[4]https://x.com/polynoamial/status/1947398531259523481

版權(quán)所有，未經(jīng)授權(quán)不得以任何形式轉(zhuǎn)載及使用，違者必究。

克雷西

国产冒白浆视频,抱着cao才爽免费视频,胸大美女又大又黄的网站,中文国产日韩欧美二视频,亚洲日本国产综合高清,又大又粗又硬又硬免费日批视频 ,国产二区不卡自拍,777免费人成影院,亚洲成AⅤ人网站,香蕉网站永久在线视频

谷歌AI獲IMO“唯一金牌”，硅谷夾道祝賀，奧特曼丟人又丟人

DeepMind官宣AI拿下IMO金牌

DeepMind宣布成績，被硅谷夾道歡迎

OpenAI研究員回應(yīng)質(zhì)疑

相關(guān)閱讀

Sora三巨頭首次解密幕后信息，CTO：最快年內(nèi)開放

GPT-4.5登頂6小時即失守！Grok-3上演1分逆襲

突發(fā)！谷歌發(fā)布史上最強大模型Gemini，打爆GPT-4

o3并非獨門秘技，谷歌已發(fā)背后關(guān)鍵機制，方法更簡單、成本更低

DeepSeek加持，北大通院幾何模型達IMO金牌水平！32個CPU核心和1塊4090就能實現(xiàn)滿血解題

o3數(shù)學(xué)成績作弊大瓜！提前讓測試機構(gòu)給真題，60多名數(shù)學(xué)大牛全被蒙在鼓里

熱門文章

谷歌版小鋼炮開源！0.27B大模型，4個注意力頭，專為終端而生

文遠知行獲Grab投資數(shù)千萬美元，雙方將合作在東南亞大規(guī)模部署Robotaxi

百度AICA第9期開課：18大行業(yè)96位首席AI架構(gòu)師齊探AI產(chǎn)業(yè)落地

國家級AI創(chuàng)新應(yīng)用賽事殺瘋了！超200萬元獎金池+全場景賽道，沖線團隊速來

GPT-5超越人類醫(yī)生！推理能力比專家高出24%，理解力強29%

国产冒白浆视频,抱着cao才爽免费视频,胸大美女又大又黄的网站,中文国产日韩欧美二视频,亚洲日本国产综合高清,又大又粗又硬又硬免费日批视频 ,国产二区不卡自拍,777免费人成影院,亚洲成AⅤ人网站,香蕉网站永久在线视频

谷歌AI獲IMO“唯一金牌”，硅谷夾道祝賀，奧特曼丟人又丟人

DeepMind官宣AI拿下IMO金牌

DeepMind宣布成績，被硅谷夾道歡迎

OpenAI研究員回應(yīng)質(zhì)疑

相關(guān)閱讀

Sora三巨頭首次解密幕后信息，CTO：最快年內(nèi)開放

GPT-4.5登頂6小時即失守！Grok-3上演1分逆襲

突發(fā)！谷歌發(fā)布史上最強大模型Gemini，打爆GPT-4

o3并非獨門秘技，谷歌已發(fā)背后關(guān)鍵機制，方法更簡單、成本更低

DeepSeek加持，北大通院幾何模型達IMO金牌水平！32個CPU核心和1塊4090就能實現(xiàn)滿血解題

o3數(shù)學(xué)成績作弊大瓜！提前讓測試機構(gòu)給真題，60多名數(shù)學(xué)大牛全被蒙在鼓里

熱門文章

谷歌版小鋼炮開源！0.27B大模型，4個注意力頭，專為終端而生

文遠知行獲Grab投資數(shù)千萬美元，雙方將合作在東南亞大規(guī)模部署Robotaxi

百度AICA第9期開課：18大行業(yè)96位首席AI架構(gòu)師齊探AI產(chǎn)業(yè)落地

國家級AI創(chuàng)新應(yīng)用賽事殺瘋了！超200萬元獎金池+全場景賽道，沖線團隊速來

GPT-5超越人類醫(yī)生！推理能力比專家高出24%，理解力強29%

谷歌AI獲IMO“唯一金牌”，硅谷夾道祝賀，奧特曼丟人又丟人

DeepMind宣布成績，被硅谷夾道歡迎

Sora三巨頭首次解密幕后信息，CTO：最快年內(nèi)開放

GPT-4.5登頂6小時即失守！Grok-3上演1分逆襲

突發(fā)！谷歌發(fā)布史上最強大模型Gemini，打爆GPT-4

o3并非獨門秘技，谷歌已發(fā)背后關(guān)鍵機制，方法更簡單、成本更低

DeepSeek加持，北大通院幾何模型達IMO金牌水平！32個CPU核心和1塊4090就能實現(xiàn)滿血解題

o3數(shù)學(xué)成績作弊大瓜！提前讓測試機構(gòu)給真題，60多名數(shù)學(xué)大牛全被蒙在鼓里

谷歌版小鋼炮開源！0.27B大模型，4個注意力頭，專為終端而生

文遠知行獲Grab投資數(shù)千萬美元，雙方將合作在東南亞大規(guī)模部署Robotaxi

國家級AI創(chuàng)新應(yīng)用賽事殺瘋了！超200萬元獎金池+全場景賽道，沖線團隊速來

GPT-5超越人類醫(yī)生！推理能力比專家高出24%，理解力強29%