新版Claude曝光:“極限推理”成最大亮點(diǎn)
預(yù)計(jì)未來幾周發(fā)布
金磊 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
O家(OpenAI)剛免費(fèi)上線GPT-4.1,A家(Anthropic)這邊也被曝出新消息——
新版Claude Sonnet和Claude Opus,已經(jīng)在路上了!

這一消息來自The Information,根據(jù)它的說法,新版模型最大的亮點(diǎn),就是“極限推理”(Extreme reasoning)。
簡單來說,這個(gè)新功能是通過在推理和工具使用之間建立動(dòng)態(tài)循環(huán),能夠更智能地處理問題。
預(yù)計(jì)新版模型將在未來幾周內(nèi)發(fā)布。

接下來,我們深入了解一下這個(gè)新功能。
可以“極限推理”的Claude
正如剛才我們提到的,這個(gè)功能并不是簡單地回答問題。
例如模型在遇到困難時(shí)不會直接給出答案,而是會暫停、重新評估問題,并在必要時(shí)調(diào)整策略。
而且類似人類思考的過程,如果模型發(fā)現(xiàn)自己陷入困境或答案不準(zhǔn)確,它會自動(dòng)調(diào)整方向。
對于生成代碼的任務(wù),模型會自動(dòng)測試生成的代碼,并在發(fā)現(xiàn)錯(cuò)誤時(shí)進(jìn)行修正,而不是簡單地輸出結(jié)果。

從曝光的特性來看,新模型的架構(gòu)更加適應(yīng)不同的任務(wù)和場景,減少了對人類監(jiān)督的依賴。
模型能夠結(jié)合上下文進(jìn)行深度反思,而不僅僅是基于統(tǒng)計(jì)的語言生成。
這種協(xié)作式推理,讓新模型更接近于人類協(xié)作者的思維方式,能夠像人類一樣進(jìn)行推理,而不僅僅是作為“計(jì)算器”。
不過畢竟爆料,有網(wǎng)友對此持懷疑態(tài)度,認(rèn)為有炒作的嫌疑。
但也有網(wǎng)友回應(yīng)稱,這是來自The Information的消息,還是比較靠譜的信源。

確實(shí)有個(gè)新模型在實(shí)測了
除了這個(gè)信源之外,也有網(wǎng)友陸續(xù)發(fā)出一些實(shí)測的證據(jù)。
他們發(fā)現(xiàn)了Claude在偷偷實(shí)測一個(gè)叫做Claude Neptune的模型,并且稱它“疑似是Claude 3.8”(最大tokens數(shù)達(dá)到了128k)。

而Anthropic這邊,官方也發(fā)布了一項(xiàng)正在進(jìn)行的計(jì)劃,稱是“對更新版本進(jìn)行壓力測試”。

對于新版Claude的模型,我們可以期待一波了~
參考鏈接:
[1]https://x.com/kimmonismus/status/1922664649213771807
[2]https://x.com/chetaslua/status/1922488051336401401
[3]https://x.com/bindureddy/status/1922655363599389053
[4]https://www.theinformation.com/articles/anthropics-upcoming-models-will-think-think
- 商湯林達(dá)華萬字長文回答AGI:4層破壁,3大挑戰(zhàn)2025-08-12
- 商湯多模態(tài)大模型賦能鐵路勘察設(shè)計(jì),讓70年經(jīng)驗(yàn)“活”起來2025-08-13
- 以“具身智能基座”為核,睿爾曼攜全產(chǎn)品矩陣及新品亮相2025 WRC2025-08-11
- 哇塞,今天北京被機(jī)器人人人人人塞滿了!2025-08-08