Claude加速上新:基礎(chǔ)版數(shù)學(xué)編程雙提升,「幻覺」也更少,CEO:兩三年內(nèi)AI將成高知人類
Claude Instant推出1.2版
西風(fēng) 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
“ChatGPT最強競品”Claude基礎(chǔ)版上新——
更輕、更快、價格只要Claude 2六分之一的Claude Instant推出1.2版本。
在這次更新中,官方提到基礎(chǔ)版Claude Instant吸納了高性能型號Claude 2的優(yōu)勢,編碼、數(shù)學(xué)能力經(jīng)測試比原來提升近六個百分點。
是加量不加價的感覺了(手動狗頭)。

目前,全新Claude Instant 1.2已可申請通過API部署,一起來康康都做了哪些更新。
更快,更便宜
具體來說,Claude Instant 1.2在編碼、推理等方面的能力有所提升。不僅能生成更長、結(jié)構(gòu)更好的回復(fù),還能更好地遵循格式化指令,在引用提取、多語言能力和問答方面也有了一些改進。

在Codex評估(編碼性能測試)中,Claude Instant 1.2達到58.7%,而1.1版本為52.8%。
在GSM8K基準(zhǔn)測試(數(shù)學(xué)能力測試)中,同樣提高了近六個百分點,1.2版本得分為86.7%,1.1版本的得分為80.9%。

△Claude Instant 1.1和1.2的性能比較
此外,Claude Instant 1.2還提高了安全性,產(chǎn)生“幻覺”更少,對“越獄”的抵抗力更強。

△Claude不同模型安全性評估,越低越好
在上下文窗口長度上,Claude Instant 1.2與Claude 2相同,都是10萬token,相當(dāng)于75000個單詞,差不多是一本《了不起的蓋茨比》的長度。
再來看看買下這些功能要花多少錢,Claude Instant系列定價比Claude 2便宜,但都是分輸入和輸出兩部分定價。
Claude Instant的Prompt定價是每100萬token 1.63美元,Completion定價是每100萬token 5.51美元:

挑戰(zhàn)OpenAI
Claude背后公司為Anthropic,想必大家也不陌生了。
Anthropic由OpenAI前研究副總裁Dario Amodei帶頭于2021年成立。

離開OpenAI時,Dario Amodei可謂帶走了一批核心人才,這里面就包括GPT-3首席工程師Tom Brown,也有OpenAI安全和政策副總裁Daniela Amodei(Dario的姐姐)。
眼下,Anthropic曾表示目標(biāo)是建立一個“前沿模型”,會比當(dāng)今最強的AI再強10倍,并認為這是“AI自學(xué)的下一代算法”(next-gen algorithm for AI self-teaching)。這個前沿模型可用于構(gòu)建虛擬助手,回復(fù)電子郵件,進行研究,生成藝術(shù)品、書籍等。
目前Anthropic已融資14.5億美元,但這還遠遠不夠,他們預(yù)計未來兩年內(nèi)需要50億美元用于AI研發(fā)。
最近Dario Amodei也公開表示:
讓模型像一個受過良好教育的人,可能離我們并不遙遠,我認為在兩三年內(nèi)就有可能實現(xiàn)。

外媒TechCrunch認為,Anthropic現(xiàn)在推出新版Claude Instant是為了與OpenAI以及Cohere、AI21 Labs等初創(chuàng)公司提供的類似基礎(chǔ)產(chǎn)品競爭。
Anthropic目前擁有眾多客戶和合作伙伴,其中就包括“美國知乎”Quora。
雖然,Claude Instant 1.2目前只有API版本,但在Quora旗下的Poe.com上大家可以免費試用Claude Instant。
參考鏈接:
[1]https://twitter.com/karinanguyen_/status/1689318903670063104
[2]https://twitter.com/_akhaliq/status/1689334269137543173
[3]https://techcrunch.com/2023/08/09/anthropic-launches-improved-version-of-its-entry-level-llm/
- 多人有聲視頻一體化生成!用百度最新AI生成營銷視頻,現(xiàn)在1.4元/5秒2025-08-22
- 馬斯克一覺醒來,Space X在京開賣了2025-08-21
- 離譜!現(xiàn)在的Agent都卷成100個成團了?3分鐘并行干完5個復(fù)雜任務(wù),還能隨時改需求2025-08-18
- 國家級AI創(chuàng)新應(yīng)用賽事殺瘋了!超200萬元獎金池+全場景賽道,沖線團隊速來2025-08-15