編碼數(shù)學(xué)擊敗GPT4-Turbo!DeepSeek-Coder-v2登頂競(jìng)技場(chǎng)最強(qiáng)開(kāi)源編碼模型
支持338種編程語(yǔ)言
就在剛剛,競(jìng)技場(chǎng)排名再次刷新:
深度求索DeepSeek-Coder-v2成競(jìng)技場(chǎng)最強(qiáng)開(kāi)源編碼模型!
它在Coding Arena中已攀升至第4名,水平接近GPT-4-Turbo。
在編碼領(lǐng)域的整體性能評(píng)估中,DeepSeek-Coder-v2的評(píng)分和穩(wěn)定性均位于前10,超越智譜GLM-4、Llama-3等一眾知名開(kāi)源模型。
據(jù)了解,完全開(kāi)源的DeepSeek-Coder-v2現(xiàn)提供236B和16B兩種參數(shù)規(guī)模,支持338種編程語(yǔ)言和128K上下文長(zhǎng)度。
而且就在Claude 3.5 Sonnet發(fā)布同日,深度求索官網(wǎng)的代碼助手也第一時(shí)間上線了和“Artifacts”類(lèi)似的功能(自動(dòng)生成代碼并直接在瀏覽器上運(yùn)行)。
比如由DeepSeek-Coder-v2直接生成經(jīng)典游戲——掃雷。
(提示詞:用html實(shí)現(xiàn)復(fù)雜一點(diǎn)的掃雷游戲,數(shù)字顏色分明,有計(jì)時(shí),有重啟按鈕)
再比如設(shè)計(jì)網(wǎng)頁(yè):
總之,DeepSeek-Coder-v2尤為擅長(zhǎng)編碼和數(shù)學(xué)。
編碼、數(shù)學(xué)擊敗GPT4-Turbo
深度求索于上周發(fā)布了DeepSeek-Coder-v2,它在編碼和數(shù)學(xué)方面擊敗了GPT4-Turbo。
在Arena-Hard-Auto排行榜上,DeepSeek-Coder-v2超過(guò)了Yi-large、Claude3-Opus、GLM-4 和Qwen2-72B。
同時(shí),DeepSeek-Coder-v2還具有良好的通用性能,在推理和中英通用能力上位列國(guó)內(nèi)第一梯隊(duì)。
當(dāng)時(shí)甚至有網(wǎng)友怒贊:
DeepSeek-Coder-v2目前位居Aider代碼編輯排行榜榜首(僅用了4天),領(lǐng)先于GPT-4o和Opus。
它的基準(zhǔn)測(cè)試結(jié)果甚至比DeepSeek官方圖表中顯示的更好。
而現(xiàn)在,僅過(guò)去一周時(shí)間,DeepSeek-Coder-v2正式登頂競(jìng)技場(chǎng)最強(qiáng)開(kāi)源編碼模型。
隨著這一登頂,其背后的公司深度求索再次引人關(guān)注。
老實(shí)說(shuō),這家公司一直很有看點(diǎn)。
與月之暗面、智譜AI、Minimax、百川智能等獲得大廠投資的AI初創(chuàng)公司不同,深度求索由一家搞私募量化的投資基金發(fā)起。
當(dāng)同行都在尋找AI應(yīng)用落地時(shí),深度求索卻喊出了“不做應(yīng)用做研究”的口號(hào)。
短短半年時(shí)間,它發(fā)布并開(kāi)源了多個(gè)百億級(jí)參數(shù)的大模型。
甚至僅憑一己之力點(diǎn)燃了大模型價(jià)格戰(zhàn)的第一把火。
具體啥情況?接下來(lái)一起扒一扒。
“價(jià)格戰(zhàn)導(dǎo)火索”深度求索
深度求索由知名私募巨頭幻方量化于2023年4月創(chuàng)立。
早在2019年,幻方就發(fā)布了自研深度學(xué)習(xí)訓(xùn)練平臺(tái)“螢火一號(hào)”。
據(jù)稱(chēng)該項(xiàng)目總投資近2億元,共搭載了1100塊GPU。
后來(lái)“螢火一號(hào)”升級(jí)為“二號(hào)”,搭載的GPU數(shù)則達(dá)到了約1萬(wàn)張。
這意味著,單從算力看,幻方甚至比很多大廠都更早拿到了做ChatGPT的入場(chǎng)券。
去年11月,深度求索發(fā)布第一代大模型DeepSeek Coder,免費(fèi)商用,完全開(kāi)源。
緊接著12月,它又發(fā)布了參數(shù)670億的DeepSeek,主打發(fā)布即開(kāi)源。
今年5月初,深度求索宣布開(kāi)源第二代MoE大模型DeepSeek-V2。
沒(méi)錯(cuò),就是那個(gè)“性能比肩GPT-4 Turbo,價(jià)格卻只有GPT-4僅百分之一”的模型。
DeepSeek-V2推出后,深度求索一度被AI圈稱(chēng)作“價(jià)格屠夫”,被認(rèn)為是引爆大模型價(jià)格戰(zhàn)的導(dǎo)火索之一。
此外,它還推出了專(zhuān)為視覺(jué)與語(yǔ)言理解應(yīng)用設(shè)計(jì)的DeepSeek-VL系列大模型。
總之,這家公司一直被視為一匹可能改變國(guó)內(nèi)AI市場(chǎng)格局的“黑馬”。
Anthropic聯(lián)合創(chuàng)始人Jack Clark曾表示:
DeepSeek組建了一支團(tuán)隊(duì),他們對(duì)訓(xùn)練雄心勃勃的模型所需的基礎(chǔ)設(shè)施有著深刻的理解。中國(guó)制造也將成為AI模型的發(fā)展趨勢(shì)。
最后,面對(duì)競(jìng)技場(chǎng)最新排名,網(wǎng)友們紛紛猜測(cè)新王Claude 3.5 Sonnet在編碼上究竟表現(xiàn)如何?
競(jìng)技場(chǎng):在更了!在更了!
- 美國(guó)專(zhuān)家來(lái)中國(guó)轉(zhuǎn)了一圈:AI比賽已經(jīng)結(jié)束了2025-08-19
- 一張圖0.1秒生成上半身3D化身!清華IDEA新框架入選ICCV 20252025-08-21
- “半路截胡”張益唐,北大出身的中山大學(xué)校長(zhǎng)這樣做2025-08-21
- 一周六連發(fā)!昆侖萬(wàn)維將多模態(tài)AI卷到了新高度2025-08-17