国产冒白浆视频,抱着cao才爽免费视频,胸大美女又大又黄的网站,中文国产日韩欧美二视频,亚洲日本国产综合高清,又大又粗又硬又硬免费日批视频 ,国产二区不卡自拍,777免费人成影院,亚洲成AⅤ人网站,香蕉网站永久在线视频

1.93bit版DeepSeek-R1編程超過Claude 4 Sonnet，不用GPU也能運(yùn)行

克雷西 2025-06-10 12:58:43 來源：量子位

作者自己也震驚了

克雷西發(fā)自凹非寺
量子位 | 公眾號(hào) QbitAI

1.93bit量化之后的 DeepSeek-R1（0528），編程能力依然能超過Claude 4 Sonnet？

最新優(yōu)化版R1在編程榜單aider上取得了60%的成績，不僅超過了Claude 4 Sonnet的56.4分，也超過了1月版的滿血R1。

并且aider是一個(gè)接近現(xiàn)實(shí)軟件工程任務(wù)的榜單，不是靠做題就能取勝。

△圖中R1為一月份的0120滿血版

體積方面，相比8bit原始版，這個(gè)1.93bit版本，文件大小降低了70%以上。

看到如此輕量級(jí)的版本能有這樣的表現(xiàn)，連作者本人都感到震驚。

而R1-0528的滿血版在aider上則是取得了71.4分，超過了不開啟思考的Claude 4 Opus。

量化版R1，不用GPU也能跑

這個(gè)量化版本來自Unsloth工作室，從1.66到5.5bit，Unsloth一共制作了9個(gè)量化版本。

最小的1.66bit版，gguf文件大小僅162GB，比8bit版減小了近80%，1.93bit版也減小了70%。

按照Unsloth的說法，較小的版本沒顯卡也能跑，比如1.x級(jí)中間的1.78bit版本搭配64GB內(nèi)存，每秒可以跑1個(gè)token。

如果放進(jìn)24GB顯存的顯卡（比如3090），搭配128GB內(nèi)存可以跑到每秒5個(gè)token。

不過Unsloth還是推薦至少180GB的統(tǒng)一內(nèi)存，或者RAM和顯存加起來超過180GB也可以，這樣速度可以提到每秒5個(gè)token以上。

對(duì)于其他版本，也給出了簡單的計(jì)算方式——內(nèi)存和顯存加起來（或統(tǒng)一內(nèi)存）不低于下載的文件大小。

在眾多版本當(dāng)中，為了實(shí)現(xiàn)更好的大小與精度平衡，Unsloth更建議使用2.4bit和2.7bit的版本。

說完R1的這些量化版本，再來看看制作它們的Unsloth。

團(tuán)隊(duì)主要工作就是微調(diào)模型使其更高效運(yùn)行，除了DeepSeek，阿里的Qwen、微軟的Phi，還有Mistral、Llama也都被這個(gè)團(tuán)隊(duì)微調(diào)過。

這些模型當(dāng)中，內(nèi)存占用最少降低了一半，速度最少提升50%。

并且團(tuán)隊(duì)的GitHub倉庫擁有4萬多星標(biāo)。

另外Unsloth這次還推出了用R1-0528蒸餾的Qwen3-8B模型，據(jù)介紹可以達(dá)到與Qwen3-235B相同的性能，并且“幾乎可以適應(yīng)任何配置”。

R1-0528打游戲超越o4-mini

說完量化，再看看R1本身。

一個(gè)名為Hao AI Lab的機(jī)構(gòu)推出了一套讓大模型玩人類游戲的評(píng)測基準(zhǔn)Lmgame Bench，并公布了R1-0528取得的成績。

這套基準(zhǔn)一共包含了六款游戲——俄羅斯方塊、2048、推箱子、馬里奧兄弟、逆轉(zhuǎn)裁判和糖果傳奇。

其中，和1月的版本比較，0528在俄羅斯方塊上的提升非常明顯。

如果和其他家模型相比，0528的俄羅斯方塊成績超過了o4-mini，僅次于o3。

直觀感受就是，四個(gè)模型同時(shí)開始游戲，而R1-0528堅(jiān)持到了最后。

除了俄羅斯方塊，R1-0528在推箱子、2048和糖果傳奇上的表現(xiàn)也大幅超過1月版本，在糖果傳奇中還名列前茅，僅次于最強(qiáng)的o3。

其中，2048、推箱子和俄羅斯方塊一樣，評(píng)價(jià)方法是看誰最后Game Over。

這里官方只展示了R1和Qwen的可視化對(duì)比。

而糖果傳奇則是在規(guī)定的步數(shù)內(nèi)看誰的得分最多，R1-0528取得了548分，領(lǐng)先o4-mini近20分。

你覺得R1還能挑戰(zhàn)哪些人類游戲呢？

參考鏈接：
[1]https://aider.chat/docs/leaderboards/
[2]https://docs.unsloth.ai/basics/deepseek-r1-0528-how-to-run-locally
[3]https://x.com/haoailab/status/1929997363407708646

版權(quán)所有，未經(jīng)授權(quán)不得以任何形式轉(zhuǎn)載及使用，違者必究。

Deepseek 量化

克雷西

相關(guān)閱讀

DeepSeek無問西東！先行者早已趟平全國產(chǎn)之路

“通用人工智能是一場需要聚精會(huì)神的長跑”

白交2025-02-07

Deepseek 大模型科大訊飛

GPT-4.5馬上發(fā)布，GPT-5免費(fèi)暢聊！奧特曼劇透大動(dòng)作，網(wǎng)友：讓DeepSeek整破防了

o系列和 GPT系列將合并統(tǒng)一

衡宇2025-02-13

Deepseek GPT-5 OpenAI

DeepSeek華為火線聯(lián)手！硅基流動(dòng)首發(fā)即限流，全國產(chǎn)API白菜價(jià)，零門檻部署

價(jià)格/性能/速度均持平原版

衡宇2025-02-02

API Deepseek 華為硅基流動(dòng)

DeepSeek開源第三彈：V3/R1訓(xùn)練推理關(guān)鍵秘籍，核心代碼僅300行

網(wǎng)友：我的英偉達(dá)股票啊……

十三2025-02-26

Deepseek DeepSeek R1 DeepSeek V3 開源

DeepSeek沖擊之下，大模型六小強(qiáng)如何「回應(yīng)」？

東方深海巨鯨，攪動(dòng)全球大模型風(fēng)云

衡宇2025-02-16

Deepseek 大模型六小強(qiáng)

DeepSeek下棋靠忽悠贏了ChatGPT，網(wǎng)友：孫子兵法都用上了

各種名場面誕生，還沖上熱搜

一水2025-02-08

Deepseek

国产冒白浆视频,抱着cao才爽免费视频,胸大美女又大又黄的网站,中文国产日韩欧美二视频,亚洲日本国产综合高清,又大又粗又硬又硬免费日批视频 ,国产二区不卡自拍,777免费人成影院,亚洲成AⅤ人网站,香蕉网站永久在线视频

1.93bit版DeepSeek-R1編程超過Claude 4 Sonnet，不用GPU也能運(yùn)行

△圖中R1為一月份的0120滿血版

量化版R1，不用GPU也能跑