開源
實(shí)測(cè)DeepSeek V3.1,不止拓展上下文長(zhǎng)度
擊敗Claude成非推理模型SOTA,但價(jià)格便宜68倍
字節(jié)Seed開源長(zhǎng)線記憶多模態(tài)Agent,像人一樣能聽會(huì)看
放在具身智能上豈不是長(zhǎng)腦子了
Qwen緊追OpenAI開源4B端側(cè)大模型,AIME25得分超越Claude 4 Opus
“這下沒人談?wù)揙penAI昨天開源了啥”
訓(xùn)練時(shí)間減半,性能不降反升!騰訊混元開源圖像生成高效強(qiáng)化方案MixGRPO
一種結(jié)合了SDE和ODE采樣的新型訓(xùn)練框架
凝聚開源共識(shí),第三屆杭州產(chǎn)投融生態(tài)大會(huì)在杭召開
正式發(fā)布科創(chuàng)企業(yè)服務(wù)平臺(tái)“杭州E站”
AI版三個(gè)臭皮匠!ChatGPT/Gemini/DeepSeek合體拿下AGI測(cè)試最高分
開源方法使多個(gè)LLM同時(shí)處理問題
DeepSeek推理最高提速6倍!開源研究:加裝「思維進(jìn)度條」,計(jì)算量減少30%
監(jiān)控和控制LLM中的思考路徑長(zhǎng)度
性能提升84%-166%!L-Zero僅靠強(qiáng)化學(xué)習(xí)解鎖大模型探索世界的能力 | 已開源
展現(xiàn)了通往更高級(jí)通用智能的清晰路徑