掃碼關注量子位
最強版本450B MoE,激活參數(shù)35B
官方:大招還在后面
兼容SFT、RL訓練方法
ZeroSearch:一種無需與真實搜索引擎交互的強化學習框架
通義千問(Qwen-72B)表現(xiàn)搶眼,以73.6的綜合得分在所有預訓練模型中排名第一。
量子位 QbitAI 版權所有©北京極客伙伴科技有限公司 京ICP備17005886號-1