數(shù)學(xué)推理
讓Qwen2.5 7B超越o1,微軟干的!MSRA推出小模型數(shù)學(xué)推理自我進(jìn)化新方法
共同一作為MSRA實(shí)習(xí)生、北大er
GPT-4o數(shù)學(xué)能力跑分直掉50%,上海AI Lab開始給大模型重新出題了
最強(qiáng)推理模型o1-mini也會(huì)下降3成6
大模型版“5年高考3年模擬”來了!6141道數(shù)學(xué)題,還是多模態(tài)的那種|微軟&UCLA&UW聯(lián)合出品
附帶12個(gè)大模型112頁“試題”分析