推理大模型
視頻推理界的“福爾摩斯測(cè)試”:所有大模型,統(tǒng)統(tǒng)不及格 | 論文代碼開(kāi)源
ARC Lab + 香港城市大學(xué)
推理大模型1年內(nèi)就會(huì)撞墻,性能無(wú)法再擴(kuò)展幾個(gè)數(shù)量級(jí) | FrontierMath團(tuán)隊(duì)最新研究
面對(duì)數(shù)據(jù)限制/泛化能力/研發(fā)成本等多重挑戰(zhàn)
網(wǎng)易有道全面擁抱DeepSeek-R1,推理大模型加速個(gè)性化教學(xué)升級(jí)
加速AI教育應(yīng)用商業(yè)化落地
新研究揭示DeepSeek弱點(diǎn):頻繁切換思路欠思考,最短答案往往就對(duì)
國(guó)內(nèi)外兩支團(tuán)隊(duì)同時(shí)發(fā)現(xiàn)