大模型推理
大模型結(jié)構(gòu)化推理優(yōu)勢難復(fù)制到垂直領(lǐng)域!最新法律AI評估標(biāo)準(zhǔn)來了,抱抱臉評測集趨勢第一
雖然LLM在推理類任務(wù)上進展顯著,但在更為復(fù)雜與微妙的法律領(lǐng)域,這類模型的實際表現(xiàn)仍然存在很大的未知和諸多疑問
清華&通院推出”絕對零”訓(xùn)練法,零外部數(shù)據(jù)大模型自我博弈解鎖推理能力
只在代碼環(huán)境中訓(xùn)練,數(shù)學(xué)能力也能提升
小模型越級挑戰(zhàn)14倍參數(shù)大模型,谷歌開啟Test-Time端新的Scaling Law
擴展模型測試時計算比擴展參數(shù)可能更有效