AI推理
DeepSeek讓英偉達H20都被瘋搶,但AI推理爆發(fā)不只靠囤卡
超大規(guī)模集群不再是必需,小集群甚至單機,將是未來AI Infra的主要特性。
DeepSeek版o1炸場,數(shù)學代碼超越OpenAI,每天免費玩50次,后續(xù)將開源
新Scaling Laws是真的,計算時間越長,表現(xiàn)越強
OpenAI-o1思考替代法火了!焦劍濤高徒一作提出思考偏好優(yōu)化,不限于推理任務
兩種思考提示模板,無需額外人工標注數(shù)據(jù)