AI視頻生成
CVPR2025視頻生成統(tǒng)一評估架構(gòu),上交x斯坦福聯(lián)合提出讓MLLM像人類一樣打分
能夠通過模擬人類的認(rèn)知過程,建立起連接文本指令與視覺內(nèi)容的智能評估體系。
英偉達(dá)讓機器人「做夢學(xué)習(xí)」,靠夢境實現(xiàn)真·從0泛化
利用AI視頻世界模型生成神經(jīng)軌跡,學(xué)會執(zhí)行22種新任務(wù)
復(fù)旦視頻擴散模型綜述:覆蓋300+文獻(xiàn),探討近期研究趨勢與突破,Github攬星2k+
擴散模型在視頻生成、編輯及理解等前沿領(lǐng)域的進(jìn)展
港大字節(jié)最新視頻生成模型刷屏!網(wǎng)友直接RIP市場營銷,Sora也不香了
校正流Transformer拿下新SOTA
ControlNet作者新項目爆火:僅一張圖生成25秒繪畫全過程!不到一天GitHub攬星600+
勾線/上色/調(diào)色都有
靠Scaling Laws煉出4D版視頻生成模型,多倫多大學(xué)北交大等攜手開源81K高質(zhì)量數(shù)據(jù)集
81K高質(zhì)量數(shù)據(jù)集已開源
英偉達(dá)投的Sora競品免費了!網(wǎng)友擠爆服務(wù)器,120秒120幀支持墊圖
團(tuán)隊之前還做了文本3D生成模型