螞蟻持續(xù)發(fā)力AI研發(fā),24篇論文入選計算機視覺頂會CVPR2024
有13篇出自螞蟻技術研究院
當?shù)貢r間6月17日,為期5天的IEEE國際計算機視覺與模式識別會議(CVPR2024)在美國西雅圖舉辦。官方數(shù)據(jù)顯示,本屆會議共收到11532篇有效論文投稿,接收了其中2719篇,錄用率為23.6%,比例低于往年。
CVPR主辦方是IEEE,為全球計算機視覺三大頂會之一,迄今舉辦了40次會議。本屆會議螞蟻集團有24篇論文被收錄,其中一篇被組委會重點推薦(highlight)。24篇論文研究方向包括計算機視覺、深度學習、數(shù)字人、大模型等。
被組委會重點推薦的論文“用于時序一致性視頻處理的內容變形場”,提出了一種全新的視頻處理方法CoDeF,它能將視頻處理簡化為圖像處理。相較于傳統(tǒng)方法,CoDeF能夠實現(xiàn)跨幀一致性,跟蹤煙霧、水流等非剛性物體,支持各種圖像算法直接用于視頻處理。用戶只需要處理每個視頻對應的靜態(tài)規(guī)范圖像,通過形變場的變換,就可將圖像處理結果自然地沿著時間維度進行傳播,達到對整個視頻處理的目的,也因此保證了高度的時序一致性。
據(jù)了解,這二十余篇學術成果,有部分已經(jīng)在真實業(yè)務場景中落地應用。比如“面向地球觀測影像通用解譯的多模態(tài)遙感基礎模型”一文,介紹了螞蟻自研的多模態(tài)遙感基礎模型SkySense,它是迄今為止國際上參數(shù)規(guī)模最大、覆蓋任務最全、識別精度最高的多模態(tài)遙感基礎模型。在17 項國際權威測試場景中,SkySense 的指標全面超過國際同類產(chǎn)品。
目前,SkySense已應用于網(wǎng)商銀行的衛(wèi)星遙感風控系統(tǒng)“大山雀”,可精準識別和捕捉20多種農(nóng)作物的種類和長勢,讓它們成為銀行認可的資產(chǎn)抵押物,從而靈活、隨時給到種糧戶合理的貸款額度和還款周期。
還有部分學術成果,致力于優(yōu)化和提高AI的可靠性、經(jīng)濟性和易用性,為AI持續(xù)降本增效,以推動大模型在真實場景,尤其是嚴謹產(chǎn)業(yè)中得以規(guī)?;涞貞?。比如“基于promp的視覺語言模型無監(jiān)督蒸餾”一文,提出了一種基于可學習提示的視覺語言模型?CLIP?的蒸餾方法,可將大型?CLIP?教師模型的知識遷移至輕量級?CLIP?學生模型中。這是將大模型做“小”,提高AI經(jīng)濟性的有效技術解決方案,AI降本,大模型應用才有可能成為主流。實驗結果表明,該蒸餾方法訓練出的模型,在多個數(shù)據(jù)集上達到了最先進的性能。
據(jù)介紹,螞蟻此次被CVPR收錄的24篇論文中,有13篇出自螞蟻技術研究院。作為螞蟻聚焦前瞻科技的科研團隊,螞蟻技術研究院設立了交互智能、數(shù)據(jù)庫、圖計算、計算系統(tǒng)、程序設計語言與編譯器、密碼學等六個實驗室,以推動實現(xiàn)幾個階段性目標:在人工智能方向,能做出真正通過圖靈測試的智能模型,以及可以以假亂真、實時可交互的高精度數(shù)字人;在隱私計算方向,實現(xiàn)隱私計算軟硬件結合加速10萬倍;在數(shù)據(jù)方向,做到讓數(shù)據(jù)庫更智能,以及在圖計算上部署大腦模擬和融合神經(jīng)科學的智能機理研究。
據(jù)了解,清華大學、南京大學、華中科技大學、哈爾濱工業(yè)大學、西安電子科技大學、華南理工大學、騰訊、字節(jié)跳動等國內高校和互聯(lián)網(wǎng)企業(yè)均有論文被該會議收錄。在這波生成式AI科技浪潮下,國內校企正在發(fā)力積極參與其中。
- 超詳細!2025科技創(chuàng)變者大會最新議程公布!2025-08-21
- 中科慧遠發(fā)布CASIVIBOT,以九年積累開啟AOI與機器人協(xié)同的品質檢測新時代2025-08-20
- 嚯!剛剛,張麻子陪我玩黑猴了2025-08-19
- 機器人全產(chǎn)業(yè)鏈接會 FAIR plus 2026媒體見面會在京召開2025-08-16