2024國(guó)際基礎(chǔ)科學(xué)大會(huì)“計(jì)算機(jī)之夜”活動(dòng)圓滿舉行
共同探討最新的科研成果和技術(shù)應(yīng)用
7月17日晚,國(guó)際基礎(chǔ)科學(xué)大會(huì)的“計(jì)算機(jī)之夜”活動(dòng)成功舉辦。
該活動(dòng)吸引了眾多計(jì)算機(jī)科學(xué)領(lǐng)域的專(zhuān)家學(xué)者,共同探討最新的科研成果和技術(shù)應(yīng)用。
致辭環(huán)節(jié)
丘成桐先生作為大會(huì)主席首先致辭。

丘先生強(qiáng)調(diào),科學(xué)的發(fā)展需要大量的數(shù)據(jù)處理和深刻的科學(xué)見(jiàn)解,而這些都離不開(kāi)計(jì)算機(jī)的支持。
他指出,計(jì)算機(jī)科學(xué)和人工智能的發(fā)展為基礎(chǔ)科學(xué)研究提供了新的工具和方法,能夠解決許多復(fù)雜的問(wèn)題。
丘先生還提到,物理學(xué)的許多重要進(jìn)展為計(jì)算機(jī)產(chǎn)業(yè)的發(fā)展奠定了基礎(chǔ),尤其是在量子計(jì)算機(jī)領(lǐng)域,盡管這一技術(shù)可能還需要10到20年的發(fā)展時(shí)間,但基礎(chǔ)物理學(xué)在其中起到了重要作用。
此外,他認(rèn)為,人工智能和計(jì)算機(jī)科學(xué)的發(fā)展依賴(lài)于數(shù)學(xué)的深入研究,并且很多重要的數(shù)學(xué)思想在這些領(lǐng)域中反復(fù)應(yīng)用。他對(duì)此表示樂(lè)觀,認(rèn)為中國(guó)科學(xué)家在這一領(lǐng)域能夠做出重要貢獻(xiàn)。
最后,丘成桐先生呼吁大家打破學(xué)科界限,互相學(xué)習(xí),共同促進(jìn)科學(xué)的發(fā)展,不僅為中國(guó),也為全球科學(xué)進(jìn)步做出貢獻(xiàn)。
接著,ICBS基礎(chǔ)科學(xué)終身成就獎(jiǎng)、圖靈獎(jiǎng)得主Leslie Valiant教授也發(fā)表了講話。

Leslie Valiant教授表示,對(duì)于計(jì)算機(jī)科學(xué)與其他學(xué)科如數(shù)學(xué)和物理學(xué)的密切關(guān)系,他一直深感興趣,并強(qiáng)調(diào)這些學(xué)科的交叉和融合對(duì)于推動(dòng)整體科學(xué)發(fā)展具有重要意義。
Valiant教授提到,與數(shù)學(xué)和其他自然科學(xué)相比,計(jì)算機(jī)科學(xué)的歷史較為短暫,但其所面臨的問(wèn)題同樣深遠(yuǎn)而復(fù)雜。
他特別提到了計(jì)算機(jī)科學(xué)領(lǐng)域中的一些基本問(wèn)題,如P與NP問(wèn)題,至今尚未解決。
Leslie Valiant教授進(jìn)一步指出,計(jì)算機(jī)科學(xué)正處于發(fā)展的早期階段,許多基本問(wèn)題仍需解答。尤其是量子計(jì)算的興起,帶來(lái)了許多新的問(wèn)題和研究方向,使得計(jì)算機(jī)科學(xué)家們需要不斷應(yīng)對(duì)新技術(shù)的挑戰(zhàn)。
與此同時(shí),認(rèn)知科學(xué)與人工智能領(lǐng)域的快速發(fā)展,為計(jì)算機(jī)科學(xué)的應(yīng)用與研究提供了廣闊的前景和無(wú)限的可能性。
最后,Valiant教授鼓勵(lì)年輕人和資深研究者繼續(xù)投身計(jì)算機(jī)科學(xué)領(lǐng)域,他堅(jiān)信這個(gè)領(lǐng)域在未來(lái)將會(huì)有更多重大的突破和發(fā)展機(jī)遇。
主題演講
在主旨演講環(huán)節(jié),騰訊杰出科學(xué)家、國(guó)際電氣與電子工程師學(xué)會(huì)會(huì)士以及國(guó)際模式識(shí)別協(xié)會(huì)會(huì)士劉威博士,首先圍繞騰訊混元大模型的進(jìn)展發(fā)表了主旨演講,詳細(xì)闡述了騰訊在多模態(tài)生成模型領(lǐng)域的最新研究進(jìn)展。

劉威博士主要介紹了三種生成模型:視頻生成模型、圖像生成模型和文本生成模型,并分享了這些模型在多個(gè)領(lǐng)域的突破和實(shí)際應(yīng)用。
劉威博士特別提到了騰訊混元大模型名稱(chēng)的由來(lái),表示“混元”在古代漢語(yǔ)中意味著從無(wú)序到有序、從混亂到規(guī)律的過(guò)程,這也正是生成模型的使命。
劉威博士首先從視頻生成模型開(kāi)始講起。
他介紹了混元大模型的基礎(chǔ)技術(shù),即“擴(kuò)散模型”(Diffusion Model)。
擴(kuò)散模型是一種概率模型,通過(guò)逐步將噪聲添加到數(shù)據(jù)中,最終逆轉(zhuǎn)這個(gè)過(guò)程以生成新的數(shù)據(jù)。
訓(xùn)練完成后,可以從純?cè)肼曢_(kāi)始,通過(guò)逆向模型逐步去噪,生成新的數(shù)據(jù)樣本。
劉威博士進(jìn)一步講解了DiT架構(gòu)和ST-DiT模型等技術(shù)創(chuàng)新。
劉威博士展示了ST-DiT模型在視頻生成方面的獨(dú)特優(yōu)勢(shì),該模型將視頻數(shù)據(jù)轉(zhuǎn)化為時(shí)空潛在代碼,并通過(guò)變換器架構(gòu)進(jìn)行處理,從而實(shí)現(xiàn)高質(zhì)量的視頻生成。
劉威博士強(qiáng)調(diào),ST-DiT模型在語(yǔ)義理解等方面表現(xiàn)出色,能夠生成長(zhǎng)度達(dá)一分鐘的高質(zhì)量視頻片段。他介紹了混元文本到視頻(T2V)模型的效果表現(xiàn)和多種應(yīng)用,包括視頻風(fēng)格化、“運(yùn)動(dòng)筆刷”(Motion Brush)、姿勢(shì)引導(dǎo)視頻生成、視頻重繪等。
劉威博士接下來(lái)詳細(xì)介紹了混元大模型在三維生成領(lǐng)域的創(chuàng)新。
該模型通過(guò)五個(gè)主要組件進(jìn)行三維網(wǎng)格生成,從文本或圖像描述到高精度三維資產(chǎn)生成,整個(gè)過(guò)程包括多級(jí)擴(kuò)散和變換步驟。
首先,輸入可以是文本描述或單張圖像,經(jīng)過(guò)多視角擴(kuò)散和3D Transformer,并通過(guò)3D超分辨技術(shù),最終生成高質(zhì)量的三維資產(chǎn)。
劉威博士指出,通過(guò)混元大模型,僅需半分鐘便可生成一個(gè)高質(zhì)量的三維模型,大大提升了生產(chǎn)效率。
劉威博士特別展示了一些具體應(yīng)用案例,包括物品的三維建模和復(fù)雜的卡通角色生成,展示了這一技術(shù)在電子商務(wù)、游戲設(shè)計(jì)和動(dòng)畫(huà)制作等領(lǐng)域具有廣泛的應(yīng)用前景。
劉威博士還探討了混元大模型在圖像生成方面的進(jìn)展。
劉威博士介紹的圖像生成的任務(wù)之一是根據(jù)輸入的文本提示詞生成對(duì)應(yīng)的圖像,劉威博士提到了騰訊開(kāi)源的擁有15億參數(shù)的基礎(chǔ)版本模型,并詳細(xì)講解了其內(nèi)部部件和運(yùn)行流程,其中第一個(gè)組件是一個(gè)多模態(tài)語(yǔ)言大模型(Multi-modal LLM),第二個(gè)組件是一個(gè)圖像DiT或空間DiT,而第三個(gè)組件負(fù)責(zé)超分辨處理,可以實(shí)現(xiàn)4k甚至8k的超清圖像生成。整個(gè)模型具有語(yǔ)義理解、高質(zhì)量結(jié)果、支持中式場(chǎng)景和支持多輪對(duì)話等亮點(diǎn)。
劉威博士介紹的另一個(gè)圖像生成任務(wù)是由圖像生成新圖像,并保留原圖像的特征。劉威博士通過(guò)例子展示了如何從一張圖生成多張相關(guān)圖片,以及將圖像物體遷移到新場(chǎng)景。模型在語(yǔ)義精準(zhǔn)理解與對(duì)齊、亞洲人人像生成和中式元素生成方面表現(xiàn)出了極佳效果。
在演講的最后,劉威博士深刻總結(jié)了當(dāng)前AI生成模型的兩大范式LLM/GPT與Diffusion的對(duì)比差異,并深刻地指出LLM/GPT是“世界推理器”,而Diffusion是“世界模擬器”。
劉威博士還鮮明并深刻地指出LLM/GPT的骨干網(wǎng)絡(luò)是方向性變換器(Directional Transformer)而Diffusion則為方向性變換器(Bidirectional Transformer);LLM/GPT的學(xué)習(xí)目標(biāo)是預(yù)測(cè)下一個(gè)標(biāo)記(token)而Diffusion則為預(yù)測(cè)噪聲;LLM/GPT的學(xué)習(xí)理論是壓縮世界知識(shí)而Diffusion則是遷移概率分布。
劉威博士對(duì)LLM/GPT和Diffusion的分析為與會(huì)者提供了印象深刻的見(jiàn)解和啟發(fā)。
京東集團(tuán)副總裁、國(guó)際電氣與電子工程師學(xué)會(huì)會(huì)士何曉冬博士發(fā)表了題為《生成式AI:前沿技術(shù)進(jìn)展及產(chǎn)業(yè)實(shí)踐》的主旨演講。

何曉冬博士指出,AI生成內(nèi)容技術(shù)已經(jīng)達(dá)到一個(gè)新的高度,他提到,自2022年以來(lái),AI生成的內(nèi)容與專(zhuān)業(yè)內(nèi)容之間的差距不斷縮小,這表明AI生成的內(nèi)容在質(zhì)量上已接近或達(dá)到專(zhuān)業(yè)水平,具備了實(shí)際應(yīng)用的價(jià)值。
何曉冬博士詳細(xì)闡述了生成式AI技術(shù)的發(fā)展歷程。
他講到,十年前開(kāi)始使用的神經(jīng)網(wǎng)絡(luò)模型和語(yǔ)言模型成為了大規(guī)模模型的起點(diǎn)。特別是2017年谷歌學(xué)者團(tuán)隊(duì)發(fā)表的Transformer模型,使得AI在處理和理解文本信息方面的能力得到了極大的提升。
基于此,GPT-3模型應(yīng)運(yùn)而生,首次將參數(shù)量提升到了1750億個(gè),展示了令人印象深刻的生成效果,能夠生成長(zhǎng)篇且合理的文本內(nèi)容。
在圖像生成領(lǐng)域,何曉冬博士提到,從2014年開(kāi)始的生成對(duì)抗網(wǎng)絡(luò)(GAN)技術(shù),以及后來(lái)加入注意力機(jī)制的Attention GAN,使得圖像生成質(zhì)量顯著提高。
最新的擴(kuò)散模型、擴(kuò)散變換器(Diffusion Transformer, DiT)進(jìn)一步提升了圖像生成的質(zhì)量。他還指出,多模態(tài)智能的進(jìn)展,使得AI不僅能處理單一模態(tài)的內(nèi)容,還能結(jié)合文本和圖像等多種模態(tài)信息,進(jìn)行復(fù)雜的推理和生成。
何曉冬博士接著談到了多模態(tài)智能的具體實(shí)現(xiàn)。
他指出,多模態(tài)智能的關(guān)鍵在于對(duì)不同模態(tài)信息的對(duì)齊和處理能力。
例如,在文本與圖像的對(duì)齊方面,2018年京東發(fā)布的論文提出了一種自下而上和自上而下的注意力機(jī)制,這種方法模仿人類(lèi)對(duì)圖像中物體的關(guān)注方式,顯著提升了文本與圖像語(yǔ)義內(nèi)容的對(duì)齊精度。
他進(jìn)一步介紹了在視頻理解領(lǐng)域的最新進(jìn)展,何博士指出,由于需要對(duì)每一幀進(jìn)行標(biāo)注,訓(xùn)練視頻模型的成本非常高,為了減少視頻標(biāo)注的工作量,京東提出了關(guān)鍵幀標(biāo)注的方法,這種方法只需對(duì)視頻中的關(guān)鍵幀進(jìn)行標(biāo)注,大大降低了標(biāo)注成本。
在此基礎(chǔ)上,他們還提出了一種基于多實(shí)例學(xué)習(xí)的兩階段框架,通過(guò)單幀監(jiān)督和覆蓋學(xué)習(xí),有效提升了模型在視頻理解任務(wù)中的表現(xiàn)。
隨后,何曉冬博士展示了生成式AI在實(shí)際應(yīng)用中的一些案例。
他介紹了一個(gè)生成數(shù)字人的項(xiàng)目,這個(gè)項(xiàng)目旨在生成高質(zhì)量的虛擬人類(lèi)形象,用于各種商業(yè)應(yīng)用場(chǎng)景。
通過(guò)編碼圖像、視頻、文本、音頻和三維動(dòng)作信息,他們能夠生成與真實(shí)人類(lèi)高度相似的虛擬形象。何曉冬博士特別指出,這些虛擬形象在動(dòng)作、表情和細(xì)節(jié)處理上都非常自然,幾乎無(wú)法被普通用戶分辨出是AI生成的內(nèi)容。
他展示了一個(gè)具體案例:京東創(chuàng)始人劉強(qiáng)東的數(shù)字人形象。
這個(gè)數(shù)字人不僅在外貌上高度還原了劉強(qiáng)東,還精確模擬了他的行為習(xí)慣和面部表情,在一個(gè)小時(shí)的直播銷(xiāo)售活動(dòng)中表現(xiàn)出色,獲得了用戶的高度評(píng)價(jià)和信任。
在具身智能方面,何曉冬博士強(qiáng)調(diào),將大模型的智能能力應(yīng)用到機(jī)器人等物理設(shè)備中,將會(huì)帶來(lái)巨大的潛力。
例如,京東在物流領(lǐng)域使用的機(jī)械臂已經(jīng)展示了初步的智能化能力,未來(lái)希望通過(guò)進(jìn)一步增強(qiáng)這些設(shè)備的智能性,使其能夠執(zhí)行更復(fù)雜的任務(wù)。通過(guò)具身智能技術(shù),機(jī)器人將能夠在實(shí)際場(chǎng)景中完成更多復(fù)雜的操作,顯著提升生產(chǎn)效率和服務(wù)質(zhì)量。
最后,何曉冬博士展望了生成式AI的未來(lái)發(fā)展。
他認(rèn)為,隨著技術(shù)的不斷進(jìn)步,生成式AI將在更廣泛的領(lǐng)域內(nèi)實(shí)現(xiàn)突破,包括語(yǔ)言處理、圖像生成、多模態(tài)智能和具身智能等方面。
他指出,生成式AI不僅在技術(shù)上已經(jīng)取得了顯著進(jìn)展,在實(shí)際應(yīng)用中也展示了巨大的商業(yè)價(jià)值和潛力。通過(guò)不斷探索和創(chuàng)新,生成式AI將為各行各業(yè)帶來(lái)更多可能性,推動(dòng)社會(huì)進(jìn)步和經(jīng)濟(jì)發(fā)展。
圓桌討論
在圓桌論壇環(huán)節(jié),清華大學(xué)教授劉云浩主持了此次高規(guī)格的討論會(huì)。

與會(huì)嘉賓包括菲爾茲獎(jiǎng)得主丘成桐、圖靈獎(jiǎng)得主Leslie Valiant、騰訊杰出科學(xué)家劉威、京東集團(tuán)副總裁何曉冬、谷歌杰出研究科學(xué)家Moti Yung以及微軟杰出首席科學(xué)家劉鐵巖。在討論中,劉云浩教授提出了人工智能對(duì)社會(huì)的正面與負(fù)面影響這一廣泛話題,并邀請(qǐng)每位嘉賓分享他們對(duì)這一問(wèn)題的看法。

谷歌杰出研究科學(xué)家Moti Yung在發(fā)言中指出,盡管人工智能在許多領(lǐng)域取得了顯著進(jìn)展,尤其在視頻和圖像生成領(lǐng)域表現(xiàn)出色,但他對(duì)人工智能技術(shù)的潛在濫用表達(dá)了擔(dān)憂。

他強(qiáng)調(diào),歷史上每一項(xiàng)計(jì)算機(jī)科學(xué)技術(shù)都可能被不法分子濫用,人工智能也不例外。
Yung提到,隨著生成技術(shù)的進(jìn)步,虛假信息將變得更加逼真,這可能帶來(lái)嚴(yán)重后果。
他還指出,不法分子可能會(huì)因經(jīng)濟(jì)利益驅(qū)動(dòng)而利用這些技術(shù),對(duì)社會(huì)造成負(fù)面影響。盡管人工智能在提高生產(chǎn)力和解決復(fù)雜問(wèn)題方面具有巨大潛力,但其背后的不透明性和缺乏解釋性機(jī)制仍然是一個(gè)重要的挑戰(zhàn)。
微軟杰出首席科學(xué)家劉鐵巖在發(fā)言中指出,人工智能正在對(duì)多個(gè)行業(yè)產(chǎn)生深遠(yuǎn)的變革影響,他強(qiáng)調(diào),人工智能不再是實(shí)驗(yàn)室里的玩具,而是能夠真正改變生活和工業(yè)的實(shí)用工具。

劉鐵巖博士還提出,當(dāng)前的人工智能研究范式存在一些挑戰(zhàn)。
他認(rèn)為,過(guò)度依賴(lài)大規(guī)模數(shù)據(jù)和計(jì)算資源的方法,可能使得傳統(tǒng)的科研智慧和靈感逐漸被忽視。這種趨勢(shì)可能對(duì)研究社區(qū)產(chǎn)生負(fù)面影響,因?yàn)閾碛写罅坑?jì)算資源的團(tuán)隊(duì)可能更容易引起關(guān)注,而那些沒(méi)有足夠資源的研究人員的創(chuàng)新成果可能被埋沒(méi)。
此外,劉鐵巖還對(duì)人工智能的環(huán)境可持續(xù)性問(wèn)題表示擔(dān)憂。
他指出,訓(xùn)練大規(guī)模模型所消耗的資源巨大,而人類(lèi)通過(guò)簡(jiǎn)單的學(xué)習(xí)過(guò)程就能達(dá)到類(lèi)似的效果,這引發(fā)了對(duì)當(dāng)前計(jì)算范式是否值得如此高昂成本的質(zhì)疑。
他強(qiáng)調(diào),未來(lái)的人工智能發(fā)展需要在技術(shù)進(jìn)步和資源消耗之間找到平衡,以確保其長(zhǎng)期可持續(xù)性。
圖靈獎(jiǎng)得主Leslie Valiant教授在發(fā)言中表示,人工智能技術(shù)將深入到生活的各個(gè)方面,這種普及不僅帶來(lái)了巨大的機(jī)遇,也加劇了潛在的風(fēng)險(xiǎn)。

他指出,許多與人工智能相關(guān)的問(wèn)題實(shí)際上并不新鮮。
例如,公平性的問(wèn)題在人工智能時(shí)代變得更加突出,但這類(lèi)問(wèn)題在人類(lèi)社會(huì)中早已存在。人工智能的出現(xiàn)使得人們必須更加嚴(yán)肅和謹(jǐn)慎地思考什么是公平,什么是不公平。
Valiant教授認(rèn)為,盡管人工智能增強(qiáng)了人類(lèi)的能力,也帶來(lái)了新的挑戰(zhàn),但這也驅(qū)使我們更深入地審視我們的行為和決策。在回應(yīng)關(guān)于人工智能是否可能擁有意識(shí)的問(wèn)題時(shí),Valiant表示,目前對(duì)意識(shí)的定義尚不統(tǒng)一,他個(gè)人并不認(rèn)為在討論人工智能時(shí),意識(shí)是一個(gè)有用的概念。
他還強(qiáng)調(diào),即使未來(lái)的人工智能具備了一定程度的自主性,關(guān)鍵問(wèn)題仍然是誰(shuí)在控制這些技術(shù),以及如何保持對(duì)其的控制。
丘成桐教授在發(fā)言中表示,盡管人工智能在許多方面展現(xiàn)了巨大的潛力,但他對(duì)其當(dāng)前的貢獻(xiàn)持謹(jǐn)慎態(tài)度。

他強(qiáng)調(diào),歷史上一些偉大的數(shù)學(xué)成就,如20世紀(jì)80年代的重大突破,主要依靠的是人類(lèi)智慧而非計(jì)算機(jī)的輔助。
丘成桐指出,雖然計(jì)算機(jī)能夠幫助進(jìn)行復(fù)雜的計(jì)算,但要達(dá)到這些偉大的科學(xué)成就,還需要進(jìn)一步挖掘人工智能的潛力。
丘成桐教授還提到,雖然人工智能在計(jì)算和模擬方面有很大優(yōu)勢(shì),但它們?cè)趧?chuàng)造全新概念上的能力仍然有限。
他舉例說(shuō)明了復(fù)數(shù)概念在數(shù)學(xué)史上的發(fā)展,而這一歷程充滿了人類(lèi)智慧和創(chuàng)造力。
他質(zhì)疑當(dāng)前的人工智能是否具備類(lèi)似的創(chuàng)新能力。
此外,丘成桐教授對(duì)人工智能對(duì)社會(huì)的潛在影響表達(dá)了關(guān)切。
他認(rèn)為,過(guò)度依賴(lài)人工智能可能導(dǎo)致人類(lèi)思維能力的退化,尤其是年輕一代。
他呼吁人們?cè)谑褂萌斯ぶ悄軙r(shí)保持平衡,強(qiáng)調(diào)人工智能應(yīng)當(dāng)作為促進(jìn)人類(lèi)思維的工具,而非替代人類(lèi)思維的手段。
京東集團(tuán)副總裁何曉冬在發(fā)言中指出,盡管人工智能在許多領(lǐng)域取得了顯著進(jìn)展,但當(dāng)前的AI仍然缺乏基本的原則。

他認(rèn)為,現(xiàn)階段的AI更依賴(lài)于經(jīng)驗(yàn)性的方法,而對(duì)其背后的原理尚未完全理解。
他提到,盡管現(xiàn)有的神經(jīng)網(wǎng)絡(luò)非常強(qiáng)大且具有廣泛的應(yīng)用前景,但對(duì)其底層原理的認(rèn)識(shí)仍然有限。
何曉冬博士認(rèn)為,未來(lái)的研究需要在積累大量實(shí)驗(yàn)結(jié)果的基礎(chǔ)上,進(jìn)一步探索和發(fā)現(xiàn)AI背后的基本原理。
他還強(qiáng)調(diào),盡管人工智能尚未完全成熟,但其在實(shí)際應(yīng)用中已經(jīng)展現(xiàn)出巨大的價(jià)值。以京東的客戶服務(wù)為例,AI技術(shù)已經(jīng)顯著提升了服務(wù)效率,特別是在處理大量重復(fù)性工作方面,AI表現(xiàn)出了極高的效率。
最后,何曉冬博士指出,盡管人工智能技術(shù)尚不完善,但他對(duì)其未來(lái)的發(fā)展持積極態(tài)度。他相信,隨著研究的深入,AI的基本原理終將被發(fā)現(xiàn),從而使AI在各個(gè)領(lǐng)域發(fā)揮更大的作用。
騰訊杰出科學(xué)家劉威在發(fā)言中指出,人工智能是人類(lèi)創(chuàng)新的重要成果。

他認(rèn)為當(dāng)前的生成模型并非完全的新發(fā)明,而是對(duì)人類(lèi)知識(shí)和觀察的重組與再生產(chǎn)。
劉威強(qiáng)調(diào),生成模型在為用戶提供個(gè)性化內(nèi)容和服務(wù)方面展現(xiàn)了強(qiáng)大能力,但這也帶來(lái)了一些負(fù)面影響。
他指出,互聯(lián)網(wǎng)上的虛假信息和數(shù)字內(nèi)容顯著增加,某些公司甚至可能利用生成模型進(jìn)行虛假發(fā)現(xiàn)和檢測(cè)。
劉威還提到,基礎(chǔ)模型在不斷改進(jìn)過(guò)程中,存在數(shù)據(jù)濫用和隱私安全問(wèn)題,這引發(fā)了對(duì)用戶數(shù)據(jù)安全的擔(dān)憂。
劉威博士呼吁,必須有組織和規(guī)章來(lái)控制生成模型的發(fā)展與濫用,以保障用戶隱私和安全。他認(rèn)為,盡管生成模型在某些方面具備創(chuàng)新能力,但其對(duì)社會(huì)的負(fù)面影響不容忽視。
劉威博士強(qiáng)調(diào),合理使用生成模型,可以在提高生產(chǎn)力和創(chuàng)造力方面發(fā)揮積極作用,但必須同時(shí)警惕其可能帶來(lái)的潛在風(fēng)險(xiǎn)。
圓桌討論中,嘉賓們圍繞人工智能技術(shù)的前景和挑戰(zhàn)展開(kāi)的深刻探討,為與會(huì)者提供了一個(gè)深入思考和交流的平臺(tái),促使人們更全面地認(rèn)識(shí)和理解人工智能的潛力與風(fēng)險(xiǎn)。
展示環(huán)節(jié)
在展示環(huán)節(jié),來(lái)自全球知名高校和科研機(jī)構(gòu)的專(zhuān)家們展示了多項(xiàng)前沿技術(shù)成果。
首先,國(guó)際計(jì)算機(jī)學(xué)會(huì)會(huì)士、加利福尼亞大學(xué)圣迭戈分校計(jì)算機(jī)學(xué)院教授Ravi Ramamoorthi演示了其團(tuán)隊(duì)提出的利用少量不規(guī)則采樣圖像生成沉浸式場(chǎng)景的新方法。

Ramamoorthi教授詳細(xì)介紹了該方法如何通過(guò)結(jié)合渲染和光流技術(shù),有效減少采樣數(shù)量,并在移動(dòng)設(shè)備上實(shí)現(xiàn)高質(zhì)量圖像重建。
他展示了在不同復(fù)雜場(chǎng)景下的應(yīng)用效果,證明了技術(shù)的穩(wěn)健性和廣泛適用性。
接下來(lái),浙江大學(xué) – 之江實(shí)驗(yàn)室平臺(tái)百人計(jì)劃研究員裘捷中分享了他在圖對(duì)比編碼(GCC)方面的研究成果。

他介紹了這一創(chuàng)新方法如何在大規(guī)模、復(fù)雜的社交、商業(yè)和信息網(wǎng)絡(luò)中實(shí)現(xiàn)圖結(jié)構(gòu)的向量空間轉(zhuǎn)換,從而使深度學(xué)習(xí)模型能夠發(fā)現(xiàn)有價(jià)值的模式。裘捷中研究員詳細(xì)說(shuō)明了圖對(duì)比編碼如何通過(guò)隨機(jī)游走對(duì)圖進(jìn)行采樣,確保圖神經(jīng)網(wǎng)絡(luò)實(shí)例能夠區(qū)分相似和不相似的子圖對(duì)。
他提出了GCC的兩種微調(diào)策略:全微調(diào)(Full fine-tuning)和凍結(jié)微調(diào)(Freezing fine-tuning)。
實(shí)驗(yàn)結(jié)果表明,凍結(jié)微調(diào)在與從頭訓(xùn)練的監(jiān)督模型競(jìng)爭(zhēng)時(shí)表現(xiàn)良好,而全微調(diào)則進(jìn)一步提升了性能,實(shí)驗(yàn)展示了圖對(duì)比編碼在各種圖學(xué)習(xí)任務(wù)中的巨大潛力。
隨后,來(lái)自亞利桑那大學(xué)的David Brady教授展示了其在多尺度千兆像素?cái)z影方面的研究成果。
Brady教授強(qiáng)調(diào)了現(xiàn)實(shí)世界數(shù)據(jù)在構(gòu)建模型時(shí)的必要性,傳統(tǒng)相機(jī)通常只能捕捉人眼可見(jiàn)的圖像,而機(jī)器學(xué)習(xí)需要更大規(guī)模的數(shù)據(jù)。
為此,他們構(gòu)建了并行超級(jí)相機(jī),通過(guò)安裝在球面透鏡后的數(shù)百個(gè)微型攝像頭,能夠在極高分辨率下捕捉圖像和視頻。
Brady教授展示了這一相機(jī)系統(tǒng)在美國(guó)橄欖球比賽中的應(yīng)用,能夠?qū)崟r(shí)凍結(jié)和回放任何場(chǎng)景,提供前所未有的細(xì)節(jié)觀察。
他還展示了該技術(shù)在天空監(jiān)測(cè)中的應(yīng)用,通過(guò)超級(jí)相機(jī)捕捉到肉眼無(wú)法識(shí)別的遙遠(yuǎn)物體。
最后,清華大學(xué)計(jì)算機(jī)系計(jì)算機(jī)圖形學(xué)實(shí)驗(yàn)室的博士生李曉磊展示了他與合作者在復(fù)雜場(chǎng)景生成中的研究成果,李曉磊提出了“對(duì)象解耦和交互建模”的方法,詳細(xì)介紹了他們的系統(tǒng)如何對(duì)多物體及其關(guān)系進(jìn)行三維場(chǎng)景解耦和建模,解決了工業(yè)級(jí)場(chǎng)景生成中的諸多挑戰(zhàn)。
他們提出了復(fù)雜關(guān)系生成的明確定義,并從二維擴(kuò)散模型中汲取知識(shí)應(yīng)用于實(shí)際場(chǎng)景。
李曉磊開(kāi)發(fā)了新方法,通過(guò)可學(xué)習(xí)的結(jié)構(gòu)和圖形表示實(shí)現(xiàn)復(fù)雜場(chǎng)景的生成,并提出了一種新的對(duì)象感知記憶優(yōu)化方法,實(shí)現(xiàn)了背景和對(duì)象之間清晰、銳利的邊界。
他展示的可視化結(jié)果顯示了物體解耦和生成在各種復(fù)雜場(chǎng)景中的應(yīng)用潛力,強(qiáng)調(diào)了其方法在工業(yè)三維生產(chǎn)管線中直接應(yīng)用的前景。

在熱烈的討論和互動(dòng)中,2024國(guó)際基礎(chǔ)科學(xué)大會(huì)“計(jì)算機(jī)之夜”活動(dòng)圓滿落下帷幕。
本次活動(dòng)不僅展示了計(jì)算機(jī)科學(xué)前沿的最新成果,也促進(jìn)了國(guó)際學(xué)術(shù)界與產(chǎn)業(yè)界的深度交流。
期待未來(lái),在全球科研人員的共同努力下,計(jì)算機(jī)科學(xué)將繼續(xù)引領(lǐng)科技前沿,推動(dòng)各行各業(yè)的持續(xù)進(jìn)步與創(chuàng)新。