全系列模型開源,騰訊混元大模型公布最新開源成績
開源協(xié)同是騰訊的核心技術(shù)戰(zhàn)略
騰訊云副總裁,騰訊混元大模型負(fù)責(zé)人劉煜宏在2024開放原子開發(fā)者大會(huì)暨首屆開源技術(shù)學(xué)術(shù)大會(huì)上表示,騰訊將開源協(xié)同作為公司的核心技術(shù)戰(zhàn)略,積極推動(dòng)內(nèi)外部技術(shù)開源共享。騰訊混元大模型語言大模型、文生圖大模型、文生3D大模型以及文生視頻大模型等多個(gè)模態(tài)模型均已開源,未來大模型各版本也將進(jìn)一步開源,與社區(qū)開發(fā)者一起共同推動(dòng)技術(shù)生態(tài)繁榮發(fā)展。
(騰訊云副總裁,騰訊混元大模型負(fù)責(zé)人 劉煜宏)
騰訊混元大模型的開源模型已經(jīng)全面覆蓋文生文、文生圖、文生3D以及文生視頻多個(gè)模態(tài),是開源系列模型中較全的,其模型性能也得到了開源社區(qū)的高度認(rèn)可,總GitHub Star(星星)數(shù)量近1.4萬顆,并且多次登頂趨勢(shì)榜。
其中,騰訊混元文生圖大模型在國內(nèi)外衍生數(shù)量達(dá)1600多個(gè),GitHub Star 超過3700,凝聚了數(shù)千名核心開發(fā)者。騰訊混元large模型開源五天內(nèi)即在HugginFace百萬模型中脫穎而出,登趨勢(shì)榜榜首,GitHub Star 達(dá)1300。騰訊混元3D模型GitHub Star達(dá)到2500,開源兩周內(nèi)成為HuggingFace下載增速最快的3D模型。
此外,騰訊混元文生視頻大模型 GitHub Star 已超過6300 ,發(fā)布后迅速登上開源趨勢(shì)熱榜,社區(qū)開發(fā)者還主動(dòng)改進(jìn)了多個(gè)衍生版本。例如,加州大學(xué)圣地亞哥分校(UCSD)的Hao AI實(shí)驗(yàn)室研究員基于騰訊混元開源視頻生成模型發(fā)布 FastHunyuan 版本,新模型僅用1分鐘就能生成5秒長的視頻,比之前提速8倍,步驟也從50步減少到了6步,有效降低了模型應(yīng)用門檻。
2024是大模型技術(shù)持續(xù)爆發(fā)的一年,騰訊不僅堅(jiān)持全鏈路自研的大模型研發(fā)路線,率先實(shí)現(xiàn)從底層算力網(wǎng)絡(luò)到中間Angel機(jī)器學(xué)習(xí)平臺(tái)再到上層模型和應(yīng)用到全鏈路自研,也通過積極開源,將成熟的技術(shù)與社區(qū)共享。
2024年5月,騰訊旗下的混元文生圖大模型全面升級(jí)并率先對(duì)外開源,包含模型權(quán)重、推理代碼、模型算法等完整模型,屬業(yè)內(nèi)首個(gè)中文原生的DiT架構(gòu)文生圖開源模型,支持中英文雙語輸入及理解。 評(píng)測數(shù)據(jù)顯示,騰訊混元文生圖模型效果遠(yuǎn)超開源的 Stable Diffusion 模型,是當(dāng)時(shí)效果最好的開源文生圖模型,整體能力屬于國際領(lǐng)先水平。
11月,騰訊混元宣布最新的MoE模型“混元Large“以及混元3D生成大模型“ Hunyuan3D-1.0”開源,支持企業(yè)及開發(fā)者精調(diào)、部署等不同場景的使用需求。騰訊混元Large是當(dāng)時(shí)開源領(lǐng)域參數(shù)規(guī)模最大、效果最好的MoE模型,而騰訊混元3D生成大模型則是業(yè)界首個(gè)同時(shí)支持文字、圖像生成3D的開源大模型。兩個(gè)模型均屬騰訊自研,在架構(gòu)、算法、數(shù)據(jù)等方面有獨(dú)特創(chuàng)新,填補(bǔ)了行業(yè)空白。
12月,騰訊混元生成視頻大模型宣布開源,參數(shù)量130億,是當(dāng)前最大的視頻開源模型,開源內(nèi)容包含模型權(quán)重、推理代碼、模型算法等完整模型,可供企業(yè)與個(gè)人開發(fā)者免費(fèi)使用和開發(fā)生態(tài)插件?;隍v訊混元的開源模型,開發(fā)者及企業(yè)無需從頭訓(xùn)練,即可直接用于推理,并可基于騰訊混元系列打造專屬應(yīng)用及服務(wù),能夠節(jié)約大量人力及算力,加速行業(yè)創(chuàng)新步伐。
本屆大會(huì),騰訊還出品了數(shù)據(jù)庫開源專題論壇并參與大模型開源專題論壇,將騰訊在數(shù)據(jù)庫和大模型上的技術(shù)歷程與眾多開發(fā)者進(jìn)行分享。
開源協(xié)同是騰訊的核心技術(shù)戰(zhàn)略,騰訊通過代碼的開源和協(xié)作,持續(xù)推動(dòng)技術(shù)高效創(chuàng)新、開放共享。在騰訊內(nèi)部,開源協(xié)同小組已經(jīng)超過150個(gè),覆蓋人工智能、大數(shù)據(jù)、數(shù)據(jù)庫等技術(shù)領(lǐng)域。對(duì)外,騰訊積極參與社區(qū)建設(shè),主導(dǎo)近200個(gè)對(duì)外開源項(xiàng)目,在全球企業(yè)開源貢獻(xiàn)榜上名列前茅,總共吸引超50萬開發(fā)者關(guān)注。
早在2010年開始,騰訊就在公司層面開始推動(dòng)外部開源工作的開展,現(xiàn)在已經(jīng)由最初的開源的使用者,轉(zhuǎn)變?yōu)殚_源項(xiàng)目的核心貢獻(xiàn)者。同時(shí),騰訊也是開放原子發(fā)起單位之一,自基金會(huì)2020年成立就積極參與開源,已捐贈(zèng)操作系統(tǒng)、編譯器、數(shù)據(jù)庫等核心項(xiàng)目。
開源已經(jīng)成為全球技術(shù)發(fā)展的主流趨勢(shì),基于全球開發(fā)者眾研眾創(chuàng)的開源生態(tài)正加速形成。全球97%的軟件開發(fā)者和99%的企業(yè)使用開源軟件,未來,騰訊也將持續(xù)推動(dòng)技術(shù)開源,與技術(shù)社區(qū)共同成長,推動(dòng)技術(shù)進(jìn)步。
*本文系量子位獲授權(quán)刊載,觀點(diǎn)僅為作者所有