全系列模型開(kāi)源,騰訊混元大模型公布最新開(kāi)源成績(jī)
開(kāi)源協(xié)同是騰訊的核心技術(shù)戰(zhàn)略
騰訊云副總裁,騰訊混元大模型負(fù)責(zé)人劉煜宏在2024開(kāi)放原子開(kāi)發(fā)者大會(huì)暨首屆開(kāi)源技術(shù)學(xué)術(shù)大會(huì)上表示,騰訊將開(kāi)源協(xié)同作為公司的核心技術(shù)戰(zhàn)略,積極推動(dòng)內(nèi)外部技術(shù)開(kāi)源共享。騰訊混元大模型語(yǔ)言大模型、文生圖大模型、文生3D大模型以及文生視頻大模型等多個(gè)模態(tài)模型均已開(kāi)源,未來(lái)大模型各版本也將進(jìn)一步開(kāi)源,與社區(qū)開(kāi)發(fā)者一起共同推動(dòng)技術(shù)生態(tài)繁榮發(fā)展。
(騰訊云副總裁,騰訊混元大模型負(fù)責(zé)人 劉煜宏)
騰訊混元大模型的開(kāi)源模型已經(jīng)全面覆蓋文生文、文生圖、文生3D以及文生視頻多個(gè)模態(tài),是開(kāi)源系列模型中較全的,其模型性能也得到了開(kāi)源社區(qū)的高度認(rèn)可,總GitHub Star(星星)數(shù)量近1.4萬(wàn)顆,并且多次登頂趨勢(shì)榜。
其中,騰訊混元文生圖大模型在國(guó)內(nèi)外衍生數(shù)量達(dá)1600多個(gè),GitHub Star 超過(guò)3700,凝聚了數(shù)千名核心開(kāi)發(fā)者。騰訊混元large模型開(kāi)源五天內(nèi)即在HugginFace百萬(wàn)模型中脫穎而出,登趨勢(shì)榜榜首,GitHub Star 達(dá)1300。騰訊混元3D模型GitHub Star達(dá)到2500,開(kāi)源兩周內(nèi)成為HuggingFace下載增速最快的3D模型。
此外,騰訊混元文生視頻大模型 GitHub Star 已超過(guò)6300 ,發(fā)布后迅速登上開(kāi)源趨勢(shì)熱榜,社區(qū)開(kāi)發(fā)者還主動(dòng)改進(jìn)了多個(gè)衍生版本。例如,加州大學(xué)圣地亞哥分校(UCSD)的Hao AI實(shí)驗(yàn)室研究員基于騰訊混元開(kāi)源視頻生成模型發(fā)布 FastHunyuan 版本,新模型僅用1分鐘就能生成5秒長(zhǎng)的視頻,比之前提速8倍,步驟也從50步減少到了6步,有效降低了模型應(yīng)用門檻。
2024是大模型技術(shù)持續(xù)爆發(fā)的一年,騰訊不僅堅(jiān)持全鏈路自研的大模型研發(fā)路線,率先實(shí)現(xiàn)從底層算力網(wǎng)絡(luò)到中間Angel機(jī)器學(xué)習(xí)平臺(tái)再到上層模型和應(yīng)用到全鏈路自研,也通過(guò)積極開(kāi)源,將成熟的技術(shù)與社區(qū)共享。
2024年5月,騰訊旗下的混元文生圖大模型全面升級(jí)并率先對(duì)外開(kāi)源,包含模型權(quán)重、推理代碼、模型算法等完整模型,屬業(yè)內(nèi)首個(gè)中文原生的DiT架構(gòu)文生圖開(kāi)源模型,支持中英文雙語(yǔ)輸入及理解。 評(píng)測(cè)數(shù)據(jù)顯示,騰訊混元文生圖模型效果遠(yuǎn)超開(kāi)源的 Stable Diffusion 模型,是當(dāng)時(shí)效果最好的開(kāi)源文生圖模型,整體能力屬于國(guó)際領(lǐng)先水平。
11月,騰訊混元宣布最新的MoE模型“混元Large“以及混元3D生成大模型“ Hunyuan3D-1.0”開(kāi)源,支持企業(yè)及開(kāi)發(fā)者精調(diào)、部署等不同場(chǎng)景的使用需求。騰訊混元Large是當(dāng)時(shí)開(kāi)源領(lǐng)域參數(shù)規(guī)模最大、效果最好的MoE模型,而騰訊混元3D生成大模型則是業(yè)界首個(gè)同時(shí)支持文字、圖像生成3D的開(kāi)源大模型。兩個(gè)模型均屬騰訊自研,在架構(gòu)、算法、數(shù)據(jù)等方面有獨(dú)特創(chuàng)新,填補(bǔ)了行業(yè)空白。
12月,騰訊混元生成視頻大模型宣布開(kāi)源,參數(shù)量130億,是當(dāng)前最大的視頻開(kāi)源模型,開(kāi)源內(nèi)容包含模型權(quán)重、推理代碼、模型算法等完整模型,可供企業(yè)與個(gè)人開(kāi)發(fā)者免費(fèi)使用和開(kāi)發(fā)生態(tài)插件?;隍v訊混元的開(kāi)源模型,開(kāi)發(fā)者及企業(yè)無(wú)需從頭訓(xùn)練,即可直接用于推理,并可基于騰訊混元系列打造專屬應(yīng)用及服務(wù),能夠節(jié)約大量人力及算力,加速行業(yè)創(chuàng)新步伐。
本屆大會(huì),騰訊還出品了數(shù)據(jù)庫(kù)開(kāi)源專題論壇并參與大模型開(kāi)源專題論壇,將騰訊在數(shù)據(jù)庫(kù)和大模型上的技術(shù)歷程與眾多開(kāi)發(fā)者進(jìn)行分享。
開(kāi)源協(xié)同是騰訊的核心技術(shù)戰(zhàn)略,騰訊通過(guò)代碼的開(kāi)源和協(xié)作,持續(xù)推動(dòng)技術(shù)高效創(chuàng)新、開(kāi)放共享。在騰訊內(nèi)部,開(kāi)源協(xié)同小組已經(jīng)超過(guò)150個(gè),覆蓋人工智能、大數(shù)據(jù)、數(shù)據(jù)庫(kù)等技術(shù)領(lǐng)域。對(duì)外,騰訊積極參與社區(qū)建設(shè),主導(dǎo)近200個(gè)對(duì)外開(kāi)源項(xiàng)目,在全球企業(yè)開(kāi)源貢獻(xiàn)榜上名列前茅,總共吸引超50萬(wàn)開(kāi)發(fā)者關(guān)注。
早在2010年開(kāi)始,騰訊就在公司層面開(kāi)始推動(dòng)外部開(kāi)源工作的開(kāi)展,現(xiàn)在已經(jīng)由最初的開(kāi)源的使用者,轉(zhuǎn)變?yōu)殚_(kāi)源項(xiàng)目的核心貢獻(xiàn)者。同時(shí),騰訊也是開(kāi)放原子發(fā)起單位之一,自基金會(huì)2020年成立就積極參與開(kāi)源,已捐贈(zèng)操作系統(tǒng)、編譯器、數(shù)據(jù)庫(kù)等核心項(xiàng)目。
開(kāi)源已經(jīng)成為全球技術(shù)發(fā)展的主流趨勢(shì),基于全球開(kāi)發(fā)者眾研眾創(chuàng)的開(kāi)源生態(tài)正加速形成。全球97%的軟件開(kāi)發(fā)者和99%的企業(yè)使用開(kāi)源軟件,未來(lái),騰訊也將持續(xù)推動(dòng)技術(shù)開(kāi)源,與技術(shù)社區(qū)共同成長(zhǎng),推動(dòng)技術(shù)進(jìn)步。
*本文系量子位獲授權(quán)刊載,觀點(diǎn)僅為作者所有