浪潮信息劉軍:智算力就是創(chuàng)新力 | MEET2023
AI領(lǐng)域的眾多創(chuàng)新背后都離不開(kāi)智算力的支撐
Pine 整理自 MEET2023
量子位 | 公眾號(hào) QbitAI
在人工智能的三駕馬車(chē)中,算力作為算法和數(shù)據(jù)的支撐,它的作用一直都不容小覷。
目前,人工智能在和各個(gè)行業(yè)不斷融合發(fā)展,這對(duì)算力也提出了更高的要求。
無(wú)論是AI大模型訓(xùn)練,自動(dòng)駕駛系統(tǒng)的感知模型訓(xùn)練,還是AI+Science或者數(shù)字人的建模或渲染,都離不開(kāi)強(qiáng)大算力的支撐。
在MEET2023智能未來(lái)大會(huì)上,浪潮信息副總裁、浪潮人工智能與高性能計(jì)算產(chǎn)品線總經(jīng)理劉軍分享了在AI新時(shí)代,他對(duì)智算算力的一些思考,并拋出了這樣一個(gè)觀點(diǎn):
智算力就是創(chuàng)新力。
為了完整體現(xiàn)劉軍的分享及思考,在不改變?cè)獾幕A(chǔ)上,量子位對(duì)他的演講內(nèi)容進(jìn)行了編輯整理。
關(guān)于MEET 智能未來(lái)大會(huì):MEET大會(huì)是由量子位主辦的智能科技領(lǐng)域頂級(jí)商業(yè)峰會(huì),致力于探討前沿科技技術(shù)的落地與行業(yè)應(yīng)用。今年共有數(shù)十家主流媒體及直播平臺(tái)報(bào)道直播了MEET2023大會(huì),吸引了超過(guò)300萬(wàn)行業(yè)用戶線上參會(huì),全網(wǎng)總曝光量累計(jì)超過(guò)2000萬(wàn)。
演講要點(diǎn)
- 目前智算的發(fā)展有三個(gè)趨勢(shì):算力多元化、模型巨量化、元宇宙。
- 計(jì)算的目標(biāo)是支撐業(yè)務(wù),不同的業(yè)務(wù)類(lèi)型對(duì)計(jì)算系統(tǒng)提出的需求也是不同的。
- AI算法正在從感知智能向認(rèn)知智能邁進(jìn),模型參數(shù)持續(xù)增大,預(yù)訓(xùn)練算法要求也越來(lái)越高。
- 元宇宙的構(gòu)建需要協(xié)同創(chuàng)建、高精仿真、實(shí)時(shí)渲染、智能交互四大環(huán)節(jié),各個(gè)環(huán)節(jié)都會(huì)涉及到不同的計(jì)算類(lèi)型。
(以下為劉軍演講全文)
智算力就是創(chuàng)新力
當(dāng)今人工智能前沿領(lǐng)域的大模型,就是在智算算力驅(qū)動(dòng)下重大創(chuàng)新的典型,比如GPT-3,浪潮“源1.0”等等。
為此,浪潮提出用“算力當(dāng)量”來(lái)對(duì)AI任務(wù)所需算力總量進(jìn)行度量,單位是PetaFlops/s-day也就是PD,即用每秒千萬(wàn)億次的計(jì)算機(jī)完整運(yùn)行一天消耗的算力總量(PD)作為度量單位。
一個(gè)任務(wù)需要多少PD的計(jì)算量,就把它視為這個(gè)任務(wù)的“算力當(dāng)量”。
而現(xiàn)在人工智能的不斷發(fā)展也對(duì)算力有了更高的要求,在各個(gè)領(lǐng)域均是如此,在這里舉幾個(gè)簡(jiǎn)單的例子:
首先是AI大模型訓(xùn)練方面,GPT-3等自然語(yǔ)言模型和DALL-E 2、stable diffusion等多模態(tài)模型訓(xùn)練都對(duì)算力有著非常高的需求,GPT-3的算力當(dāng)量是3640個(gè)PD,源1.0作為2457億的參數(shù)的大模型,它的算力當(dāng)量是4095個(gè)PD。
再來(lái)講講元宇宙中數(shù)字人的建模和渲染,如果要?jiǎng)?chuàng)建一個(gè)栩栩如生的人物形象并對(duì)其進(jìn)行渲染,以《阿麗塔:戰(zhàn)斗天使》來(lái)舉例,它平均每一幀需要花100個(gè)小時(shí)來(lái)渲染,總共這部影片的渲染計(jì)算使用了4.32億小時(shí)的算力。
在自動(dòng)駕駛領(lǐng)域,特斯拉創(chuàng)建了DOJO的智算系統(tǒng),用于感知模型的訓(xùn)練和仿真。它的FSD全自動(dòng)駕駛系統(tǒng)的融合感知模型,訓(xùn)練消耗的算力當(dāng)量是500個(gè)PD。
在備受關(guān)注的AI+Science領(lǐng)域、蛋白質(zhì)的結(jié)構(gòu)預(yù)測(cè)、分子動(dòng)力學(xué)的模擬、流體力學(xué)的仿真,它不僅融合了傳統(tǒng)的HPC計(jì)算也融合了當(dāng)今的AI計(jì)算。
比如說(shuō),經(jīng)常被提及的AlphaFold2,它的訓(xùn)練消耗的算力當(dāng)量是300個(gè)PD。與此同時(shí),為AlphaFold2訓(xùn)練所做的數(shù)據(jù)準(zhǔn)備,也需要花費(fèi)200M CPU-hours HPC算力。
因此,我們可以確切地認(rèn)識(shí)到,今天在AI領(lǐng)域的眾多創(chuàng)新背后離不開(kāi)智算力的支撐,可以說(shuō)智算力就是創(chuàng)新力。
那么接下來(lái)就結(jié)合三個(gè)重要的趨勢(shì):算力多元化、模型巨量化以及元宇宙,談一談智算發(fā)展。
算力多元化
首先先來(lái)講下算力多元化。這是在不同的業(yè)務(wù)類(lèi)型對(duì)計(jì)算系統(tǒng)的不同要求下催生出的,也體現(xiàn)出了場(chǎng)景多樣化。
換句話說(shuō),AI應(yīng)用引入了新計(jì)算類(lèi)型,從推理到訓(xùn)練,跨度更大,同時(shí)數(shù)據(jù)量級(jí)不斷提升,類(lèi)型也更加復(fù)雜多樣。
當(dāng)然,不同數(shù)值精度的計(jì)算類(lèi)型對(duì)于芯片指令集、架構(gòu)的要求是不一樣的。
比如說(shuō),在超算里面可能會(huì)需要LP64雙精度的計(jì)算,在AI的訓(xùn)練需要使用數(shù)字范圍更大、精度低的16位浮點(diǎn),在AI推理的場(chǎng)景可以使用到8位或者是4位的整點(diǎn)。
而要適應(yīng)這些計(jì)算的特點(diǎn),就需要引入多元的算力芯片來(lái)進(jìn)行支撐,而浪潮也從軟件和硬件上兩方面來(lái)應(yīng)對(duì)多元算力的挑戰(zhàn)。
首先是硬件上,為了更好地推動(dòng)多元算力部署應(yīng)用、促進(jìn)AI算力生態(tài)健康發(fā)展,浪潮開(kāi)發(fā)了軟硬一體的多元算力支撐平臺(tái):浪潮AI服務(wù)器。
它采用高帶寬、全互聯(lián)的拓?fù)錁?gòu)架、開(kāi)放的硬件標(biāo)準(zhǔn),支持8顆500W液冷開(kāi)放加速芯片, 單集群可提供超過(guò)200PFLOPS峰值A(chǔ)I算力。
目前已兼容燧原、壁仞等多家高端AI算力芯片;基于這款服務(wù)器浪潮還與燧原科技聯(lián)合開(kāi)發(fā)了千卡級(jí)液冷智算中心產(chǎn)品——“錢(qián)塘江”,整體PUE實(shí)測(cè)值優(yōu)于1.05,能效比業(yè)界領(lǐng)先。
并且, “錢(qián)塘江”還搭載了浪潮AIStation智能業(yè)務(wù)創(chuàng)新生產(chǎn)平臺(tái),“源”巨量模型算法能力,構(gòu)成領(lǐng)先的算力算法一體化智算中心解決方案。
再來(lái)看看軟件方面,除了AI服務(wù)器之外,浪潮還開(kāi)發(fā)了業(yè)界首款智算中心算力調(diào)度軟件:AIStation,將異構(gòu)AI芯片管理進(jìn)行標(biāo)準(zhǔn)化與流程化。
從基本的接入適配到業(yè)務(wù)應(yīng)用在異構(gòu)算力的使用優(yōu)化,AIStation提供了完備的工具與解決方案,與傳統(tǒng)開(kāi)源方案相比,芯片接入穩(wěn)定性方面提升30%,減少接入工作量90%以上。
在大型智算中心項(xiàng)目上,AIStation能夠穩(wěn)定高效的管理2000+異構(gòu)AI芯片,支持上千戶同時(shí)在線開(kāi)發(fā),滿足多場(chǎng)景算法研發(fā)和大規(guī)模算力需求。
AIStation通過(guò)自研的算力調(diào)度系統(tǒng),實(shí)現(xiàn)降低接入成本50%,整理資源利用率提升30%,管理效率提升50%以上,還讓算力使用更便捷、更高效,降低AI開(kāi)發(fā)與部署對(duì)異構(gòu)算力使用的門(mén)檻,實(shí)現(xiàn)真正的算力普惠。
不僅如此,在實(shí)踐方面,浪潮也在不斷探索,依托于在AI服務(wù)器、AI軟件等方面的技術(shù)創(chuàng)新,目前宿州市與浪潮達(dá)成戰(zhàn)略合作,共同建設(shè)多元算力智算中心——淮海智算中心。
智算中心非常好地結(jié)合了GPU的算力芯片和國(guó)內(nèi)的AI智算芯片,通過(guò)AIStation系統(tǒng)實(shí)現(xiàn)了混合算力的調(diào)度。
它采用通用GPU可提供FP64雙精度、FP32單精度,F(xiàn)P16半精度及INT8整形等多種精度算力,支持專(zhuān)用的深度學(xué)習(xí)張量加速單元Tensorcore,比傳統(tǒng)計(jì)算單元算力提升十倍以上。
并且還支持國(guó)內(nèi)外主流的深度學(xué)習(xí)的框架、數(shù)學(xué)庫(kù)、數(shù)據(jù)集降低用戶的學(xué)習(xí)成本。
此外,智算中心還采用MLU370-M8芯片,采用先進(jìn)的OAM芯片間高速互聯(lián)架構(gòu),提供國(guó)內(nèi)唯一一個(gè)能支持八顆國(guó)內(nèi)高端AI芯片高速互聯(lián)的的平臺(tái)系統(tǒng),AI芯片間的高速互聯(lián)有利于提升大規(guī)模分布式訓(xùn)練的性能。
模型巨量化
然后是模型巨量化,目前在AI算法方面,一個(gè)明顯的趨勢(shì)就是在從感知智能向認(rèn)知智能邁進(jìn),AI模型從“能聽(tīng)會(huì)看”逐步走向“能思考,會(huì)創(chuàng)作”,甚至推理、決策的層面。
模型巨量化也就是通常所說(shuō)的大模型,大模型正在成為AIGC的算法引擎,無(wú)論是DALL-E,還是今年爆火的Stable Diffusion,它們背后都是大模型在驅(qū)動(dòng)。
大模型使得我們今天能夠從AI五年前的能聽(tīng)會(huì)看走到今天能思考、會(huì)創(chuàng)作,下一步它也即將朝著會(huì)推理、能決策發(fā)展。
不過(guò)大模型在算力方面也面臨著巨大的挑戰(zhàn):如何能夠把大模型的能力交付到眾多的中小的企業(yè),幫助他們實(shí)現(xiàn)智能化的轉(zhuǎn)型?
在這方面,浪潮認(rèn)為Model as a service(MaaS)是比較好的一種方式。
在大模型能力的加持下,目前的AIGC,比如文本的生成、文生圖以及虛擬數(shù)字人等應(yīng)用都會(huì)迅速進(jìn)入到商業(yè)化階段。
就拿浪潮去年推出的源1.0來(lái)說(shuō),它是面向中文語(yǔ)言的擁有2457億參數(shù)的巨量模型。
在算力這一塊兒,浪潮做了大量深入的優(yōu)化,實(shí)現(xiàn)了數(shù)據(jù)并行、流水線并行以及在算力的效率層面達(dá)到了45%的算力利用率。
也就是說(shuō),這已經(jīng)遙遙領(lǐng)先于GPT-3,包括一些像megatron的大型訓(xùn)練的模型。
與此同時(shí),源1.0還通過(guò)對(duì)推理框架的優(yōu)化,現(xiàn)在已經(jīng)實(shí)現(xiàn)了對(duì)多款A(yù)I芯片的支持。
這么強(qiáng)大的算力具體在源1.0上是怎么體現(xiàn)的?舉幾個(gè)簡(jiǎn)單的例子。
第一個(gè)是基于源1.0構(gòu)建的AI劇本殺,在給定的背景和場(chǎng)景下,讓AI與人進(jìn)行多輪開(kāi)放式對(duì)話,不但需要AI能夠創(chuàng)造性思考,理解人的情感,甚至還需要有策略地與人博弈,影響對(duì)話走向。
這款A(yù)I劇本殺最后展現(xiàn)出來(lái)的效果也很強(qiáng)大,玩家很難感受到這是一個(gè)AI的玩家在和他一起玩劇本殺,因?yàn)樗谶@里面所表現(xiàn)出來(lái)的引導(dǎo)能力、情景化的理解能力是我們?cè)趥鹘y(tǒng)的AI算法上面很難見(jiàn)到的。
這個(gè)項(xiàng)目已經(jīng)在GitHub上開(kāi)源,感興趣的話可以查看。
第二個(gè)案例是,上海一個(gè)開(kāi)發(fā)者的群體基于源1.0構(gòu)建了數(shù)字社區(qū)助理,換句話說(shuō),就是打造了一個(gè)教練來(lái)提升居委會(huì)社區(qū)工作者應(yīng)對(duì)居民的突發(fā)狀況服務(wù)的能力。
同時(shí)這也開(kāi)啟了一個(gè)新的想象空間,也就是新的教培領(lǐng)域的產(chǎn)業(yè)。
還有一個(gè)案例就是基于源1.0的公文寫(xiě)作助手,最近AIGC領(lǐng)域備受熱議的當(dāng)屬ChatGPT了,也不用多做解釋?zhuān)?jiǎn)單來(lái)說(shuō)它就是基于大模型的一個(gè)AIGC面向長(zhǎng)文本、多輪對(duì)話的應(yīng)用。
而浪潮的公文寫(xiě)作助手也是生成文本的AI,專(zhuān)門(mén)面向公文寫(xiě)作場(chǎng)景,通過(guò)在高質(zhì)量公文數(shù)據(jù)上進(jìn)行知識(shí)蒸餾,構(gòu)建的公文寫(xiě)作技能模型可支持總結(jié)報(bào)告、學(xué)習(xí)心得等內(nèi)容輔助寫(xiě)作。
最終可實(shí)現(xiàn)從語(yǔ)義到段落級(jí)、篇章級(jí)文本生成和優(yōu)化,輔助文字工作者打造高質(zhì)量文案。
目前這個(gè)AI還處于內(nèi)測(cè)階段,歡迎大家來(lái)申請(qǐng)使用。
除了上面說(shuō)的那些具體應(yīng)用之外,浪潮也把這樣的大模型應(yīng)用在自身業(yè)務(wù)上面,以實(shí)現(xiàn)自身業(yè)務(wù)智能化的轉(zhuǎn)型。
作為中國(guó)最大、全球第二的服務(wù)器的廠商,浪潮構(gòu)建了一個(gè)基于源1.0的龐大的客戶服務(wù)系統(tǒng),并且不同于傳統(tǒng)的智能化客服的問(wèn)答系統(tǒng),浪潮的系統(tǒng)可以進(jìn)行長(zhǎng)文本的內(nèi)容生成,能夠持續(xù)的進(jìn)行多輪的對(duì)話。
更重要的是它不僅僅基于一個(gè)知識(shí)的規(guī)則去構(gòu)建問(wèn)答系統(tǒng),還可以自己去主動(dòng)閱讀全球所有和服務(wù)器相關(guān)的產(chǎn)品文檔。
可以說(shuō)這個(gè)系統(tǒng)是真正的服務(wù)器“服務(wù)大佬”,在它的支撐下,客戶的支持效率得到了大幅的提升,它也榮獲了《哈佛商業(yè)評(píng)論》年度新技術(shù)突破獎(jiǎng)這樣一個(gè)頂格獎(jiǎng)。
元宇宙需要強(qiáng)大算力支撐
最后一個(gè)再來(lái)說(shuō)說(shuō)元宇宙,先拋出一個(gè)問(wèn)題,大家覺(jué)得元宇宙需要算力嗎?
答案是不僅需要,而且是非常需要!元宇宙的構(gòu)建包括協(xié)同創(chuàng)建、高精仿真、實(shí)時(shí)渲染、智能交互四大環(huán)節(jié),這其中每個(gè)環(huán)節(jié)都涉及到不同的計(jì)算類(lèi)型,需要大量的算力去支撐。
比如說(shuō)在協(xié)同創(chuàng)建階段,會(huì)涉及到多個(gè)3D軟件的協(xié)同,這時(shí)便需要桌面虛擬化來(lái)給建模工程師提供工作界面。
在高精仿真階段,需要進(jìn)行元宇宙場(chǎng)景的物理仿真,既有傳統(tǒng)的基于HPC的仿真軟件,也有基于AI的仿真算法。同時(shí)也會(huì)涉及到對(duì)仿真結(jié)果的可視化展示。
對(duì)于元宇宙來(lái)說(shuō),3D場(chǎng)景的實(shí)施渲染是必不可少的,因此像光線追蹤,路徑追蹤等前沿的圖像渲染算法,和DLSS等基于AI的算法,也是必不可少的。
最后,人工智能計(jì)算在元宇宙的智能交互環(huán)節(jié)會(huì)有很多應(yīng)用。比如數(shù)字人和環(huán)境的交互會(huì)涉及到ASR、TTS、NLP等多種AI算法。
如此種種都對(duì)算力基礎(chǔ)設(shè)施提出更高的要求,不僅僅要求高性能、低延遲、易擴(kuò)展的硬件平臺(tái),還要求有端到端、生態(tài)豐富、易用的軟件棧。
在此,浪潮推出了元宇宙服務(wù)器MetaEngine,旨在打造支撐元宇宙的軟硬一體化算力基礎(chǔ)設(shè)施。
在硬件上,采用浪潮領(lǐng)先的異構(gòu)加速服務(wù)器的旗艦系統(tǒng),支持最先進(jìn)的CPU和GPU,具有強(qiáng)大的RDMA通信和數(shù)據(jù)存儲(chǔ)能力,可提供強(qiáng)大的渲染和AI計(jì)算能力。
在軟件上,MetaEngine可以支持對(duì)應(yīng)每個(gè)作業(yè)環(huán)節(jié)的各類(lèi)專(zhuān)業(yè)軟件工具,用戶可以根據(jù)使用習(xí)慣靈活選擇,同時(shí)它還可以系統(tǒng)全面支持Nvidia Omniverse Enterprise。
當(dāng)前MetaEngine可實(shí)現(xiàn)每秒AIGC 2000+場(chǎng)景,支持1000+XR用戶同時(shí)接入,共享10K超高清3D數(shù)字世界順暢體驗(yàn)。
當(dāng)然在具體的實(shí)踐方面,浪潮也穩(wěn)步前進(jìn),為了推動(dòng)了元宇宙的快速落地,上個(gè)月青田人民政府和浪潮信息,谷梵科技一起簽約建設(shè)國(guó)內(nèi)首個(gè)元宇宙算力中心。
這個(gè)元宇宙算力中心用于支撐在青田、浙江乃至于長(zhǎng)三角在元宇宙的數(shù)字空間創(chuàng)建、數(shù)字產(chǎn)業(yè)發(fā)展,支撐數(shù)字經(jīng)濟(jì)、數(shù)實(shí)融合的發(fā)展。
謝謝大家!
(最后,如果想回看大會(huì)全程,請(qǐng)點(diǎn)擊閱讀原文)
- 北大開(kāi)源最強(qiáng)aiXcoder-7B代碼大模型!聚焦真實(shí)開(kāi)發(fā)場(chǎng)景,專(zhuān)為企業(yè)私有部署設(shè)計(jì)2024-04-09
- 剛剛,圖靈獎(jiǎng)揭曉!史上首位數(shù)學(xué)和計(jì)算機(jī)最高獎(jiǎng)“雙料王”出現(xiàn)了2024-04-10
- 8.3K Stars!《多模態(tài)大語(yǔ)言模型綜述》重大升級(jí)2024-04-10
- 谷歌最強(qiáng)大模型免費(fèi)開(kāi)放了!長(zhǎng)音頻理解功能獨(dú)一份,100萬(wàn)上下文敞開(kāi)用2024-04-10