浪潮信息劉軍:智算力就是創(chuàng)新力 | MEET2023
AI領(lǐng)域的眾多創(chuàng)新背后都離不開智算力的支撐
Pine 整理自 MEET2023
量子位 | 公眾號 QbitAI
在人工智能的三駕馬車中,算力作為算法和數(shù)據(jù)的支撐,它的作用一直都不容小覷。
目前,人工智能在和各個行業(yè)不斷融合發(fā)展,這對算力也提出了更高的要求。
無論是AI大模型訓(xùn)練,自動駕駛系統(tǒng)的感知模型訓(xùn)練,還是AI+Science或者數(shù)字人的建?;蜾秩荆茧x不開強(qiáng)大算力的支撐。
在MEET2023智能未來大會上,浪潮信息副總裁、浪潮人工智能與高性能計(jì)算產(chǎn)品線總經(jīng)理劉軍分享了在AI新時(shí)代,他對智算算力的一些思考,并拋出了這樣一個觀點(diǎn):
智算力就是創(chuàng)新力。
為了完整體現(xiàn)劉軍的分享及思考,在不改變原意的基礎(chǔ)上,量子位對他的演講內(nèi)容進(jìn)行了編輯整理。
關(guān)于MEET 智能未來大會:MEET大會是由量子位主辦的智能科技領(lǐng)域頂級商業(yè)峰會,致力于探討前沿科技技術(shù)的落地與行業(yè)應(yīng)用。今年共有數(shù)十家主流媒體及直播平臺報(bào)道直播了MEET2023大會,吸引了超過300萬行業(yè)用戶線上參會,全網(wǎng)總曝光量累計(jì)超過2000萬。
演講要點(diǎn)
- 目前智算的發(fā)展有三個趨勢:算力多元化、模型巨量化、元宇宙。
- 計(jì)算的目標(biāo)是支撐業(yè)務(wù),不同的業(yè)務(wù)類型對計(jì)算系統(tǒng)提出的需求也是不同的。
- AI算法正在從感知智能向認(rèn)知智能邁進(jìn),模型參數(shù)持續(xù)增大,預(yù)訓(xùn)練算法要求也越來越高。
- 元宇宙的構(gòu)建需要協(xié)同創(chuàng)建、高精仿真、實(shí)時(shí)渲染、智能交互四大環(huán)節(jié),各個環(huán)節(jié)都會涉及到不同的計(jì)算類型。
(以下為劉軍演講全文)
智算力就是創(chuàng)新力
當(dāng)今人工智能前沿領(lǐng)域的大模型,就是在智算算力驅(qū)動下重大創(chuàng)新的典型,比如GPT-3,浪潮“源1.0”等等。
為此,浪潮提出用“算力當(dāng)量”來對AI任務(wù)所需算力總量進(jìn)行度量,單位是PetaFlops/s-day也就是PD,即用每秒千萬億次的計(jì)算機(jī)完整運(yùn)行一天消耗的算力總量(PD)作為度量單位。
一個任務(wù)需要多少PD的計(jì)算量,就把它視為這個任務(wù)的“算力當(dāng)量”。
而現(xiàn)在人工智能的不斷發(fā)展也對算力有了更高的要求,在各個領(lǐng)域均是如此,在這里舉幾個簡單的例子:
首先是AI大模型訓(xùn)練方面,GPT-3等自然語言模型和DALL-E 2、stable diffusion等多模態(tài)模型訓(xùn)練都對算力有著非常高的需求,GPT-3的算力當(dāng)量是3640個PD,源1.0作為2457億的參數(shù)的大模型,它的算力當(dāng)量是4095個PD。
再來講講元宇宙中數(shù)字人的建模和渲染,如果要創(chuàng)建一個栩栩如生的人物形象并對其進(jìn)行渲染,以《阿麗塔:戰(zhàn)斗天使》來舉例,它平均每一幀需要花100個小時(shí)來渲染,總共這部影片的渲染計(jì)算使用了4.32億小時(shí)的算力。
在自動駕駛領(lǐng)域,特斯拉創(chuàng)建了DOJO的智算系統(tǒng),用于感知模型的訓(xùn)練和仿真。它的FSD全自動駕駛系統(tǒng)的融合感知模型,訓(xùn)練消耗的算力當(dāng)量是500個PD。
在備受關(guān)注的AI+Science領(lǐng)域、蛋白質(zhì)的結(jié)構(gòu)預(yù)測、分子動力學(xué)的模擬、流體力學(xué)的仿真,它不僅融合了傳統(tǒng)的HPC計(jì)算也融合了當(dāng)今的AI計(jì)算。
比如說,經(jīng)常被提及的AlphaFold2,它的訓(xùn)練消耗的算力當(dāng)量是300個PD。與此同時(shí),為AlphaFold2訓(xùn)練所做的數(shù)據(jù)準(zhǔn)備,也需要花費(fèi)200M CPU-hours HPC算力。
因此,我們可以確切地認(rèn)識到,今天在AI領(lǐng)域的眾多創(chuàng)新背后離不開智算力的支撐,可以說智算力就是創(chuàng)新力。
那么接下來就結(jié)合三個重要的趨勢:算力多元化、模型巨量化以及元宇宙,談一談智算發(fā)展。
算力多元化
首先先來講下算力多元化。這是在不同的業(yè)務(wù)類型對計(jì)算系統(tǒng)的不同要求下催生出的,也體現(xiàn)出了場景多樣化。
換句話說,AI應(yīng)用引入了新計(jì)算類型,從推理到訓(xùn)練,跨度更大,同時(shí)數(shù)據(jù)量級不斷提升,類型也更加復(fù)雜多樣。
當(dāng)然,不同數(shù)值精度的計(jì)算類型對于芯片指令集、架構(gòu)的要求是不一樣的。
比如說,在超算里面可能會需要LP64雙精度的計(jì)算,在AI的訓(xùn)練需要使用數(shù)字范圍更大、精度低的16位浮點(diǎn),在AI推理的場景可以使用到8位或者是4位的整點(diǎn)。
而要適應(yīng)這些計(jì)算的特點(diǎn),就需要引入多元的算力芯片來進(jìn)行支撐,而浪潮也從軟件和硬件上兩方面來應(yīng)對多元算力的挑戰(zhàn)。
首先是硬件上,為了更好地推動多元算力部署應(yīng)用、促進(jìn)AI算力生態(tài)健康發(fā)展,浪潮開發(fā)了軟硬一體的多元算力支撐平臺:浪潮AI服務(wù)器。
它采用高帶寬、全互聯(lián)的拓?fù)錁?gòu)架、開放的硬件標(biāo)準(zhǔn),支持8顆500W液冷開放加速芯片, 單集群可提供超過200PFLOPS峰值A(chǔ)I算力。
目前已兼容燧原、壁仞等多家高端AI算力芯片;基于這款服務(wù)器浪潮還與燧原科技聯(lián)合開發(fā)了千卡級液冷智算中心產(chǎn)品——“錢塘江”,整體PUE實(shí)測值優(yōu)于1.05,能效比業(yè)界領(lǐng)先。
并且, “錢塘江”還搭載了浪潮AIStation智能業(yè)務(wù)創(chuàng)新生產(chǎn)平臺,“源”巨量模型算法能力,構(gòu)成領(lǐng)先的算力算法一體化智算中心解決方案。
再來看看軟件方面,除了AI服務(wù)器之外,浪潮還開發(fā)了業(yè)界首款智算中心算力調(diào)度軟件:AIStation,將異構(gòu)AI芯片管理進(jìn)行標(biāo)準(zhǔn)化與流程化。
從基本的接入適配到業(yè)務(wù)應(yīng)用在異構(gòu)算力的使用優(yōu)化,AIStation提供了完備的工具與解決方案,與傳統(tǒng)開源方案相比,芯片接入穩(wěn)定性方面提升30%,減少接入工作量90%以上。
在大型智算中心項(xiàng)目上,AIStation能夠穩(wěn)定高效的管理2000+異構(gòu)AI芯片,支持上千戶同時(shí)在線開發(fā),滿足多場景算法研發(fā)和大規(guī)模算力需求。
AIStation通過自研的算力調(diào)度系統(tǒng),實(shí)現(xiàn)降低接入成本50%,整理資源利用率提升30%,管理效率提升50%以上,還讓算力使用更便捷、更高效,降低AI開發(fā)與部署對異構(gòu)算力使用的門檻,實(shí)現(xiàn)真正的算力普惠。
不僅如此,在實(shí)踐方面,浪潮也在不斷探索,依托于在AI服務(wù)器、AI軟件等方面的技術(shù)創(chuàng)新,目前宿州市與浪潮達(dá)成戰(zhàn)略合作,共同建設(shè)多元算力智算中心——淮海智算中心。
智算中心非常好地結(jié)合了GPU的算力芯片和國內(nèi)的AI智算芯片,通過AIStation系統(tǒng)實(shí)現(xiàn)了混合算力的調(diào)度。
它采用通用GPU可提供FP64雙精度、FP32單精度,F(xiàn)P16半精度及INT8整形等多種精度算力,支持專用的深度學(xué)習(xí)張量加速單元Tensorcore,比傳統(tǒng)計(jì)算單元算力提升十倍以上。
并且還支持國內(nèi)外主流的深度學(xué)習(xí)的框架、數(shù)學(xué)庫、數(shù)據(jù)集降低用戶的學(xué)習(xí)成本。
此外,智算中心還采用MLU370-M8芯片,采用先進(jìn)的OAM芯片間高速互聯(lián)架構(gòu),提供國內(nèi)唯一一個能支持八顆國內(nèi)高端AI芯片高速互聯(lián)的的平臺系統(tǒng),AI芯片間的高速互聯(lián)有利于提升大規(guī)模分布式訓(xùn)練的性能。
模型巨量化
然后是模型巨量化,目前在AI算法方面,一個明顯的趨勢就是在從感知智能向認(rèn)知智能邁進(jìn),AI模型從“能聽會看”逐步走向“能思考,會創(chuàng)作”,甚至推理、決策的層面。
模型巨量化也就是通常所說的大模型,大模型正在成為AIGC的算法引擎,無論是DALL-E,還是今年爆火的Stable Diffusion,它們背后都是大模型在驅(qū)動。
大模型使得我們今天能夠從AI五年前的能聽會看走到今天能思考、會創(chuàng)作,下一步它也即將朝著會推理、能決策發(fā)展。
不過大模型在算力方面也面臨著巨大的挑戰(zhàn):如何能夠把大模型的能力交付到眾多的中小的企業(yè),幫助他們實(shí)現(xiàn)智能化的轉(zhuǎn)型?
在這方面,浪潮認(rèn)為Model as a service(MaaS)是比較好的一種方式。
在大模型能力的加持下,目前的AIGC,比如文本的生成、文生圖以及虛擬數(shù)字人等應(yīng)用都會迅速進(jìn)入到商業(yè)化階段。
就拿浪潮去年推出的源1.0來說,它是面向中文語言的擁有2457億參數(shù)的巨量模型。
在算力這一塊兒,浪潮做了大量深入的優(yōu)化,實(shí)現(xiàn)了數(shù)據(jù)并行、流水線并行以及在算力的效率層面達(dá)到了45%的算力利用率。
也就是說,這已經(jīng)遙遙領(lǐng)先于GPT-3,包括一些像megatron的大型訓(xùn)練的模型。
與此同時(shí),源1.0還通過對推理框架的優(yōu)化,現(xiàn)在已經(jīng)實(shí)現(xiàn)了對多款A(yù)I芯片的支持。
這么強(qiáng)大的算力具體在源1.0上是怎么體現(xiàn)的?舉幾個簡單的例子。
第一個是基于源1.0構(gòu)建的AI劇本殺,在給定的背景和場景下,讓AI與人進(jìn)行多輪開放式對話,不但需要AI能夠創(chuàng)造性思考,理解人的情感,甚至還需要有策略地與人博弈,影響對話走向。
這款A(yù)I劇本殺最后展現(xiàn)出來的效果也很強(qiáng)大,玩家很難感受到這是一個AI的玩家在和他一起玩劇本殺,因?yàn)樗谶@里面所表現(xiàn)出來的引導(dǎo)能力、情景化的理解能力是我們在傳統(tǒng)的AI算法上面很難見到的。
這個項(xiàng)目已經(jīng)在GitHub上開源,感興趣的話可以查看。
第二個案例是,上海一個開發(fā)者的群體基于源1.0構(gòu)建了數(shù)字社區(qū)助理,換句話說,就是打造了一個教練來提升居委會社區(qū)工作者應(yīng)對居民的突發(fā)狀況服務(wù)的能力。
同時(shí)這也開啟了一個新的想象空間,也就是新的教培領(lǐng)域的產(chǎn)業(yè)。
還有一個案例就是基于源1.0的公文寫作助手,最近AIGC領(lǐng)域備受熱議的當(dāng)屬ChatGPT了,也不用多做解釋,簡單來說它就是基于大模型的一個AIGC面向長文本、多輪對話的應(yīng)用。
而浪潮的公文寫作助手也是生成文本的AI,專門面向公文寫作場景,通過在高質(zhì)量公文數(shù)據(jù)上進(jìn)行知識蒸餾,構(gòu)建的公文寫作技能模型可支持總結(jié)報(bào)告、學(xué)習(xí)心得等內(nèi)容輔助寫作。
最終可實(shí)現(xiàn)從語義到段落級、篇章級文本生成和優(yōu)化,輔助文字工作者打造高質(zhì)量文案。
目前這個AI還處于內(nèi)測階段,歡迎大家來申請使用。
除了上面說的那些具體應(yīng)用之外,浪潮也把這樣的大模型應(yīng)用在自身業(yè)務(wù)上面,以實(shí)現(xiàn)自身業(yè)務(wù)智能化的轉(zhuǎn)型。
作為中國最大、全球第二的服務(wù)器的廠商,浪潮構(gòu)建了一個基于源1.0的龐大的客戶服務(wù)系統(tǒng),并且不同于傳統(tǒng)的智能化客服的問答系統(tǒng),浪潮的系統(tǒng)可以進(jìn)行長文本的內(nèi)容生成,能夠持續(xù)的進(jìn)行多輪的對話。
更重要的是它不僅僅基于一個知識的規(guī)則去構(gòu)建問答系統(tǒng),還可以自己去主動閱讀全球所有和服務(wù)器相關(guān)的產(chǎn)品文檔。
可以說這個系統(tǒng)是真正的服務(wù)器“服務(wù)大佬”,在它的支撐下,客戶的支持效率得到了大幅的提升,它也榮獲了《哈佛商業(yè)評論》年度新技術(shù)突破獎這樣一個頂格獎。
元宇宙需要強(qiáng)大算力支撐
最后一個再來說說元宇宙,先拋出一個問題,大家覺得元宇宙需要算力嗎?
答案是不僅需要,而且是非常需要!元宇宙的構(gòu)建包括協(xié)同創(chuàng)建、高精仿真、實(shí)時(shí)渲染、智能交互四大環(huán)節(jié),這其中每個環(huán)節(jié)都涉及到不同的計(jì)算類型,需要大量的算力去支撐。
比如說在協(xié)同創(chuàng)建階段,會涉及到多個3D軟件的協(xié)同,這時(shí)便需要桌面虛擬化來給建模工程師提供工作界面。
在高精仿真階段,需要進(jìn)行元宇宙場景的物理仿真,既有傳統(tǒng)的基于HPC的仿真軟件,也有基于AI的仿真算法。同時(shí)也會涉及到對仿真結(jié)果的可視化展示。
對于元宇宙來說,3D場景的實(shí)施渲染是必不可少的,因此像光線追蹤,路徑追蹤等前沿的圖像渲染算法,和DLSS等基于AI的算法,也是必不可少的。
最后,人工智能計(jì)算在元宇宙的智能交互環(huán)節(jié)會有很多應(yīng)用。比如數(shù)字人和環(huán)境的交互會涉及到ASR、TTS、NLP等多種AI算法。
如此種種都對算力基礎(chǔ)設(shè)施提出更高的要求,不僅僅要求高性能、低延遲、易擴(kuò)展的硬件平臺,還要求有端到端、生態(tài)豐富、易用的軟件棧。
在此,浪潮推出了元宇宙服務(wù)器MetaEngine,旨在打造支撐元宇宙的軟硬一體化算力基礎(chǔ)設(shè)施。
在硬件上,采用浪潮領(lǐng)先的異構(gòu)加速服務(wù)器的旗艦系統(tǒng),支持最先進(jìn)的CPU和GPU,具有強(qiáng)大的RDMA通信和數(shù)據(jù)存儲能力,可提供強(qiáng)大的渲染和AI計(jì)算能力。
在軟件上,MetaEngine可以支持對應(yīng)每個作業(yè)環(huán)節(jié)的各類專業(yè)軟件工具,用戶可以根據(jù)使用習(xí)慣靈活選擇,同時(shí)它還可以系統(tǒng)全面支持Nvidia Omniverse Enterprise。
當(dāng)前MetaEngine可實(shí)現(xiàn)每秒AIGC 2000+場景,支持1000+XR用戶同時(shí)接入,共享10K超高清3D數(shù)字世界順暢體驗(yàn)。
當(dāng)然在具體的實(shí)踐方面,浪潮也穩(wěn)步前進(jìn),為了推動了元宇宙的快速落地,上個月青田人民政府和浪潮信息,谷梵科技一起簽約建設(shè)國內(nèi)首個元宇宙算力中心。
這個元宇宙算力中心用于支撐在青田、浙江乃至于長三角在元宇宙的數(shù)字空間創(chuàng)建、數(shù)字產(chǎn)業(yè)發(fā)展,支撐數(shù)字經(jīng)濟(jì)、數(shù)實(shí)融合的發(fā)展。
謝謝大家!
(最后,如果想回看大會全程,請點(diǎn)擊閱讀原文)