人間一年,AI時(shí)代發(fā)電廠在京浮出水面!國產(chǎn)芯片集結(jié),智能算力開箱即用
劍指AI產(chǎn)業(yè)的算力和數(shù)據(jù)焦慮
克雷西 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
人工智能毫無疑問是當(dāng)今一項(xiàng)重要議題,通過大模型、垂類應(yīng)用、智能體等多種方式推動著數(shù)字經(jīng)濟(jì)的發(fā)展。
然而,服務(wù)AI的基礎(chǔ)設(shè)施——算力和數(shù)據(jù),是限制人工智能發(fā)展的瓶頸,也成了進(jìn)一步討論的話題。
為什么到現(xiàn)在仍然存在這樣的瓶頸?又該如何打破?
我們在成立一年的北電數(shù)智所做的事里看到了一些答案——
一座集結(jié)了“開箱可用”的國產(chǎn)算力的“AI工廠”,已然在北京浮出水面。
“AI工廠”劍指算力焦慮
無論是對于單一從業(yè)者還是整個(gè)行業(yè),有效算力的缺乏都是一個(gè)亟待解決的痛點(diǎn)。
站在需求側(cè)來看,以大模型為代表的生成式AI蓬勃發(fā)展,激烈的“百模大戰(zhàn)”,推理時(shí)代的即將到來,無疑都帶來了巨量的算力需求增長。
中國工程院等十余家機(jī)構(gòu)聯(lián)名在Science子刊Intelligent Computing上發(fā)表的一份報(bào)告指出,人工智能所需的計(jì)算能力每100天翻一番,照這樣計(jì)算,預(yù)計(jì)在未來五年內(nèi)將增加超過100萬倍。
而且,人工智能時(shí)代,對算力的需求已經(jīng)不僅僅是FLOPS的數(shù)量,算力需求的結(jié)構(gòu)也發(fā)生了很大變化。
AIGC時(shí)代,算力的結(jié)構(gòu)形式已經(jīng)從CPU+加速器轉(zhuǎn)變?yōu)橐訥PU主導(dǎo)的大規(guī)模并行計(jì)算,智能算力占比快速提升。
但當(dāng)前,國產(chǎn)芯片,特別是高端芯片,在很多方面與業(yè)界先進(jìn)產(chǎn)品在算力性能、功耗墻、卡間通信速率等存在代際差距。
非芯片因素也在限制著算力的高效利用,如節(jié)點(diǎn)間的網(wǎng)絡(luò)傳輸能力不足、配套軟件生態(tài)不完善等等,不勝枚舉。
在這樣的現(xiàn)實(shí)之下,大部分的國產(chǎn)智能算力無法高效利用,催生出了業(yè)界對算力的第二重焦慮。
造成這樣焦慮的根本原因,在于使用方對多芯特別是國產(chǎn)算力的能力認(rèn)知不夠清晰,可以概括為幾個(gè)方面:
- 國內(nèi)大規(guī)模多芯集群能力欠缺,無法支持大規(guī)模的、接近生產(chǎn)環(huán)境的算力適配、評測。換言之,單芯片測試只能對卡間互聯(lián)、計(jì)算節(jié)點(diǎn)間給出預(yù)估數(shù)據(jù),對于加速比的數(shù)據(jù)更是卻為空白;
- 現(xiàn)有平臺以指數(shù)型評測指標(biāo)為主,不能和用戶業(yè)務(wù)場景進(jìn)行聯(lián)系,沒有完全打通從業(yè)務(wù)場景到底層芯片的適配鏈路,也就是說實(shí)際的使用方,無法了解和判斷多芯集群是否能夠滿足自己的需求;
- 國內(nèi)缺少多芯異構(gòu)的服務(wù)性平臺,也缺少多芯異構(gòu)、混合訓(xùn)練、推理任務(wù)的嘗試。
總體來說,需求方不知道供給方能夠提供的服務(wù)以及對自己實(shí)際業(yè)務(wù)的支持程度,供給方缺乏一個(gè)平臺來展示自身能力和能夠做到的事情,同時(shí)有一個(gè)公正且清晰的評估和標(biāo)準(zhǔn)。
為了打破這樣的認(rèn)知,破解算力焦慮的迷局,一個(gè)名為“星火·智算”的AIDC品牌應(yīng)運(yùn)而生。
“星星之火,可以燎原”,選擇“星火”這樣的名稱,是方案提供者希望這一品牌能夠以燎原之勢,實(shí)現(xiàn)全國范圍的復(fù)制。
提出這一方案的,是北電數(shù)智——北京電控旗下一家專注于人工智能的高科技企業(yè)。
北電數(shù)智認(rèn)為,算力是人工智能時(shí)代一種新的生產(chǎn)力形式:
在農(nóng)耕時(shí)代,大地就是算力;
機(jī)器時(shí)代,電力、蒸汽力就是算力;
在人工智能時(shí)代,算力就是煤水電一樣,是第一生產(chǎn)力的方式。
為了把算力變成電力一樣的生產(chǎn)力要素,目光就不能就不能再只做簡單的芯片、服務(wù)器、機(jī)柜的堆疊,而是要從“算力倉庫”向著“AI工廠”的方向轉(zhuǎn)型,配備相應(yīng)的新質(zhì)生產(chǎn)關(guān)系。
這也是北電數(shù)智在打造星火·智算時(shí)的新思路。
具體來講,星火·智算一方面通過提供普惠算力,如水電煤般支持人工智能技術(shù)的創(chuàng)新和應(yīng)用。
另一方面,以“AIDC 即服務(wù)”理念,提供底座大模型、行業(yè)大模型以及一站式工具鏈等配套服務(wù),讓企業(yè)可以方便快捷地搭建出想要的應(yīng)用或者重構(gòu)現(xiàn)在的產(chǎn)品,實(shí)現(xiàn)生產(chǎn)方式的創(chuàng)新。
目前,“星火·智算”品牌的首個(gè)標(biāo)桿項(xiàng)目——北京市數(shù)字經(jīng)濟(jì)算力中心已經(jīng)開工建設(shè),未來將作為模板推向全國。
為更好地助力算力升級,北電數(shù)智還有兩款核心產(chǎn)品,全面向著產(chǎn)業(yè)中的算力焦慮出擊:
- 前進(jìn)·AI異構(gòu)計(jì)算平臺,針對當(dāng)下高端算力資源緊缺局面,配置最符合國內(nèi)市場需求的多芯異構(gòu)方案;
- 寶塔·大模型適配平臺,向下廣泛適配芯片,使芯片與大模型廣泛解耦和適配;
兩個(gè)產(chǎn)品“一體兩面”,從不同的維度解決算力焦慮。
前進(jìn)·AI異構(gòu)計(jì)算平臺作為全棧國產(chǎn)算力迭代驗(yàn)證平臺,能夠?qū)崿F(xiàn)多種算力的統(tǒng)一管理與調(diào)度,同時(shí)首推效果式計(jì)費(fèi),用戶無需掌握底層細(xì)節(jié)即可按需應(yīng)用,并實(shí)現(xiàn)多種算力之間的平滑遷移。
為了讓算力能夠更好被運(yùn)用,星火·智算也通過統(tǒng)一通信、編譯優(yōu)化等技術(shù)突破,前進(jìn)·AI異構(gòu)計(jì)算平臺可以讓國產(chǎn)芯片性能提升2-3倍,吞吐量提升6-7倍。
在為用戶提供算力支持的同時(shí),前進(jìn)·AI異構(gòu)計(jì)算平臺還打造了“芯片×模型×場景”的全新評測模式,幫助打破廠商與使用者之間的信息不對稱,助力芯片廠商破局,讓國產(chǎn)芯片從“可用”到“好用”。
這意味著,在給用戶提供算力支持的同時(shí)在推動國產(chǎn)芯片實(shí)現(xiàn)全面提升,帶來更多的源頭算力。
寶塔·大模型適配系統(tǒng)則是賦能模型和應(yīng)用側(cè),支持模型部署、管理,做算力的精細(xì)化運(yùn)營管理,進(jìn)一步向上支撐人工智能應(yīng)用。
讓高質(zhì)量數(shù)據(jù)流通起來
如果說算力缺陷是AI大廈上的一朵“烏云”,那么數(shù)據(jù)上的不足就是當(dāng)之無愧的另一朵。
北電數(shù)智首席科學(xué)家、復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院特聘教授竇德景的公開演講表示,數(shù)據(jù)規(guī)模與質(zhì)量,決定了AI的“上限”——無論是訓(xùn)練還是推理,都需要高質(zhì)量的數(shù)據(jù)作為支持。
以Meta最新發(fā)布的開源大模型Llama 3.1為例,其第三代模型在超1.6萬個(gè)H100 GPU上消耗的訓(xùn)練數(shù)據(jù)量為15T tokens,是第二代的7倍,這也成就了兩代之間相同參數(shù)規(guī)模下的性能飛躍。
在我國,數(shù)據(jù)供給側(cè)的現(xiàn)狀也與算力一樣面臨焦慮——總量豐富,但高質(zhì)量數(shù)據(jù)煙囪林立。
據(jù)IDC測算,2022-2027年,中國的數(shù)據(jù)量規(guī)模將由23.88ZB增長至76.6ZB,處于世界一流,但是可獲取的高質(zhì)量語料數(shù)據(jù)集依然相對匱乏。
在數(shù)量已經(jīng)匱乏的條件下,高價(jià)值數(shù)據(jù)又面臨著“供不出、流不動、用不好”的窘境,難以發(fā)揮價(jià)值,讓本就有限的數(shù)據(jù)資源變得更加緊張。
另一方面,數(shù)據(jù)的集成化程度也嚴(yán)重不足,大量數(shù)據(jù)散落在產(chǎn)業(yè)側(cè)或垂直系統(tǒng)內(nèi),而且未被結(jié)構(gòu)化,無法直接用于大模型訓(xùn)練。
這背后的深層次原因,是缺乏成熟的技術(shù)和可信機(jī)制來支撐數(shù)據(jù)的安全,擁有數(shù)據(jù)的企業(yè)“不知、不敢、不能、不會”讓數(shù)據(jù)任意流通,這“四不”的現(xiàn)狀進(jìn)一步造就了今天數(shù)據(jù)集的短缺,形成了一道死循環(huán)。
所以當(dāng)務(wù)之急,就是建立起一套可信的安全的數(shù)據(jù)機(jī)制。
為此,北電數(shù)智推出了另一個(gè)重要產(chǎn)品——紅湖·可信數(shù)據(jù)空間,讓數(shù)據(jù)要素充分聚集,讓場景得以充分開放。
紅湖·可信數(shù)據(jù)空間是圍繞“可信”構(gòu)建的多層次解決方案,旨在盤活數(shù)據(jù)提供高質(zhì)量可信數(shù)據(jù)服務(wù),打造“安全共享、可信流通”的數(shù)據(jù)環(huán)境。
從技術(shù)上看,紅湖·可信數(shù)據(jù)空間搭載了可信數(shù)據(jù)沙盒,利用“邏輯數(shù)倉”等技術(shù)導(dǎo)入、修改和刪除數(shù)據(jù),并通過隱私計(jì)算+區(qū)塊鏈技術(shù),保證數(shù)據(jù)安全、無泄漏,保證數(shù)據(jù)的可追溯和透明性,做到“全鏈條可控”。
這種做法使數(shù)據(jù)可信、可控、可用、可審計(jì)、加密保護(hù),從而創(chuàng)造多方互信、數(shù)據(jù)流通協(xié)議履行的數(shù)據(jù)共享、應(yīng)用環(huán)境。
有了這樣全流程可控的安全措施,才能讓數(shù)據(jù)的擁有者敢于將手中的數(shù)據(jù)資源投入市場流通,并以點(diǎn)帶面地拉動更多的數(shù)據(jù)擁有者參與其中。
有了前期的數(shù)據(jù)投入,數(shù)據(jù)供應(yīng)的生態(tài)也將走向成熟,數(shù)據(jù)共享的形式也會更加完善便捷,流動的高質(zhì)量數(shù)據(jù)將為行業(yè)發(fā)展注入更多的新鮮血液。
同時(shí),北電數(shù)智自身也為行業(yè)帶來了高質(zhì)量數(shù)據(jù),在醫(yī)療、教育、文化等行業(yè)布局了垂類模型矩陣,讓人工智能企業(yè)更好地找到落地場景。
所以,北電數(shù)智到底是誰,又是如何孕育出這樣一套全面針對人工智能行業(yè)痛點(diǎn)的解決方案的呢?
人工智能時(shí)代的“發(fā)電廠”,產(chǎn)業(yè)鏈的“串珠人”
北電數(shù)智,是北京電控集團(tuán)旗下高科技企業(yè),專注于人工智能,自身定位是全棧AI服務(wù)商。
北電數(shù)智成立之前,正逢GPT-3.5發(fā)布,彼時(shí),新一輪人工智能時(shí)代全面開啟,AI競爭也正日趨白熱化。順應(yīng)時(shí)代發(fā)展與市場需求,北電數(shù)智應(yīng)運(yùn)而生。
成立之時(shí),北電數(shù)智承接的第一個(gè)項(xiàng)目就是北京市數(shù)字經(jīng)濟(jì)算力中心,定位是向公共提供智算算力,實(shí)現(xiàn)算力的普惠。
換言之,這個(gè)算力中心就像一座“發(fā)電廠”,讓算力像水電煤一樣賦能從基座到應(yīng)用的完整AI產(chǎn)業(yè)分層。
北電數(shù)智戰(zhàn)略與市場負(fù)責(zé)人楊震介紹,這是北電數(shù)智和數(shù)科公司的不同,北電數(shù)智的第一要?jiǎng)?wù),是要把人工智能產(chǎn)業(yè)支撐起來,讓人工智能企業(yè)或者個(gè)人開發(fā)者能夠快速使用到人工智能、享受到人工智能。
在整個(gè)人工智能產(chǎn)業(yè)中,楊震認(rèn)為北電數(shù)智扮演了產(chǎn)業(yè)鏈“串珠人”的角色——如果這個(gè)產(chǎn)業(yè)鏈上已經(jīng)有珠子了,就把它們串上;如果沒有的話,就把它造出來。
比如前文提到的對國產(chǎn)芯片的加速、在行業(yè)模型垂類模型的布局、可信數(shù)據(jù)空間,都是這個(gè)產(chǎn)業(yè)鏈上的一顆顆“珠子”。
除了提供算力產(chǎn)品,北京市數(shù)字經(jīng)濟(jì)算力中心還專門設(shè)計(jì)了交流、展示空間,讓處于相同或不同領(lǐng)域的AI從業(yè)者碰撞交流,促進(jìn)更全面更深層次的創(chuàng)新。
未來,這個(gè)算力中心中的開放空間還將作為“算力科技公園”面向公眾開放,讓更多人了解人工智能時(shí)代的生產(chǎn)變革之力。
總之,北電數(shù)智將以智算中心為支撐,串聯(lián)起芯片、服務(wù)器、大模型、AI應(yīng)用、產(chǎn)業(yè)投資等上下游技術(shù)、產(chǎn)品和服務(wù),促進(jìn)人工智能產(chǎn)業(yè)成長和繁榮,并帶動區(qū)域經(jīng)濟(jì)產(chǎn)業(yè)升級。
截止目前,北電數(shù)智已有AI產(chǎn)業(yè)生態(tài)伙伴干余家,覆蓋了AI輔助藥物研發(fā)、通用機(jī)器人/具身智能、無人駕駛、AI智能體等明星賽道。