對(duì)話高通工程技術(shù)SVP:AI研發(fā)最關(guān)注高能效,云端AI推理芯片已流片成功
乾明 發(fā)自 凹非寺
量子位 報(bào)道 | 公眾號(hào) QbitAI
高通,移動(dòng)互聯(lián)網(wǎng)時(shí)代最成功的公司之一。它對(duì)通信技術(shù)以及專利的掌控,已經(jīng)主導(dǎo)整個(gè)行業(yè)20余年。
一代代旗艦芯片和移動(dòng)平臺(tái),更是安卓手機(jī)廠商核心競(jìng)爭(zhēng)力和賣點(diǎn)之一。
但隨著AI浪潮洶涌,移動(dòng)互聯(lián)網(wǎng)向移動(dòng)AI的轉(zhuǎn)換已成大勢(shì)。高通作為移動(dòng)互聯(lián)網(wǎng)領(lǐng)域的大贏家,將如何發(fā)力AI,來抓住移動(dòng)AI時(shí)代?
關(guān)于高通AI動(dòng)向,已經(jīng)有過很多次披露,但都聚焦在業(yè)務(wù)上。其AI技術(shù)研發(fā)上,是怎樣的一個(gè)格局?高通AI研發(fā),如何驅(qū)動(dòng)高通的移動(dòng)AI業(yè)務(wù)?
Rajesh Pankaj,高通工程技術(shù)高級(jí)副總裁,是為數(shù)不多能夠回答這些問題的人,再次來到中國。
Rajesh Pankaj是一名“老高通”,從1997年至今,已經(jīng)在高通工作了22年。
現(xiàn)在,他也是高通企業(yè)研發(fā)部門(CR&D)的負(fù)責(zé)人。而這個(gè)部門,正是高通AI研發(fā)的核心。
帶著上述的這些問題,我們與他進(jìn)行了深入交流,試圖尋找高通將要如何繼續(xù)主導(dǎo)移動(dòng)AI時(shí)代的答案。
更低功耗,更高能效,高通AI研發(fā)的重心所向
在與Rajesh Pankaj的交流中,他提到最多的,就是如何在低功耗環(huán)境下讓AI發(fā)揮出更高的能效。
他說,這是高通AI研發(fā)最關(guān)注的領(lǐng)域。
其實(shí)不僅僅是高通,在當(dāng)下這已經(jīng)成為了業(yè)內(nèi)備受關(guān)注的AI研發(fā)方向之一。
近年來,各種關(guān)于模型壓縮的算法大量出現(xiàn)。谷歌、Facebook、百度也紛紛在自家的AI框架中加入端側(cè)推理/部署能力。
Rajesh Pankaj從5G和AI的角度解釋了背后的趨勢(shì)。
一方面是AI技術(shù)的進(jìn)一步成熟,相關(guān)的研究不再只是關(guān)注用AI解決問題,業(yè)界和學(xué)界開始考慮讓AI進(jìn)入到終端中,實(shí)現(xiàn)更多能力。
另一方面是5G的興起,超低時(shí)延的數(shù)據(jù)傳輸變成了現(xiàn)實(shí),端云協(xié)同變得觸手可及。
這也就意味著和之前只依靠終端或者云端相比,邊緣設(shè)備上能夠?qū)崿F(xiàn)更多的AI能力。
雖然相應(yīng)的條件已經(jīng)出現(xiàn),但都處于不斷完善中。不同的公司,都在通過不同的方式角逐未來。
Rajesh Pankaj說,得益于移動(dòng)設(shè)備領(lǐng)域的技術(shù)積累,“低功耗環(huán)境下,實(shí)現(xiàn)高能效的AI,是高通最強(qiáng)的領(lǐng)域。
高通也給出了相應(yīng)的數(shù)據(jù)進(jìn)行了佐證:
利用張量分解、通道簡化等手段壓縮AI模型架構(gòu),壓縮量達(dá)到3倍,同時(shí)準(zhǔn)確度僅損失不到1%。
此外還有高精度訓(xùn)練、低精度推理的方法來實(shí)現(xiàn)能效的提升:
高通用量化8位推理模型,實(shí)現(xiàn)內(nèi)存和計(jì)算4倍能效提升,可以和FP32實(shí)現(xiàn)近乎相同的準(zhǔn)確率。
除此之外,高通還在優(yōu)化編譯器、內(nèi)存計(jì)算AI等方面開展了相應(yīng)的研究,為AI計(jì)算節(jié)能加速。
在專訪過程中,Rajesh Pankaj也進(jìn)一步解釋說,雖然他很屢次提起低功耗運(yùn)行AI,但這并不是高通AI研發(fā)的全部。
他說,從更大的角度來看,高通關(guān)注的是與端側(cè)設(shè)備有關(guān)的所有AI,只要能夠?qū)I(yè)務(wù)帶來幫助,都會(huì)投入資源去研發(fā)。
這些技術(shù),并不都是處于研發(fā)階段,高通也已經(jīng)將這些技術(shù)應(yīng)用到了移動(dòng)AI芯片中。
2015年的驍龍820開始,高通的旗艦芯片就已經(jīng)在全面集成高通自研人工智能引擎AI Engine。
到驍龍855,已經(jīng)是第四代人工智能引擎AI Engine,突出的點(diǎn)在于異構(gòu)計(jì)算。
核心能力,是讓CPU、GPU、Hexagon不同功能的核心發(fā)揮各自所長,而又相互協(xié)作,共同實(shí)現(xiàn)高效的AI處理。
高通出圈:云端推理芯片已流片成功
雖然在相應(yīng)的技術(shù)研發(fā)上,高通聚焦于端側(cè)AI。但AI帶來的不僅僅是沖擊,也有機(jī)會(huì)。在場(chǎng)景上,高通也正在出圈。
最能體現(xiàn)這一動(dòng)向的,不是高通面向IoT和汽車領(lǐng)域大秀肌肉。而是其4月份發(fā)布的一個(gè)數(shù)據(jù)中心AI推理芯片:Cloud AI 100。
同樣,這一芯片主打的也是高能效。
在發(fā)布的時(shí)候,高通表示,這一芯片能降低終端與數(shù)據(jù)中心的延遲,提高AI云端效率。與其他商用方案相比,Cloud AI 100每瓦特性能提升了10倍。
微軟和Facebook也為高通的這一芯片站臺(tái),并在產(chǎn)品發(fā)布時(shí),分享了部署AI推理芯片的計(jì)劃:
微軟用它發(fā)現(xiàn)工業(yè)生產(chǎn)中的安全問題,F(xiàn)acebook則用它處理智能助理、視頻AR特效以及加速VR硬件。
但在當(dāng)時(shí),高通只是宣布了芯片,并沒有給出具體的產(chǎn)品。
Rajesh Pankaj也介紹了這一芯片的研發(fā)進(jìn)展:芯片現(xiàn)在已經(jīng)流片成功,并交于合作伙伴進(jìn)行部署測(cè)試,明年會(huì)正式商用。
雖然這款芯片應(yīng)用于云端,但Rajesh Pankaj說,高通暫時(shí)沒有提供云服務(wù)的打算,硬件會(huì)對(duì)外出售,并配備相應(yīng)的軟件支持,來幫助合作伙伴搭建相應(yīng)開發(fā)生態(tài)。
而且,這一芯片的出現(xiàn),也在幫助高通拓展新的場(chǎng)景。
Rajesh Pankaj透露,不僅僅只有移動(dòng)設(shè)備以及云服務(wù)商對(duì)這個(gè)芯片感興趣,還有不少汽車廠商以及其他架構(gòu)廠商也展現(xiàn)出了興趣。
他說,在這些合作過程中,高通也會(huì)將AI落地到更多的領(lǐng)域中去。
與此同時(shí),高通發(fā)力AI也不僅僅只是單打獨(dú)斗??萍季揞^們擅長使用的投資收購手段,它也沒有落下。
2018年,高通風(fēng)投成立了1億美元的AI投資基金,主要用于投資5G賦能的AI領(lǐng)域,為自動(dòng)駕駛汽車、機(jī)器人和機(jī)器學(xué)習(xí)平臺(tái)開發(fā)新技術(shù)的企業(yè)。
高通的AI發(fā)展之道
聚焦端側(cè),鞏固自身在高能效AI方面的領(lǐng)先地位。然后以此為切入點(diǎn),不斷拓寬AI的落地場(chǎng)景。
這是高通當(dāng)下發(fā)展AI的重要策略之一。在Rajesh Pankaj看來,這背后也凸顯出了高通在技術(shù)研發(fā)與商業(yè)落地上的一個(gè)“傳統(tǒng)”:
高通所研發(fā)的AI,只是AI領(lǐng)域的一部分。其研發(fā)的目標(biāo),就是在這一部分中占據(jù)領(lǐng)導(dǎo)地位。只要技術(shù)在這一領(lǐng)域占據(jù)了主導(dǎo)地位,產(chǎn)品自然就更有優(yōu)勢(shì)了。
這在一定程度上,也反映了高通的“人才觀”。
談到高通如何吸引AI人才時(shí),Rajesh Pankaj也表達(dá)了類似的觀點(diǎn),只需要把要做的做好,自然就會(huì)有人才加入。
此外,Rajesh Pankaj還談到了高通吸引人才的另外一個(gè)特征:研究成果很快就會(huì)影響產(chǎn)品。
他說,這對(duì)于很多研究者來說,都是一個(gè)難以抵擋的誘惑。