高通AI啟示錄,從一篇數(shù)學(xué)物理基礎(chǔ)論文說起
允中 發(fā)自 凹非寺
量子位 報(bào)道 | 公眾號(hào) QbitAI
Qualcomm成功的秘訣是什么?
Qualcomm——高通,移動(dòng)互聯(lián)網(wǎng)時(shí)代最成功的公司。
一代代旗艦芯片和移動(dòng)平臺(tái),更是安卓手機(jī)廠商核心競爭力和賣點(diǎn)之一。
但成功的花兒,外界更多看到花開時(shí)的艷麗,鮮能關(guān)注綻放前的艱辛。
所以最近一篇AI論文發(fā)布后,意外引起論文之外的討論。
中國俗語:臺(tái)上一分鐘,臺(tái)下十年功。
如果說移動(dòng)時(shí)代的成功“秘訣”太難追,那這篇論文展示的,正是高通面向AI時(shí)代的“十年功”管窺。
一篇基礎(chǔ)理論的AI論文
這篇引發(fā)思考的AI論文,全名:Gauge Equivariant Convolutional Networks and the Icosahedral CNN.
中文翻譯:《規(guī)范等變卷積網(wǎng)絡(luò)與二十面體CNN》。
https://arxiv.org/abs/1902.04615
主題高深,著力點(diǎn)又極其基礎(chǔ)——把數(shù)學(xué)、物理方面的基礎(chǔ)理論,用在卷積神經(jīng)網(wǎng)絡(luò)(CNN)攻堅(jiān)中。
概括而言,之前的卷積神經(jīng)網(wǎng)絡(luò)主要被用于平面問題,而且不具有旋轉(zhuǎn)不變性。
但高通的這項(xiàng)新研究,可以基于規(guī)范等變CNN的方法來實(shí)現(xiàn)一個(gè)尼曼三維任意曲面的旋轉(zhuǎn)不變性,這不僅是CNN模型新突破,而且結(jié)果可以用在全球氣候模式、醫(yī)療影像的研究上。
論文作者也非泛泛之輩。
Taco Cohen和Max Welling(韋靈思),均來自高通AI研發(fā)團(tuán)隊(duì)。其中,韋靈思教授是深度學(xué)習(xí)領(lǐng)域知名科學(xué)家、變分自動(dòng)編碼器(VAE)的提出者,還是諾貝爾物理學(xué)獎(jiǎng)得主Gerardus’t Hooft和圖靈獎(jiǎng)Geoffrey Hinton的學(xué)生。
這篇論文,可以說是韋靈思教授等集師承之所長的結(jié)果。
于是從論文本身到作者背景,立馬在AI科研圈引發(fā)反響:
推特上,轉(zhuǎn)發(fā)超過300,點(diǎn)贊數(shù)1千2——作為這樣一篇看懂標(biāo)題都不易的論文,足見其影響了。
更主要的是,高通AI研究院展開如此基礎(chǔ)的研究,令不少人感到震驚。
一般而言,企業(yè)內(nèi)部的研究院,雖然也會(huì)偏向?qū)W術(shù)式推進(jìn),但會(huì)偏重企業(yè)的側(cè)重所在。
比如高通這樣的公司,或通信或芯片,或者移動(dòng)基礎(chǔ)架構(gòu)。
但韋靈思等大牛的研究,更基礎(chǔ)更理論,并看不出限制。
這還不是孤立事件,稍早之前,韋靈思教授等還將廣義相對(duì)論和量子場論的數(shù)學(xué)原理應(yīng)用到深度學(xué)習(xí)中,提供了3D物體識(shí)別的新思路。
更早之前,還在神經(jīng)網(wǎng)絡(luò)壓縮、機(jī)器學(xué)習(xí)訓(xùn)練工具等基礎(chǔ)方面展開攻堅(jiān)。
所以也有人評(píng)價(jià)說,高通深厚的專利和技術(shù)壁壘背后,正是提前對(duì)上述看似無用的基礎(chǔ)研究的持續(xù)投入。
而等到OEM廠商爭相搭載驍龍芯片時(shí),這些隱而不彰的基礎(chǔ)成就,雖然無跡可尋,但實(shí)際早已春風(fēng)化雨。
高通AI生態(tài)
高通內(nèi)部支持上述基礎(chǔ)理論研究,彰顯著高通對(duì)AI變革趨勢的判斷,也是面向新時(shí)代的適者生存。
至少目前對(duì)外宣示的是這樣:
除了優(yōu)勢所在的手機(jī)終端,還正在把勢能延伸向物聯(lián)網(wǎng)、汽車,滲透到更多的端、邊緣,最終結(jié)合云端,讓AI等新技術(shù)無處不在。
越來越多智能傳感器,也正在讓數(shù)據(jù)呈現(xiàn)大爆炸之勢。
于是AI走向邊緣、走向IoT終端,開始呼之欲出。目之所及,掃地機(jī)器人、安防攝像頭、交通信號(hào)燈,包括汽車等等,都到了需要一顆“芯”的時(shí)候。
這不正是高通所長嗎?
在今年的高通人工智能開放日上,高通也在IoT和汽車領(lǐng)域大秀肌肉,吸引眾多目光。
在其發(fā)展戰(zhàn)略中,把汽車視為智慧城市、智慧基礎(chǔ)設(shè)施中的一環(huán),包括道路在內(nèi)就有無數(shù)傳感器,都在為智能汽車服務(wù)。
高通希望車與車、車與智能交通設(shè)施完全連接,形成一張V2X的巨大信息網(wǎng),所有聯(lián)網(wǎng)共享的設(shè)備可以實(shí)時(shí)共享數(shù)據(jù),而AI可以讓這些數(shù)據(jù)得到最好的運(yùn)用。
在開放日現(xiàn)場最吃香的是一個(gè)專為司機(jī)提供的智能數(shù)字座艙,第三代驍龍數(shù)字座艙平臺(tái)為AI添加了人性化特色,不僅在用戶看不見的智能駕駛芯片和算法中,在車內(nèi)的增強(qiáng)現(xiàn)實(shí)抬頭顯示(HUD)、虛擬助理等方面,也能讓用戶直接感受到AI的強(qiáng)大,可以為駕乘人員打造突破性的全新體驗(yàn)。
實(shí)際上,智能數(shù)字座艙也最能體現(xiàn)AI時(shí)代的高通將往何處去。
在整個(gè)場景下,驍龍820A平臺(tái)提供了技術(shù)基礎(chǔ),第三代驍龍汽車平臺(tái)集成多核高通人工智能引擎AI Engine,擁有高通安全處理單元(SPU),以及高通視覺增強(qiáng)高精定位和計(jì)算機(jī)視覺處理能力,能夠一系列AI基礎(chǔ)能力,但進(jìn)一步延展開來的還有語音交互、AI視覺等方面的諸多能力。
你可以將“數(shù)字座艙”與“手機(jī)”相類比,只是前者類似的場景,比手機(jī)多得多——甚至目前還難以窮盡,這是一個(gè)完全增量的市場。
所以回過頭來看,高通在去年11月建立的1億美元AI風(fēng)險(xiǎn)投資基金,所投方向涉及自動(dòng)駕駛汽車、機(jī)器人、計(jì)算機(jī)視覺以及物聯(lián)網(wǎng)等領(lǐng)域,野心也便再清晰不過。
手機(jī)依然是主戰(zhàn)場
不過,手機(jī)依然最大智能終端。
或者說在AI時(shí)代,智能手機(jī)會(huì)真正被AI賦予“智能”能力。
2018年的驍龍820開始,高通的旗艦芯片就已經(jīng)在全面集成高通自研人工智能引擎AI Engine。
今年的異構(gòu)多核旗艦移動(dòng)平臺(tái)驍龍855集成了最新的高通第四代人工智能引擎AI Engine,所謂異構(gòu)計(jì)算就是由CPU、GPU、Hexagon不同功能的核心發(fā)揮各自所長,而又相互協(xié)作,共同實(shí)現(xiàn)高效的AI處理。
高通驍龍855芯片中,Adreno 640 GPU、Hexagon 690處理器和Kryo 485 CPU相互協(xié)作,通過異構(gòu)計(jì)算智能分配AI任務(wù),相比前代實(shí)現(xiàn)了整體AI性能3倍的提升。
其中Hexagon 690新增的Hexagon張量加速器(Hexagon Tensor Accelerator,HTA)功不可沒。
張量運(yùn)算是AI算法中的基礎(chǔ)操作,PC和云計(jì)算廠商近年來引入張量計(jì)算單元為AI加速。該張量加速器是Qualcomm自主設(shè)計(jì)、面向更多AI處理的硬件核心。
Hexagon張量加速器的加入對(duì)手機(jī)行業(yè)意義重大,它不僅使數(shù)字信號(hào)處理的功能得到擴(kuò)展,還讓開發(fā)者實(shí)現(xiàn)可編程的AI加速。AI如今已經(jīng)成為高端智能手機(jī)的核心賣點(diǎn)。
時(shí)代也正在發(fā)生這樣的變化:
僅有AI硬件的升級(jí)遠(yuǎn)遠(yuǎn)不夠,還需要有軟件開發(fā)商的支持,才能發(fā)揮出高通第四代人工智能引擎的運(yùn)算潛能。
在軟件框架層面,驍龍855底層硬件支持TensorFlow、PyTorch、ONNX等主流機(jī)器學(xué)習(xí)平臺(tái),以及Google NN API等運(yùn)行軟件框架,讓開發(fā)者充分利用AI特性,圍繞高通人工智能引擎AI Engine,打造覆蓋范圍最廣的AI生態(tài)系統(tǒng)。
同樣在高通AI開放日現(xiàn)場,去除噪點(diǎn)、實(shí)時(shí)翻譯語音、手勢識(shí)別等實(shí)際應(yīng)用,都是AI帶來的新變化。
曾經(jīng)在PC上需要大量資源才能運(yùn)行的圖像、語音處理模型,如今在手機(jī)上也能輕松運(yùn)行。
而且AI也讓高通的生態(tài)空前龐大,商湯、曠視和虹軟等AI獨(dú)角獸也都紛紛參與到高通AI朋友圈中,基于芯片和軟件支持平臺(tái),最后推出更豐富的AI應(yīng)用和場景化落地。
基礎(chǔ)研發(fā)啟示錄
所以歸根結(jié)底,無論是手機(jī)方向上的努力,還是更宏大的AI生態(tài)藍(lán)圖。
這篇高通AI基礎(chǔ)論文背后的啟示,早已再清晰不過。
如果不在基礎(chǔ)研發(fā)下苦功,任何領(lǐng)先和生態(tài),都只會(huì)是窒息一場。
所謂臺(tái)上一分鐘,臺(tái)下十年功。
之前太多羨慕高通移動(dòng)時(shí)代的話語權(quán)之強(qiáng)大,但鮮有背后研發(fā)投入和基礎(chǔ)苦功的闡釋表達(dá)。
現(xiàn)在,這篇引起學(xué)界一番熱議的論文,恰似一個(gè)注腳,能夠解釋高通之所以引領(lǐng)了一個(gè)時(shí)代的核心原因。
也是值得更多擁有宏圖夢(mèng)想的AI公司們學(xué)習(xí)的原因。
— 完 —
誠摯招聘
量子位正在招募編輯/記者,工作地點(diǎn)在北京中關(guān)村。期待有才氣、有熱情的同學(xué)加入我們!相關(guān)細(xì)節(jié),請(qǐng)?jiān)诹孔游还娞?hào)(QbitAI)對(duì)話界面,回復(fù)“招聘”兩個(gè)
量子位 QbitAI · 頭條號(hào)簽約
?’?’ ? 追蹤AI技術(shù)和產(chǎn)品新動(dòng)態(tài)作者字。