“感知不強”又”徒增功耗”?為何今年5G手機也這么重視AI
曉查 發(fā)自 凹非寺
量子位 報道 | 公眾號 QbitAI
今年你準(zhǔn)備換手機了嗎?
小米10、一加8、OPPO Find X2、vivo NEX 3s、iQOO 3、realme X50 Pro……上半年一大波手機發(fā)布潮依然在繼續(xù),簡直讓選擇困難癥不知所措。
什么才是你換機的最大動力?可能絕大部分人都會說是5G。
的確,5G讓手機的網(wǎng)絡(luò)速度更快,但還有一項指標(biāo)性能的重要性一點不亞于5G。
從去年開始,各大手機評測開始給手機加入了一個新的評測維度——AI跑分。這個過去從來不受關(guān)注的參數(shù),如今成為了不少人心中衡量手機性能必不可少的一項指標(biāo)。
國內(nèi)知名的性能測試軟件魯大師甚至還專門提供了AI跑分測試軟件AImark。
在魯大師最新公布的AImark跑分中,高通驍龍865以11萬的高分拿下芯片榜第一,不僅比高通上一代芯片提升一倍,也把蘋果的A13仿生芯片遠(yuǎn)遠(yuǎn)甩在身后。
高通為何要提升手機芯片看似“感知不強”的AI能力呢?
AI跑分又是否僅是一個“徒增功耗”、“方向錯了”的噱頭?
然而你可能不知道的是,至少在拍照這件事情上,如果沒有AI,旗艦手機今后可能真的無法玩轉(zhuǎn)了。有人也許不禁要問,AI技術(shù)和手機日常使用有什么關(guān)系?
手機AI有什么用
要解答這個問題,我們先來看看魯大師到底給驍龍865測試了什么。
這次高通驍龍865奪冠的魯大師AImark 2.0測試總共包括了4項成績。這4項分別代表手機在4種不同神經(jīng)網(wǎng)絡(luò)下的運算能力。
先看前兩項基本AI能力,ResNet-34和Inception V3。
ResNet是當(dāng)前應(yīng)用最廣的卷積神經(jīng)網(wǎng)絡(luò)(CNN)的特征提取網(wǎng)絡(luò),多數(shù)處理圖片的AI模型或多或少的使用了ResNet。在神經(jīng)網(wǎng)絡(luò)越來越復(fù)雜的今天,ResNet可以做到在更深的神經(jīng)網(wǎng)絡(luò)上不降低性能。
Inception V3是Google開發(fā)的一個開源神經(jīng)網(wǎng)絡(luò)模型,進一步提高了圖像分類效果。用了Inception之后,神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的寬度和深度都可擴大,能夠帶來2-3倍的性能提升。
如果說前兩項是考察芯片的基礎(chǔ)AI能力,那么后兩項就是靠具體單科能力了。
MobilenetSSD是一種目標(biāo)檢測算法,具有速度快,精度高的特點。所謂目標(biāo)檢測就是讓AI找出圖像中的物體,指出它們的位置和種類。SSD表示一次拍攝即可檢測圖像中的多個對象。
這種模型目前在手機AI中有廣泛的應(yīng)用。比如手機拍照中的場景識別,目標(biāo)能夠知道你拍攝的是美食還是植物。
當(dāng)識別出照片主體的內(nèi)容后,拍照算法就會對畫面做出特定的優(yōu)化,拍出更美的照片。
在實測中,高通驍龍865能讓整個識別的過程不到1秒就能完成,真正提升了拍照場景識別的易用性。
Deeplab V3+是目前在手機設(shè)備上效果最好的圖像語義分割模型之一。
語義分割比目標(biāo)檢測更進一步,目標(biāo)檢測僅能識別出物體的大致位置,而語義分割要求對識別出的物體做到像素級的劃分,精確畫出邊緣。
更通俗地說,這一項跑分測試的是手機AI“摳圖”能力。
由于受到體積所限,手機攝像頭單靠光學(xué)成像不能做到和單反相機一樣的背景虛化能力,這時候就需要語義分割模型的幫助。
不僅如此,今年各家手機主打超強變焦、8K視頻、超級防抖,都需要AI計算的支持。
到這里,你還會覺得手機芯片性能強大的用處只能用來打游戲嗎?
游戲滿幀運行對旗艦手機來說早就不是難事,但是各種新奇拍照玩法直到近兩年才嶄露頭角,最重要的原因就是驍龍系列芯片AI能力的巨大提升。
AI性能翻倍的法寶——張量核心
那么高通又是如何在短短一年內(nèi)將AI性能翻倍的呢?
我們先來看看驍龍865的構(gòu)造:
除去SoC中最基本的CPU、GPU和圖像處理單元ISP,驍龍865中集成的Hexagon處理器中包括一個專門為AI運算加速的Hexagon張量加速器(HTA)。
其實Hexagon之前是SoC中的數(shù)字信號處理單元,也就是常說的“DSP”,之前主要被用來處理語音和音視頻解碼。但是隨著AI技術(shù)的興起,高通終于給Hexagon升級了。
在去年驍龍855的Hexagon 690中,高通首次引入HTA實現(xiàn)了專用的可編程的AI加速。作為驍龍865集成的第五代Qualcomm人工智能引擎AI Engine的核心,Hexagon 698的HTA能效比上代提升了35%。
此外,驍龍865還在GPU上改善了浮點運算和AI性能,系統(tǒng)整體運算能力與前代(7TOPS)相比提升一倍多,實現(xiàn)高達(dá)每秒15萬億次運算(15TOPS)。
這也與AImark的實際跑分相符,證明了高通AI運算能力是實打?qū)嵉奶嵘?,而非針對跑分軟件做出的特殊?yōu)化。
但手機AI是需要對整體考量,不是靠堆料就能簡單地實現(xiàn)性能提升。
手機和云端AI、PC端AI最大的差異是,需要考慮有限的續(xù)航與散熱能力,也要考慮開發(fā)端口的特殊性。
普通的GPU做的是16位或者32位的浮點運算,優(yōu)點當(dāng)然是精確度高、性能強大,但是能耗也更高。
而Hexagon支持的是8位和16位的定點運算,這種運算更適合壓縮后AI模型,雖然精度有些許損失,但是運算量大大減少,在邊緣設(shè)備上應(yīng)用廣泛。
高通和Android開發(fā)商谷歌還對Hexagon上的應(yīng)用開發(fā)做出了定向優(yōu)化。
比如高通的神經(jīng)處理器SDK、Android神經(jīng)網(wǎng)絡(luò)API和高通Math庫等,都可以被開發(fā)者所用,用來快速開發(fā)高效的AI應(yīng)用。
此外,高通還采用了一種深度學(xué)習(xí)帶寬壓縮的技術(shù),將數(shù)據(jù)量壓縮一半,降低了運算能耗。
驍龍865的AI性能提升絕不僅止于此。在處理AI任務(wù)時,往往有大量的數(shù)據(jù)進入到芯片中,而處理這些海量數(shù)據(jù)需要消耗更多電能、增加功耗。
對此,高通開發(fā)了一項全新的專用技術(shù)——深度學(xué)習(xí)帶寬壓縮。這還是一項完全無損的壓縮技術(shù),也就是說所有數(shù)據(jù)的精度不會有任何損失。
帶寬壓縮能夠?qū)@些海量數(shù)據(jù)進行高達(dá)50%的壓縮,以節(jié)省電能、降低功耗。
在一些對AI性能要求極高的情形中,驍龍865與今年最新的LPDDR5高帶寬內(nèi)存相互配合、相得益彰。
總之,驍龍865的AI不僅僅是簡單的加個神經(jīng)網(wǎng)絡(luò)核心,而是從CPU、GPU、Hexagon處理器(包括張量加速器),再到軟件、內(nèi)存帶寬壓縮等等的一整套AI解決方案。
AI讓手機真的“智能”了
當(dāng)然,AI性能的提升不僅僅是性能指標(biāo),也給我們的生活帶來了突變。
高通在去年的AI Demo Day上,和多家手機廠商、軟件開發(fā)商展示了手機端AI應(yīng)用的無限前景。
專門開發(fā)拍照算法的虹軟,基于驍龍移動平臺,用AI實現(xiàn)了更強大的超級夜景和全身塑形美顏。
AI行業(yè)巨頭曠視和商湯在人臉識別和3D建模上玩出了新花樣。
其實高通驍龍865豈止是在圖像處理上的性能提升,它也讓過去噱頭意味更濃的語音助手有了實用價值。
今年的Hexagon處理單元具有了對上下文感知低功耗AI語音助手的支持,對語音識別、聲音傳感器的處理再上一層樓。語音助手會比過去更靈敏,多輪對話也更智能。
在語音翻譯方面,鑒于驍龍865首次支持文本和語音實時翻譯的AI特性,網(wǎng)易有道還與高通合作開發(fā)了同聲傳譯的功能,出門再也不怕語言障礙。
過去需要大量運算的人工智能技術(shù)在手機這個小小的終端上實現(xiàn),靠的是驍龍865等一系列芯片在AI性能上質(zhì)變的提升
現(xiàn)在,你還覺得手機AI只是“感知不強”、“徒增功耗”的宣傳噱頭嗎?