Arm v9的牙膏擠出來(lái)了,超大核機(jī)器學(xué)習(xí)性能x2,小核4年來(lái)終于更新
專為中國(guó)市場(chǎng)保留32位支持,華為或轉(zhuǎn)投RiSC-V
夢(mèng)晨 發(fā)自 凹非寺
量子位 報(bào)道 | 公眾號(hào) QbitAI
Arm v9架構(gòu),可以說(shuō)是10年以來(lái)最大的升級(jí)。
在上月發(fā)布服務(wù)器端的Neoverse V1與N2平臺(tái)之后,消費(fèi)端的首批CPU終于亮相。
包括Cortex-X2超大核、Cortex-A710大核以及Cortex-A510小核,分別取代X1、A78和A55。
值得一提的是,小核系列上一次更新還是在2017年。
超大核X2和小核A510已經(jīng)完全基于64位指令集,只有A710還兼容32位。
Arm說(shuō)這是專為中國(guó)移動(dòng)端市場(chǎng)保留的,因?yàn)橹挥兄袊?guó)還保留著大量32位的手機(jī)App。
Arm要在2023年前徹底拋棄32位,App開發(fā)商們,再不升級(jí)就要被淘汰了。
大中小核完整方案
去年開始,Arm讓A系列繼續(xù)保持PPA?(性能、功耗、面積)的設(shè)計(jì)理念。
大核A700系列將優(yōu)先用于持續(xù)的主力多核負(fù)載,小核A500系列負(fù)責(zé)效率優(yōu)先的輕型和后臺(tái)任務(wù)。
而超大核X系列被允許在尺寸和功率上繼續(xù)增長(zhǎng),以達(dá)到更高的單核性能和應(yīng)對(duì)突發(fā)的工作負(fù)載。
下面來(lái)看看這次牙膏到底擠出了多少吧。
超大核X2:機(jī)器學(xué)習(xí)性能翻倍
X2與X1相比,機(jī)器學(xué)習(xí)性能則直接翻倍,在整數(shù)運(yùn)算上性能也提高了16%。
具體的改進(jìn)方面包括:
分支預(yù)測(cè)(Branch Prediction)與提取指令(Fetch)解耦,可有效減少M(fèi)PKI(每千條指令失誤)
調(diào)度階段的指令周期從2個(gè)減少到1個(gè),從而使總周期從11個(gè)減少到10個(gè)。
Arm表示,盡管這種變化會(huì)增加工程上的難度,以及有增加功耗和面積的代價(jià),但相比于性能大幅提升來(lái)說(shuō)還是值得的。
ROB(重新排序緩沖區(qū))增加30%,提高亂序執(zhí)行能力。
支持SVE2可伸縮矢量擴(kuò)展,讓開發(fā)人員減少代碼編寫和調(diào)試難度。
除了用于高端手機(jī)外,超大核X系列還將用在筆記本等大屏幕計(jì)算設(shè)備上。
大核A710:效率提升30%、性能10%
A710將繼續(xù)維持性能與效率之間的平衡,有著與X2類似的改進(jìn)分支預(yù)測(cè)、縮減指令周期以及支持SVE2等設(shè)計(jì)。
特別之處在于,將Macro-OP緩存的寬度從A78的6縮減到5,主要是出于功耗、效率方面的考量。
另外還有一些改進(jìn),使CPU核心、DSU及內(nèi)存之間通訊效率更高。
小核A510:4年來(lái)首次更新,可以合并核心
小核系列將繼續(xù)使用順序執(zhí)行(In-order Execution Flow),這與蘋果M1的效率核心Icestorm采用的亂序執(zhí)行流程不同,Arm表示這種設(shè)計(jì)是最省電的。
此外最大的改動(dòng)是可以將兩個(gè)核心合并在一起,再進(jìn)一步組成集群。
這樣做可以減少面積,L2緩存、L2 TLB等可以在合并核心中共享。
由于跨越了4年,A510的性能提升與上代A55相比較大,在35%到62%之間。
可配置的集群方式
所有這些CPU都可以通過(guò)全新的DynamIQ共享單元DSU-110以不同的CPU集群配置結(jié)合在一起。
新的DSU-110支持最高16MB的L3緩存,允許多達(dá)8個(gè)Cortex-X2內(nèi)核集群。
這種可配置的集群方法可以滿足從高端智能手機(jī)和筆記本電腦,到數(shù)字電視和可穿戴設(shè)備的不同市場(chǎng)需求。
新的CPU出現(xiàn)在市場(chǎng)上還需要一段時(shí)間,高通等芯片提供商一般在年底發(fā)布新產(chǎn)品。
所以Arm v9架構(gòu)的手機(jī)、筆記本等產(chǎn)品,將會(huì)在2022年能見到。
華為或轉(zhuǎn)投RISC-V
目前,英偉達(dá)與Arm的400億美元收購(gòu)案仍在進(jìn)行,Arm v9架構(gòu)最終能否授權(quán)給華為還未可知。
Arm v9的發(fā)布頁(yè)面文末的合作伙伴中,有小米、OPPO、Vivo等國(guó)產(chǎn)廠商的寄語(yǔ),其中卻沒有出現(xiàn)華為。
華為方面也在積極尋找替代方案,華為海思最新公布的鴻蒙開發(fā)版Hi3861。
雖然華為沒有明確透露主芯片的型號(hào),但其開發(fā)環(huán)境要求中需要用到RISC-V相關(guān)工具。
RISC-V是一款完全開源的指令集架構(gòu),采用寬松的BSD協(xié)議,企業(yè)可免費(fèi)使用,并添加自有指令集拓展而不必開放共享。
參考鏈接:
[1]https://community.arm.com/developer/ip-products/processors/b/processors-ip-blog/posts/first-armv9-cpu-cores
[2]https://www.anandtech.com/show/16693/arm-announces-mobile-armv9-cpu-microarchitectures-cortexx2-cortexa710-cortexa510/6
[3]https://device.harmonyos.com/cn/docs/start/introduce/oem_quickstart_3861_build-0000001054781998
- 字節(jié)突然開源Seed-OSS,512K上下文主流4倍長(zhǎng)度,推理能力刷紀(jì)錄2025-08-21
- “現(xiàn)在讀AI博士已經(jīng)太晚了”2025-08-19
- 谷歌AI攻克亞洲語(yǔ)言難題,2300種語(yǔ)言數(shù)字化計(jì)劃正在推進(jìn)2025-08-18
- AMD蘇姿豐公開懟扎克伯格!反對(duì)1億年薪挖人,使命感比鈔票更重要2025-08-18