半年內(nèi)第二塊國(guó)產(chǎn)全功能GPU,附帶首個(gè)游戲顯卡!摩爾線程造芯神速,張建中“黃”氣逼人
自稱“國(guó)潮顯卡”,雙11開(kāi)售
金磊 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
他來(lái)了,他來(lái)了。
手持GPU,一身黑皮衣、下裝牛仔褲、黃皮膚長(zhǎng)頭發(fā),黑框眼鏡之下?lián)醪蛔∮矟h氣場(chǎng)。
但他不是英偉達(dá)的老黃。
他是曾經(jīng)老黃左膀右臂之一的老張——
張建中,James,此前在英偉達(dá)中國(guó)區(qū)任職一把手長(zhǎng)達(dá)15年時(shí)間。
現(xiàn)在更被人熟知的頭銜,是國(guó)內(nèi)GPU公司摩爾線程的創(chuàng)始人兼CEO。
而這次剛剛捂熱的GPU,已經(jīng)是他在今年量產(chǎn)上市的第2個(gè)了——
時(shí)隔,僅半年之久。
不僅如此,附著在這塊GPU上的標(biāo)簽還有更多:
國(guó)產(chǎn)、全功能、全球首個(gè)、中高端……
而且基于它,張建中更是發(fā)布了國(guó)內(nèi)首個(gè)中高端游戲顯卡。
講真,很難想象這般“速度”是由一家剛剛成立2年的公司所創(chuàng)造的。
由此不免讓人心生疑問(wèn):
在做到快的同時(shí),質(zhì)量和性能上是否也一并跟上了呢?
我們不妨一同來(lái)看看。
全球首個(gè)支持PCIe接口的全功能GPU
摩爾線程的第二個(gè)國(guó)產(chǎn)全功能GPU,名為“MT-春曉”。
張建中也是將它作為打頭陣的產(chǎn)品發(fā)布。
據(jù)了解,春曉集成了220億個(gè)晶體管,內(nèi)置4096MUSA架構(gòu)通用計(jì)算核心以及128張量計(jì)算核心,可以支持FP32、FP16和INT8等計(jì)算精度。
其它重點(diǎn)參數(shù)如下:
- GPU核心頻率:1.8GHz
- FP32計(jì)算能力:14.4 TFLOPS
- INT8計(jì)算能力:57.6 TOPS
- 顯存寬帶:448GB/s
- 顯存類型:GDDR6
張健中在現(xiàn)場(chǎng)還提及,春曉解鎖了一項(xiàng)“全球第一”:
因?yàn)樗菢I(yè)內(nèi)唯一支持PCIe Gen5接口的GPU。
(許多廠商已經(jīng)達(dá)成共識(shí),PCIe Gen5將會(huì)是未來(lái)消費(fèi)級(jí)以及企業(yè)級(jí)存儲(chǔ)設(shè)備的重點(diǎn)發(fā)展方向。)
那么與半年前摩爾線程所發(fā)布的“蘇堤”GPU相比,二者又有何區(qū)別?
張建中表示在摩爾線程GPU四大引擎方面,春曉做到了全面升級(jí):
- 現(xiàn)代圖形渲染引擎性能最高提升3-5倍
- AI計(jì)算加速引擎性能最高提升4倍
- 智能多媒體引擎性能最高提升4倍
- 物理仿真引擎性能最高提升2.5倍
至于為什么摩爾線程要在半年時(shí)間就將自家GPU推陳出新,這個(gè)問(wèn)題我們請(qǐng)教了下張健中:
我們第一個(gè)全功能GPU蘇堤,實(shí)際上屬于中低端處理器,在GPU行業(yè)中可以滿足國(guó)內(nèi)國(guó)產(chǎn)化應(yīng)用的需求。
但對(duì)于大部分主流用戶,他們還是期待更高性能的GPU,因此我們快速發(fā)布了春曉,去滿足高端的游戲玩家,滿足更多用戶對(duì)圖形和計(jì)算的需要。
如此一來(lái),我們的產(chǎn)品就能夠覆蓋高中低端的所有用戶。
而提到了游戲,張建中基于春曉GPU,便發(fā)布了另一款“國(guó)內(nèi)第一”的產(chǎn)品。
國(guó)內(nèi)首款游戲顯卡
其實(shí)摩爾線程在半年前基于蘇堤也發(fā)布過(guò)顯卡產(chǎn)品MTT S60。
但這張顯卡的“用武之地”似乎更多面向的是產(chǎn)業(yè),也就是B端。
而這次基于春曉打造的這張顯卡MTT S80,則是能讓更多大眾摸得著的那種了——國(guó)內(nèi)首款游戲顯卡。
在現(xiàn)場(chǎng),張建中還用了一個(gè)比較有意思的詞來(lái)形容它:“國(guó)潮”。
從性能方面來(lái)看,其擁有的4096個(gè)可編程MUSA核心,在1.8GHz的主頻下,能夠提供14.4TFLOPS的單精度浮點(diǎn)算力。
與春曉相似的,MTT S80也是業(yè)內(nèi)首款配備PCIe Gen5接口的顯卡產(chǎn)品:
配合16GB GDDR6大容量高速顯存,再輔以8K超高清與1080P 360Hz高刷新率顯示輸出能力,能為游戲玩家?guī)?lái)很好的體驗(yàn)。
似乎“光說(shuō)不練”并不是摩爾線程發(fā)布會(huì)的風(fēng)格,跟上次一樣,張建中同樣是在現(xiàn)場(chǎng)直接上效果。
例如它已經(jīng)在Windows環(huán)境中適配了《暗黑破壞神3》,而這款游戲?qū)τ陲@卡性能要求還是較高的那種。
而有了MTT S80的加持,即便全程是在4K高清畫(huà)質(zhì)的情況下,F(xiàn)PS也能保持在60左右(FPS越高畫(huà)面越流暢)。
除此之外,張建中還展示了賽車游戲愛(ài)好者鐘愛(ài)的《極品飛車》,在MTT S80下的效果,可以說(shuō)是相當(dāng)?shù)慕z滑了:
據(jù)了解,目前MTT S80已經(jīng)在Windows驅(qū)動(dòng)內(nèi)置了MUSA DirectX Driver模塊,并完成了對(duì)數(shù)十款主流游戲的適配。
更重要的是,張建中說(shuō)這款顯卡將會(huì)在雙十一當(dāng)日限量開(kāi)售。
那么到手后的實(shí)際效果如何、價(jià)格香不香,也是可以期待一下了。
新款全功能服務(wù)器GPU產(chǎn)品
在服務(wù)器方面的產(chǎn)品,摩爾線程這次也有更新——MTT S3000。
同樣的,它也是基于MUSA架構(gòu)、春曉GPU,算力可以覆蓋圖形渲染、視頻處理、深度學(xué)習(xí)的完整MUSA軟件棧。
支持的場(chǎng)景包括AI推理和訓(xùn)練、云游戲、云渲染、視頻云、數(shù)字孿生、數(shù)字內(nèi)容創(chuàng)作等。
從性能上來(lái)看,MTT S3000包含了4096個(gè)MUSA流處理核心及128個(gè)專用張量計(jì)算核心,晶體管規(guī)模達(dá)到220億。
其運(yùn)行頻率為1.9GHz,顯存位寬256bit;搭配32GB GDDR6顯存,帶寬為448GB/s;可以支持FP32、FP16、INT8等多種計(jì)算精度,其中FP32算力可達(dá)15.2TFLOPS。
在張建中看來(lái),生態(tài)協(xié)作對(duì)于AI應(yīng)用的推進(jìn)至關(guān)重要。
因此,MTT S3000還兼容了PyTorch、TensorFlow、百度飛槳(PaddlePaddle)、計(jì)圖(Jittor)等多種主流深度學(xué)習(xí)框架,并實(shí)現(xiàn)了對(duì)Transformer、CNN、RNN等數(shù)十類AI模型的加速。
而且MTT S3000可以說(shuō)是做到了“與時(shí)俱進(jìn)”,最近大火的AI作畫(huà):Disco Diffusion、Stable Diffusion也是同樣能夠hold住。
不僅僅是硬件的更新
而除了上述的硬件產(chǎn)品之外,縱觀正常發(fā)布會(huì),“軟硬件結(jié)合”也是摩爾線程的一大特點(diǎn)。
這一點(diǎn)其實(shí)也不難理解,在我們與張建中交流的過(guò)程中,他也道出了緣由:
軟件生態(tài)是推動(dòng)GPU計(jì)算普及的關(guān)鍵。
GPU的研發(fā)體系是非常復(fù)雜的,有了硬件才能去開(kāi)發(fā)軟件,軟件在硬件上跑起來(lái)了之后,還需要做更多優(yōu)化;優(yōu)化之后又會(huì)發(fā)現(xiàn)架構(gòu)存在缺陷,反過(guò)來(lái)又得優(yōu)化硬件。
硬件、軟件是互相迭代、不停提升的一個(gè)過(guò)程。
為此,摩爾線程這次以MUSA架構(gòu)為核心,摩爾線程發(fā)布了完備的MUSA軟件棧。
其目的就是服務(wù)廣大的開(kāi)發(fā)者和終端用戶。
除此之外,摩爾線程在GPU云原生、元宇宙、AIGC方面均有相應(yīng)的新動(dòng)作。
One More Thing
還是聚焦在張建中這次的outfit:
這個(gè)皮夾克,嗯,著實(shí)有點(diǎn)意思。
- 商湯林達(dá)華萬(wàn)字長(zhǎng)文回答AGI:4層破壁,3大挑戰(zhàn)2025-08-12
- 商湯多模態(tài)大模型賦能鐵路勘察設(shè)計(jì),讓70年經(jīng)驗(yàn)“活”起來(lái)2025-08-13
- 以“具身智能基座”為核,睿爾曼攜全產(chǎn)品矩陣及新品亮相2025 WRC2025-08-11
- 哇塞,今天北京被機(jī)器人人人人人塞滿了!2025-08-08