平頭哥首款A(yù)I芯片一換,阿里云服務(wù)器算力5倍GPU方案
左手第七代高主頻ECS,右手含光800云服務(wù)器
不算久等!阿里云基礎(chǔ)設(shè)施算力又升級了!
本次被“翻牌”的是第七代高主頻ECS企業(yè)級實(shí)例、含光800云服務(wù)器商用以及新一代容器(神龍)服務(wù)。
還記得去年杭州云棲,搭載自研第二代神龍?jiān)品?wù)器架構(gòu)的六代ECS已是眾望所歸;如今搭載第三代神龍?jiān)品?wù)器架構(gòu)的高主頻七代,在整機(jī)算力上卻是前輩的2.6倍。
究竟2.6倍之多源于何處?
很關(guān)鍵的一點(diǎn),就是搭載了最新一代英特爾?至強(qiáng)?可擴(kuò)展處理器,據(jù)說這波技術(shù)嘗試就連英特爾自己都還沒來得及發(fā)布。
?此外,由于得到集大成的第三代神龍架構(gòu)助力,七代高主頻實(shí)例在性能與穩(wěn)定性上都有了顯著提升。
大到底層存儲、網(wǎng)絡(luò),虛擬化技術(shù)升級;小到搭載的云盤性能、每秒鐘操作的IO次數(shù)以及吞吐能力等均是可圈可點(diǎn)。
別的不說,單從支持vCPU數(shù)量就高達(dá)192個(gè)。
配套的內(nèi)存的頻率也達(dá)到了3200兆赫茲。
七代首次支持50Gx2網(wǎng)絡(luò)架構(gòu),每秒鐘PPS高達(dá)2400萬,果斷支持大幀傳輸之外,實(shí)例帶寬最高提升5倍之多,物盡其用。
整機(jī)存儲吞吐從每秒2GB上升到4GB,轉(zhuǎn)發(fā)提升到60萬IOPS,寫延時(shí)最多下降20%以上,性能逼近裸盤,值得期待。
出于安全性和穩(wěn)定性,阿里云還通過進(jìn)一步完善no QEMU極致優(yōu)化來降低七代實(shí)例抖動(dòng)。
再配合Aliyun Linux 2 LTS,大力將啟動(dòng)速度最高提升60%;就算是正在運(yùn)行時(shí),也可多達(dá)30%。
強(qiáng)勢引入硬件級別QOS能力,保障關(guān)鍵業(yè)務(wù)。
如此看來果然是又快又好的節(jié)奏。
據(jù)悉由于算力與穩(wěn)定性并存的優(yōu)勢,高主頻七代ECS尤其適用半導(dǎo)體仿真設(shè)計(jì)、工業(yè)仿真、 游戲、高性能數(shù)據(jù)庫和渲染等對計(jì)算力要求較高的場景。
截至發(fā)稿前,量子位獲悉第七代ECS企業(yè)級高主頻實(shí)例以及新一代彈性裸金屬云服務(wù)器,目前都已啟動(dòng)邀測。
從六到七,技術(shù)嘗試助力成本降低是關(guān)鍵
從六到七,算力與穩(wěn)定性等確實(shí)都上了好幾層臺階。
但阿里云彈性計(jì)算首席架構(gòu)師蔡俊杰卻透露,其實(shí)除了市場需求與使用性能等硬性催化劑之外,成本考量也毋庸置疑成了關(guān)鍵所在。
簡單說,這款七代高主頻實(shí)例更省錢了!
當(dāng)然,這種成本節(jié)省是對標(biāo)六代高主頻來說的,而不是銷路甚好的第六代增強(qiáng)實(shí)例。
成本降低有門道,先從更好地定制CPU說起。
據(jù)悉,阿里云這次在七代的芯片選型上做了大量工作。
通過洞察幾百萬客戶實(shí)際使用云服務(wù)器的情況,從內(nèi)存帶寬、緩存以及頻率要求,包括用戶應(yīng)用的性能甜點(diǎn)角度做了大量的數(shù)據(jù)分析。
“通常情況下,價(jià)格高則性能強(qiáng),但如果需要用戶提升百分之一的性能卻需要cover百分之二十的成本增幅來換的話,實(shí)在不劃算,當(dāng)然這還是在迫切需要提升的前提下。”
阿里云彈性計(jì)算方面最后定制的這一款CPU,在保障符合用戶需求的高性能的同時(shí),綜合成本上降低了不少。
更重要的一點(diǎn),為了低成本的需要,技術(shù)研發(fā)在服務(wù)器設(shè)計(jì)上竟然還展開了新路線的探索。
或許大家可能知曉,主流的云服務(wù)器過去通常采用的是二路服務(wù)器,即一個(gè)服務(wù)器中攜帶兩顆CPU。
如今的七代創(chuàng)新性選擇了更加高密度部署的四路服務(wù)器制式,也就是同時(shí)攜帶四顆CPU。
不但是單體計(jì)算性能得到顯著提升,從整機(jī)的性能角度上也有很大飛躍。
很明顯,四路服務(wù)器帶來的好處,每顆均攤到整體基礎(chǔ)設(shè)施的成本,相比之前確實(shí)下降不少。
但蔡俊杰透露,盡管成本下降的背后,是運(yùn)維和穩(wěn)定性難度的急劇上升。
由于服務(wù)器上的器件增多,散熱就成為亟待攻克的關(guān)鍵一環(huán)。
同時(shí),如何保障所有器件能夠正常工作并在性能穩(wěn)定的基礎(chǔ)上達(dá)成目標(biāo),是個(gè)挑戰(zhàn)。畢竟由于CPU和內(nèi)存增加了一倍,故障概率也就同時(shí)增加了一倍。
無論何種新品的研發(fā)都不希望通過犧牲穩(wěn)定性來降低成本,所以為了保障實(shí)例的穩(wěn)定性,阿里云做了很多工作。
得益于阿里云成熟的主動(dòng)運(yùn)維體系,包括極高的故障探測和預(yù)測能力、世界領(lǐng)先的熱遷移技術(shù)等,七代ECS將繼續(xù)承諾全球第一的穩(wěn)定性SLA,單實(shí)例達(dá)到99.975%。
七代高主頻ECS企業(yè)級實(shí)例在成本上的精益求精,在某種程度上也應(yīng)承了更多用戶在云服務(wù)器的使用上越發(fā)關(guān)注成本優(yōu)化的現(xiàn)實(shí)。
2020年的疫情突襲,帶來源于全球經(jīng)濟(jì)環(huán)境的諸多挑戰(zhàn)。
越來越多的云服務(wù)器使用者會(huì)在選型以及使用方式上表現(xiàn)出更加精細(xì)化的態(tài)度,畢竟大家都希望在有限的成本投入中得到最大程度的資源利用。
這一點(diǎn),作為云服務(wù)器未來發(fā)展的可預(yù)測趨勢之一,得到更廣泛的關(guān)注也是無可厚非的。
如何更好理解“新一代容器服務(wù)”?
談及新一代容器服務(wù),“基于神龍架構(gòu),阿里云還升級了容器服務(wù)的算力,同等條件下,新一代容器服務(wù)可為客戶縮減50%的計(jì)算成本?!钡恼摂嗷蛟S你也聽說過。
基于此,蔡俊杰還異國連線算了筆賬。
其實(shí)這樣的判斷并不僅僅基于被廣泛提及的神龍架構(gòu),而是使用裸金屬服務(wù)器的形態(tài)來支持容器場景帶來的整體成本的大幅降低。
以第七代高主頻ECS為例,原本四路服務(wù)器為整機(jī)算力帶來極大提升,作用在容器層面,有什么額外好處?
直接說就是做到將原本分散在各個(gè)小機(jī)器中的容器實(shí)例高效聚集起來,節(jié)省算力成本的同時(shí)更好利用容器服務(wù)。
試想一下,對于具備32個(gè)vCPU算力的小型服務(wù)器來說,假設(shè)每臺上運(yùn)行的操作系統(tǒng)需要耗費(fèi)1個(gè)vCPU和500兆內(nèi)存,那么6臺就要耗費(fèi)6個(gè)vCPU和3G內(nèi)存。
如果換成第七代高主頻ECS支持192個(gè)vCPU的情況,光操作系統(tǒng)的消耗就只有原來的六分之一。
更重要的一點(diǎn),在此種部署環(huán)境中容器服務(wù)的超賣比優(yōu)點(diǎn)得到顯現(xiàn),即越來越多的應(yīng)用可以達(dá)成錯(cuò)峰,帶來部署密度的增加,數(shù)量上的保障。
性能方面,現(xiàn)實(shí)表明,神龍裸金屬服務(wù)器與容器相結(jié)合在阿里經(jīng)濟(jì)體內(nèi)部各種場景的多重測試中,已經(jīng)可達(dá)到整體性能20%的提升。
哪怕在用戶群體中驗(yàn)證,由于底層IO與存儲的軟硬一體化加速機(jī)制,帶來30%的性能優(yōu)勢也是可以期待的。
如果具備足夠的技術(shù)前瞻性的話,或許會(huì)發(fā)現(xiàn),云服務(wù)器的另一個(gè)未來觸發(fā)點(diǎn),如此說來竟是云原生無疑。
可能這也是阿里云率先在業(yè)界推出彈性裸金屬這樣的創(chuàng)新產(chǎn)品形態(tài)的關(guān)鍵所在。
云原生是未來,與容器結(jié)合是必然。
天生屬性即適合與K8S容器編排引擎打配合,以求實(shí)現(xiàn)服務(wù)serveless的彈性計(jì)算,可以做到讓更多用戶聚精會(huì)神關(guān)心應(yīng)用怎么跑,而不是底層架構(gòu)怎么做,彈性容器實(shí)例ECI就是為serverless而生的新生代“云服務(wù)器”。
當(dāng)然,花開兩朵各表一枝。
如何做到部署更輕量、啟動(dòng)更迅速、并發(fā)能力更強(qiáng)悍等,也對云服務(wù)器的整體生產(chǎn)鏈路提出了更高要求。
蔡俊杰認(rèn)為,在極短的時(shí)間內(nèi)準(zhǔn)備好計(jì)算、網(wǎng)絡(luò)以及存儲等資源,通過整鏈路的優(yōu)化升級達(dá)到極致服務(wù)的狀態(tài),來高安全性滿足復(fù)雜的云原生場景,一個(gè)字“難”。
如此看來,安全穩(wěn)定地提供符合云原生使用體驗(yàn)的基礎(chǔ)設(shè)施能力,想必也是各大云計(jì)算入局者競相探討的要?jiǎng)?wù)之一。
含光800云服務(wù)器因何而來?
阿里云官方數(shù)據(jù)表明,去年,一顆含光800芯片相當(dāng)于10個(gè)GPU的算力。
今年,一臺阿里云含光800云服務(wù)器趕超GPU性能5倍之多。
日前,阿里云正式官宣推出搭載含光800推理芯片的云服務(wù)器,標(biāo)志著自研含光芯片正式大規(guī)模商業(yè)化的beginning。
從芯片進(jìn)化到云服務(wù)器,本質(zhì)上,阿里云鉚足勁頭讓更多已經(jīng)上云或正在上云路上的小伙伴們嘗鮮含光800的超強(qiáng)算力。
助力云上AI推理,這波操作相當(dāng)別致。
量子位獲悉,由于配備了阿里平頭哥自研神經(jīng)網(wǎng)絡(luò)加速芯片含光800,該款云服務(wù)器提供了全球最高單芯片AI推理性能,有著同類處理器的數(shù)十倍性能之高。
另外還針對業(yè)務(wù)場景達(dá)成了深度優(yōu)化,例如廣泛適用于圖像搜索、場景識別、視頻內(nèi)容識別、自然語言處理等業(yè)務(wù)。
一句話,算力表現(xiàn)出挑且推理能力高性價(jià)。
好的產(chǎn)品都要從自身用起,例如阿里云城市大腦交通信號機(jī)系統(tǒng)。
自從使用了含光800服務(wù)器處理車輛檢測、品牌識別、車牌識別等算法模型,單張含光800全鏈路竟能夠支持100路實(shí)時(shí)視頻的分析和特征結(jié)構(gòu)化數(shù)據(jù)的提取。
結(jié)果呢?相比搭載GPU,性能提升超過5倍。
多方了解到,含光云服務(wù)器還是基于阿里云自研的神龍?jiān)品?wù)器架構(gòu),目前為用戶提供彈性裸金屬加速實(shí)例。
其中開發(fā)工具采用阿里平頭哥HGAI自動(dòng)化開發(fā)工具,支持主流深度學(xué)習(xí)框架TensorFlow、Caffe、MXNet和ONNX。
?就在今年3月,阿里云飛天AI加速引擎AIACC與含光800的組合,擊敗Google不說,還拿下了斯坦福大學(xué)DAWNBench?ImageNet推理成本的世界第一。
據(jù)了解其能效比達(dá)500IPS/W,是第二名的3.3倍,且被作為阿里云軟硬件一體化極致性能優(yōu)化的典型案例津津樂道。
談及軟硬件一體化的能力所帶來的效果,無論是國外的云計(jì)算巨頭AWS,還是我們身邊的阿里云,具體產(chǎn)品的性能飛躍,甚至一年翻一番的速率是有目共睹的。
如果從技術(shù)角度,這種軟硬一體的自研能力很大可能是未來3-5年,各家都十分重視的路線之一并被爭相效仿,云服務(wù)器自然不例外。
此外含光800云服務(wù)器的商用也正是兼顧軟硬一體能力的同時(shí),將解決云場景下的機(jī)器學(xué)習(xí)問題作為重點(diǎn)。
由此推斷,將云與數(shù)據(jù)以及人工智能緊密結(jié)合,用云的視角服務(wù)更多不同的技術(shù)場景化,或許將成為云服務(wù)器場景進(jìn)化的必然路徑。
如今,云服務(wù)器作為云計(jì)算基礎(chǔ)設(shè)施的大底盤,阿里云經(jīng)濟(jì)體“全面上云”的號角業(yè)已達(dá)成。
作為阿里云自身的技術(shù)基礎(chǔ),關(guān)于云服務(wù)器能力構(gòu)建,更多被認(rèn)為是關(guān)乎云服務(wù)商產(chǎn)品能力的命脈。
隨著云計(jì)算自身形態(tài)的多樣化,實(shí)踐部署的親民性與無處不在,包括國內(nèi)對自研國產(chǎn)化核心競爭力的重視日益提升等,可以判斷未來很長一段時(shí)間,該領(lǐng)域不會(huì)出現(xiàn)重要性層面的顛覆式變化。
可以肯定,云服務(wù)器仍是兵家必爭之地,無疑。
附:采訪嘉賓簡介