云計(jì)算一哥的生成式AI之道:Choice Matters
為客戶提供“多快好省”的選擇權(quán)
允中 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
引言:AI大模型,并不是一個(gè)贏家通吃的市場(chǎng)。
自O(shè)penAI在2022年發(fā)布ChatGPT以來(lái),無(wú)論是科技巨頭還是初創(chuàng)公司,各個(gè)玩家可以說(shuō)是紛紛加大投入,試圖在模型性能上超越彼此。
似乎追求單一、性能卓越的AI大模型已然成為一種趨勢(shì),各類Benchmark上的奪冠也好似一張得到市場(chǎng)認(rèn)可的入場(chǎng)券。
然而在如此打法成為主流的同時(shí),一個(gè)在AI大模型時(shí)代以來(lái)一直看似低調(diào),也鮮有大聲量地高喊“大模型性能第一”的科技巨頭,卻在時(shí)隔兩年多之久,以截然不同的方式在大模型市場(chǎng)里驚艷亮相。
它就是云計(jì)算一哥——亞馬遜云科技。

對(duì)于亞馬遜云科技在AI大模型時(shí)代的定位,目前有一種非常貼切的比喻,叫做“沉睡的雄獅”。
之所以如此,是因?yàn)閬嗰R遜云科技此前幾乎是以“工廠模式”來(lái)推動(dòng)大模型的發(fā)展,在業(yè)界聲響最大的便是集成各路大模型的Amazon Bedrock。
即便在早期有發(fā)布過(guò)自研大模型Titan,但有一說(shuō)一,似乎也是在大模型飛速迭代的浪潮中被淹沒(méi)。
然而,正當(dāng)大眾以為亞馬遜云科技在AI大模型時(shí)代會(huì)持續(xù)扮演一個(gè)“工廠”角色之際,就在前不久自家的年度盛宴re:Invent 2024中,它卻高調(diào)發(fā)布了全新的基礎(chǔ)模型——Amazon Nova系列。
而且是一口氣六款模型,涵蓋文本對(duì)話、圖片生成和視頻生成,并且也罕見(jiàn)地把與各類模態(tài)主流玩家的PK測(cè)評(píng)成績(jī)直接亮了出來(lái)。
以視頻生成模型Amazon Nova Reel為例,效果是這樣的:
(視頻地址:https://mp.weixin.qq.com/s/9IyjRIbVEGSuw3zFzo5XGQ?token=1038039735&lang=zh_CN)
于是乎,為何在沉寂兩年后才會(huì)有此動(dòng)作?亞馬遜云科技的打法又是否能符合市場(chǎng)發(fā)展?……
種種問(wèn)題,亟待回答。
亞馬遜的“AI步法”:Choice Matters
其實(shí)在今年亞馬遜云科技的re:Invent中,若是一定要提煉一個(gè)關(guān)鍵詞,那么Choice(選擇),無(wú)疑就是最搶眼的那一個(gè)。
展開(kāi)這個(gè)關(guān)鍵詞,則正是“云計(jì)算一哥”在AI大模型時(shí)代下的打法:
會(huì)做選擇,比擁有單一強(qiáng)大的大模型更為重要。

這是因?yàn)樵趤嗰R遜云科技看來(lái),大模型市場(chǎng)并不是一個(gè)贏家通吃的市場(chǎng);這就與其它公司形成了鮮明對(duì)比。
然而,亞馬遜選擇了一條不同的道路,通過(guò)其Bedrock等工具支持來(lái)自多個(gè)提供商的不同模型,而不是僅僅專注于構(gòu)建自己的強(qiáng)大模型。
而這種背后蘊(yùn)含“沒(méi)有一個(gè)模型可以一統(tǒng)天下”的模式似乎也正在被市場(chǎng)所接納。
根據(jù)Menlo Ventures的報(bào)告,公司通常在其AI服務(wù)中使用3個(gè)或更多的基礎(chǔ)模型,根據(jù)不同的用例或結(jié)果路由到不同的模型。
這種趨勢(shì)表明,即使是市場(chǎng)份額佼佼者的OpenAI,也面臨著來(lái)自其他采用多模型策略的公司的挑戰(zhàn)。
同樣是根據(jù)Menlo Ventures的報(bào)告,一個(gè)較有說(shuō)服力的數(shù)據(jù)是這樣的:
采用亞馬遜云科技模式的Anthropic在AI模型市場(chǎng)的份額翻倍至24%,而OpenAI的份額從50%下降到34%。
不過(guò)與此同時(shí),自身?yè)碛邢冗M(jìn)的AI大模型同樣也有助于亞馬遜云科技吸引更多的AI開(kāi)發(fā)者。
雖然早期亞馬遜云科技所推出Titan并沒(méi)有在大模型圈里泛起太大的浪花,但這一次的Nova系列,確實(shí)是以其效果和實(shí)力博取了不小的關(guān)注。
而這一切的背后,依舊是貫徹亞馬遜云科技的根本問(wèn)題,即客戶有所需要。
因此,亞馬遜云科技在大模型時(shí)代下的“AI步法”就非常清晰了——
為客戶提供“多快好省”的選擇權(quán),而不是“一統(tǒng)天下”的市場(chǎng)主導(dǎo)權(quán)。
那么接下來(lái)的一個(gè)問(wèn)題是:
提供了怎樣的AI選擇權(quán)?
就在今天剛結(jié)束的re:Invent 2024中國(guó)行全國(guó)巡展北京站活動(dòng)中,亞馬遜云科技大中華區(qū)產(chǎn)品總經(jīng)理陳曉建對(duì)這一問(wèn)題做了再次的回顧。

△亞馬遜云科技大中華區(qū)產(chǎn)品總經(jīng)理,陳曉建
在短短90分鐘的主題演講中,露出的“AI可選項(xiàng)”多達(dá)30多個(gè),平均下來(lái)就是每三分鐘一個(gè)!
縱觀整場(chǎng)活動(dòng),最直觀的感受,就是這些回顧的“全新發(fā)布”涵蓋了整個(gè)生成式AI的全周期——
從最底層的基礎(chǔ)設(shè)施,到中間的模型服務(wù),再到頂層的AI應(yīng)用,是屬于全棧的那種。
而之所以如此,陳曉建在現(xiàn)場(chǎng)做出了如下解釋:
我們不僅在云的核心服務(wù)層面持續(xù)創(chuàng)新,更在從芯片到模型,再到應(yīng)用的每一個(gè)技術(shù)堆棧取得突破,讓不同層級(jí)的創(chuàng)新相互賦能、協(xié)同進(jìn)化。
我相信,只有這樣全棧聯(lián)動(dòng)的大規(guī)模創(chuàng)新才能真正滿足當(dāng)今客戶的發(fā)展需求,加速前沿技術(shù)的價(jià)值釋放,助力各行各業(yè)重塑未來(lái)。
“全新發(fā)布”數(shù)量雖然驚人,但按照生成式AI各層級(jí)來(lái)看脈絡(luò)也是較為清晰,可以分為五個(gè)大亮點(diǎn):
- 計(jì)算
- 存儲(chǔ)
- 數(shù)據(jù)庫(kù)
- 分析
- AI推理
那么接下來(lái),我們就來(lái)再次深入回顧下今年re:Invent中的那些高光時(shí)刻。
新款自研基礎(chǔ)模型
首先,我們先來(lái)看下“AI推理”部分的產(chǎn)品,或許也是大家最感興趣、最有感知的一個(gè)內(nèi)容——大模型。
亞馬遜云科技所發(fā)布的新款自研基礎(chǔ)模型,名曰Amazon Nova,是有一點(diǎn)點(diǎn)震撼在身上的。
整體來(lái)看Amazon Nova共有四個(gè)“杯型”,它們分別是:
- Amazon Nova Micro:僅限文本對(duì)話,主打一個(gè)低價(jià)格和低延遲;
- Amazon Nova Lite:低成本的多模態(tài)大模型,處理圖像、視頻和文本輸入的速度極快。
- Amazon Nova Pro:高性能的多模態(tài)大模型,精度、速度和成本最佳“配方”,可處理廣泛的任務(wù)。
- Amazon Nova Premier:亞馬遜最強(qiáng)多模態(tài)大模型,可處理復(fù)雜的推理任務(wù),也可用于蒸餾客戶定制化的模型。
其中一大亮點(diǎn)便是成本大幅降低。
據(jù)了解,在各自智能類別中,Amazon Nova Micro、Lite和Pro應(yīng)用成本比“模型工廠”Amazon Bedrock中表現(xiàn)最佳的模型至少降低75%,同時(shí)也是Amazon Bedrock中對(duì)應(yīng)類別速度最快的模型。
前三者已經(jīng)上架亞馬遜云科技的Amazon Bedrock,而Premier版本則將于2025年第一季度推出。
除此之外,還有Amazon Nova Canvas,主打的是圖像生成,用官方的話來(lái)說(shuō),是達(dá)到了“State-of-the-art”(最先進(jìn))的水平。

在現(xiàn)場(chǎng),陳曉建也展示了與DALL·E 3和Stable Diffusion Large 3.5的評(píng)估測(cè)試上的比較,圖像質(zhì)量等維度上均勝出。

在圖像生成之后,亞馬遜云科技還發(fā)布了視頻生成模型——Amazon Nova Reel。
據(jù)了解,目前6秒鐘時(shí)長(zhǎng)的視頻生成已經(jīng)正式可用,2分鐘版本的也在路上了。

同樣的,Amazon Nova Reel與Runway家的Gen-3 Alpha之間的評(píng)測(cè)比試結(jié)果:視頻質(zhì)量勝率61.4%、視頻連貫性勝率71.6%。
但這還不算完,Amazon Nova的下一步也已披露——
不僅要Speech-to-Speech,更要Any-to-Any!
一切皆可生成,是值得期待一波了。
而作為承載它們的“模型工廠”Amazon Bedrock,這一次也有不少的升級(jí)動(dòng)作。
首先就是在模型的選擇上,新增了多個(gè)choices,例如首家提供Luma AI和poolside模型,以及更新的Stability AI最新模型等。

其次,全新發(fā)布的Amazon Bedrock Marketplace,可以為客戶提供100多個(gè)熱門、新興及專業(yè)模型。

還有Amazon Bedrock Knowledge Bases,現(xiàn)在支持可以支持GraphRAG等知識(shí)庫(kù)功能增強(qiáng)數(shù)據(jù)利用能力。
在性能方面,Bedrock還推出了低延遲優(yōu)化推理,由此,用戶可以在使用最先進(jìn)的大模型基礎(chǔ)上,還享受卓越的推理性能。
值得一提的是,Llama 405B和Llama 70B低延遲優(yōu)化版本,在亞馬遜云科技上展現(xiàn)出超越其他云提供商的出色表現(xiàn)。
最后,通過(guò)自動(dòng)推理檢查功能和多智能體協(xié)作等創(chuàng)新,進(jìn)一步增強(qiáng)AI安全性并推動(dòng)智能體發(fā)展。
Amazon Q Developer則是引入了三款先進(jìn)的智能體。
它們能夠自動(dòng)執(zhí)行單元測(cè)試、生成文檔和進(jìn)行代碼審查,同時(shí)通過(guò)與GitLab的深度整合,拓寬了應(yīng)用范圍。
此外,它還推出了新的轉(zhuǎn)型特性,旨在加快Windows.NET、VMware和大型機(jī)工作負(fù)載的遷移與現(xiàn)代化進(jìn)程,有效減少轉(zhuǎn)型周期和成本。
同時(shí),Amazon Q Business和Amazon Q in QuickSight的洞察力得到了加強(qiáng),簡(jiǎn)化了復(fù)雜工作流程自動(dòng)化的實(shí)現(xiàn)方法。

云計(jì)算,也全面升級(jí)
說(shuō)完大模型,我們?cè)賮?lái)看下亞馬遜云科技的“老本行業(yè)務(wù)”——云計(jì)算。
這次升級(jí)主要圍繞三大核心領(lǐng)域展開(kāi):計(jì)算(Compute)、存儲(chǔ)(Storage)?和數(shù)據(jù)庫(kù)(Database)。
每一項(xiàng)都可以說(shuō)是展現(xiàn)出了前所未有的性能提升與成本優(yōu)化。
在計(jì)算(Compute)層面,亞馬遜云科技推出了性能全面升級(jí)的Amazon EC2 Trn2實(shí)例。
Trn2實(shí)例搭載第二代Trainium芯片(Trainium2),相比上一代Trn1,性能提升如下:
- 訓(xùn)練速度提升4倍,顯著縮短模型訓(xùn)練時(shí)間,助力企業(yè)更快落地AI應(yīng)用;
- 內(nèi)存帶寬提升4倍,滿足復(fù)雜模型對(duì)于數(shù)據(jù)高并發(fā)處理的需求;
- 內(nèi)存容量提升3倍,為大規(guī)模參數(shù)模型提供強(qiáng)大支持。
更重要的是,Trn2實(shí)例的性價(jià)比提升顯著,相比傳統(tǒng)GPU實(shí)例(P5e和P5en)高出30-40%,大幅降低了算力成本。
對(duì)于超大規(guī)模計(jì)算需求,亞馬遜云科技還推出了Trn2 UltraServer。
每臺(tái)UltraServer集成了64顆Trainium2芯片,并通過(guò)NeuronLink高速互聯(lián)實(shí)現(xiàn)2TB/s帶寬和1微秒級(jí)延遲。
這款產(chǎn)品為超大規(guī)模AI模型訓(xùn)練提供了理想的算力平臺(tái)。
除此之外,在芯片層面上,亞馬遜云科技宣布將在2025年推出Trainium3芯片。
據(jù)悉,Trainium3將采用3納米工藝制造,提供兩倍于Trainium2的計(jì)算能力,并提升40%的能效。

在存儲(chǔ)(Storage)層面,亞馬遜云科技發(fā)布了專為表格數(shù)據(jù)設(shè)計(jì)的Amazon S3 Tables,性能和效率再次升級(jí)。
Amazon S3 Tables引入了一種創(chuàng)新的存儲(chǔ)解決方案,專門針對(duì)表格數(shù)據(jù)優(yōu)化,并兼容Amazon Athena、Amazon EMR以及Apache Spark等主流查詢工具,以便用戶能夠便捷地執(zhí)行數(shù)據(jù)查詢操作。
作為S3的第三種存儲(chǔ)類別,表存儲(chǔ)桶與通用存儲(chǔ)桶和目錄存儲(chǔ)桶相輔相成,它被設(shè)計(jì)為一個(gè)分析型數(shù)據(jù)倉(cāng)庫(kù),適合存放多種模式的Iceberg格式表格。
S3 Tables在性能上相較于傳統(tǒng)的自管理表格存儲(chǔ)有顯著提升,查詢速度可提高至3倍,事務(wù)處理速率可達(dá)10倍,且享有全面托管的服務(wù)帶來(lái)的操作便利。
在數(shù)據(jù)管理中,元數(shù)據(jù)的作用日益凸顯,例如,手機(jī)中存儲(chǔ)的大量照片能夠通過(guò)元數(shù)據(jù)快速定位,使用自然語(yǔ)言即可迅速檢索到特定照片。
為滿足此類需求,亞馬遜云科技推出了Amazon S3 Metadata的測(cè)試版,旨在提供更加智能和高效的元數(shù)據(jù)管理功能。
Amazon S3 Metadata 提供了一種智能化、便捷的元數(shù)據(jù)管理方案,實(shí)現(xiàn)了近乎實(shí)時(shí)的元數(shù)據(jù)更新,幫助用戶高效地組織、識(shí)別和利用S3數(shù)據(jù),支持業(yè)務(wù)分析和實(shí)時(shí)推理等應(yīng)用場(chǎng)景。
該功能支持對(duì)象元數(shù)據(jù)管理,既涵蓋系統(tǒng)生成的詳細(xì)信息(如文件大小和來(lái)源),也允許用戶自定義元數(shù)據(jù)。用戶可以通過(guò)標(biāo)簽為對(duì)象附加額外信息,如產(chǎn)品SKU、交易ID或內(nèi)容評(píng)級(jí),進(jìn)一步提升數(shù)據(jù)的分類與檢索效率。
此外,這些元數(shù)據(jù)信息被無(wú)縫整合到 S3 Tables 中,進(jìn)一步強(qiáng)化了數(shù)據(jù)的管理與分析能力。
最后一層,便是數(shù)據(jù)庫(kù)(Database)了。
亞馬遜云科技發(fā)布了新型無(wú)服務(wù)器分布式數(shù)據(jù)庫(kù)Amazon Aurora DSQL,旨在解決傳統(tǒng)數(shù)據(jù)庫(kù)在擴(kuò)展性和性能方面的挑戰(zhàn),目前可以實(shí)現(xiàn):
- 跨區(qū)域強(qiáng)一致性和低延遲;
- 無(wú)限擴(kuò)展,可輕松處理TB至PB級(jí)數(shù)據(jù);
- 超高可用性,達(dá)到99.999%的可靠性。
與此同時(shí),Amazon DynamoDB global tables也增加了多區(qū)域強(qiáng)一致性支持,進(jìn)一步增強(qiáng)了其分布式數(shù)據(jù)庫(kù)服務(wù)能力。
數(shù)據(jù)分析能力也是Up Up Up
此次發(fā)布的最后一部分,便是分析板塊。
亞馬遜云科技所發(fā)力的點(diǎn),便是其一站式數(shù)據(jù)、分析與AI解決方案中心——新一代Amazon SageMaker。
新一代SageMaker的核心是SageMaker Unified Studio。
這是一個(gè)單一的數(shù)據(jù)和AI開(kāi)發(fā)環(huán)境,它整合了Amazon Athena、Amazon EMR、AWS Glue、Amazon Redshift、Amazon Managed Workflows for Apache Airflow (MWAA)以及現(xiàn)有的SageMaker Studio中的工具和功能。
其次是Amazon SageMaker Lakehouse,可以統(tǒng)一Amazon S3數(shù)據(jù)湖、Amazon Redshift數(shù)據(jù)倉(cāng)庫(kù)和第三方及聯(lián)合數(shù)據(jù)源。
除此之外,還包括Amazon SageMaker HyperPod的新訓(xùn)練配方功能、靈活訓(xùn)練計(jì)劃和任務(wù)治理功能,以及在Amazon SageMaker中使用亞馬遜云科技合作伙伴的熱門AI應(yīng)用。
這些功能將幫助客戶更快開(kāi)始訓(xùn)練流行模型,通過(guò)靈活訓(xùn)練計(jì)劃節(jié)省數(shù)周時(shí)間,并將成本降低高達(dá)40%。

以上就是今年亞馬遜云科技給予大模型時(shí)代客戶們的種種新的選擇了。
而這種“以客戶為中心,逆向工作(work backward)”為基因的云計(jì)算巨頭,還將以“提供選擇權(quán)”的方式在這個(gè)時(shí)代給我們帶來(lái)怎樣的驚喜,是值得期待一波。
- 商湯林達(dá)華萬(wàn)字長(zhǎng)文回答AGI:4層破壁,3大挑戰(zhàn)2025-08-12
- 商湯多模態(tài)大模型賦能鐵路勘察設(shè)計(jì),讓70年經(jīng)驗(yàn)“活”起來(lái)2025-08-13
- 以“具身智能基座”為核,睿爾曼攜全產(chǎn)品矩陣及新品亮相2025 WRC2025-08-11
- 哇塞,今天北京被機(jī)器人人人人人塞滿了!2025-08-08