毫末智行創(chuàng)辦2年營收過億,路測百萬公里,放話明年是自動駕駛行業(yè)生死線
賈浩楠 發(fā)自 凹非寺量子位 報道 | 公眾號 QbitAI
這可能是中國進展最迅猛的自動駕駛公司。
剛剛結束的毫末智行Q3品牌日,這家被業(yè)內人視作“中國最懂量產自動駕駛”的公司曬出最新成績單:
增收快,成立不到2年的毫末智行,今年已經實現億級別營收。
這本身已不可思議。
產品落地方面,今年2季度一口氣亮出10款量產產品,硬件軟件都有落地,最新產品是和阿里達摩院合作的無人末端配送車“小蠻驢”。
更超出行業(yè)經驗認知的,是技術迭代迅速。
從今年1月開始,已累計超過100萬公里智能駕駛數據,而且不是仿真,是在中國真實道路上的實際里程。
如此驚人的進度,毫末智行到底有什么殺手锏?
毫末高管悉數亮相,罕見分享技術細節(jié),看家法寶“和盤托出”。
100萬公里數據到手,問題卻沒那么簡單
先來解答一下,毫末智行的100萬公里從哪來。
毫末智行孵化于長城汽車集團,誕生于這個傳統(tǒng)汽車巨頭的自我憂患中,也肩負著長城智能化轉型的核心重任。
今年上市的魏品牌摩卡車型,就是毫末智能駕駛系統(tǒng)的首秀。
100萬公里,從今年1月測試開始算起,也包括上市后普通用戶貢獻的數據,都從這款車上來。
但100萬公里數據到手,毫末發(fā)現問題卻沒那么簡單。
品牌日現場,出身百度無人車的團隊的CEO顧維灝先從問題入手,揭秘毫末成績單背后的努力和探索。
首先是海量的數據中,對輔助駕駛系統(tǒng)能力提升的關鍵數據,并不多。
比如,一段城市快速路上的視頻圖像中,可能有超過60%是沒有突發(fā)情況發(fā)生的平直路段。
這樣的數據再多,也不會對系統(tǒng)能力提升有決定性作用。
反倒是出現頻率低、目標小的圖像數據,才是補上系統(tǒng)短板的關鍵。
如何挑出這些有價值的數據,是第一個挑戰(zhàn)
而在有價值圖像中,模型能力的不足,也會導致關鍵小目標的漏檢,降低數據利用率。
另外在模型能力上,也會存在“數據偏見問題”,比如能識別白色乘用車,卻識別不了被植物遮擋的白色乘用車。
這兩個問題,是在數據收集前期階段出現的。
拿到處理好的有價值的數據之后,系統(tǒng)還要攻克其他挑戰(zhàn)。
其一,是如何快速迭代,更通俗的說,調參之后如何加快新模型訓練速度。
其二,是源源不斷的數據涌進來,使得模型版本快速迭代,如何在短時間驗證這些不同模型,挑戰(zhàn)也不小。
自動駕駛公司沒數據發(fā)愁,像毫末這樣從不缺數據和場景的,卻面臨另一層面的難題。
剛剛在毫末智行第三個品牌日上,CEO顧維灝首次詳細揭露的毫末應對之法。
數據、訓練雙管齊下,“最懂”自動駕駛量產公司如是說
開發(fā)過程中的問題找到了,如何解決這些問題就成了毫末智行品牌日的核心重點。
從應對這些挑戰(zhàn)的技術方案,也能體會一番為何毫末這家公司,是最懂自動駕駛量產落地的。
“大帶小”的數據診斷方法
先說找到有價值的場景數據,毫末把這個過程叫做診斷。
目前診斷的手段有兩種。
第一種方法是通過明確的系統(tǒng)失效信號得到診斷結果,例如通過人工接管信號。
也就是說由用戶在使用過程中發(fā)現系統(tǒng)能力的不足而接管,系統(tǒng)會抓取接管前后一段時間內的數據上傳場景庫分析學習。
第二種方法則是通過更強大的后方服務端模型去診斷車端模型的錯誤。
車端模型受制于算力、傳輸延遲、參數有限,初期能力自然不足有限,一般一個小模型負責一部分感知任務。
所以毫末在實測中發(fā)現了對于遠距離小目標,之前的系統(tǒng)版本時常會出現漏檢情況。
而部署在服務端的大模型叫做Fundamental Model,是一個基于Transformer的全任務感知大模型。
算力要求高,資源占用大,但能力卻超強,能發(fā)現小模型漏檢錯檢、或在惡劣天氣下識別能力下降的錯誤。
△上為車端模型漏檢,下為大模型的糾正
找出問題后,再把結果返回車端模型重新訓練學習,這樣就能最大程度捕捉有效數據。
“舉一反三”解決數據偏見
找到有問題的場景之后,就需要針對這個場景補充足夠的樣本數據,也就是找到足量的和它同類型的其他相似數據。
以此進行樣本調配,才能做出一個更好的AI模型
通過已經上市的長城魏摩卡車型,毫末已經積累了巨量的道路場景數據庫。
面對海量場景,毫末的方法是首先以無監(jiān)督學習方法將圖像向量化,把圖片數據轉化為特征向量,然后通過譜聚類,將相似的圖像聚類在一起。
得到聚類結果以后,對于需要的目標場景,就能找到大量和其同一類別的相關數據作為正樣本,以及相似易混的其他類別數據作為負樣本。
并且在類別當中,只挑選類中心和類邊界附近的數據,以此提升標注效率。
這種方式還可以非常有效的將異源數據以合適的方式混用起來,提升最終模型的效果。
數據診斷依靠“大帶小”,而“數據偏見”則通過舉一反三的方法解決。
并行訓練,煉丹時間縮短一半
現在,已經拿到了對于模型能力提升的關鍵數據,接下來就是“煉丹”了。
Transformer能力強,但是訓練速度也慢。
Swin-Transformer網絡即使在360GB RAM、4塊V100 GPU的服務器上,標準數據并行DDP訓練也需要超過100小時。
毫末的工程師如果稍微改一下網絡結構、參數配置、或者是更換數據,迭代一次看到結果的周期是近百個小時。
但這些操作又是會頻繁發(fā)生的,所以這樣嚴重拖慢了技術迭代。
所以為了提升訓練速度,除了常見的數據并行之外,還需要更精細的模型并行方法。
首先是數據并行,每塊GPU上訓練完整的網絡,將數據切塊以適應GPU。同時每層的梯度還會和其他GPU交互。這樣可以進一步提高模型收斂速度,以更少的epoch達到同樣的訓練效果。
這種數據并行和模型并行的混合方式,叫做流水并行。
針對swin-transformer,就采用了流水并行的方案,整體可以提速50%-80%。
流水線生產測試場景
訓練效率有了提升,新的問題隨之而來:
模型迭代快、版本多,如何驗證其有效性?
主流做法當然是把模型丟到仿真環(huán)境中測試,但是傳統(tǒng)的仿真是一種非常低效的方式。
從場景設計,到設置道路模型、設置車輛模型、設置交通流模型、到最后進行仿真測試…每人每天只能做30個。
所以毫末開發(fā)了語義場景的自動化轉化工具和參數泛化工具,可以將CSS中場景庫的描述文本自動的轉化為仿真測試場景,并且在合適的范圍內離散采樣得到巨量的仿真測試用例。
同時通過在云端并行,目前每天可以自動生成一萬多個仿真測試用例。
簡單理解,前面的數據診斷其實是一種數據標注自動化,而云端語義場景自動化轉化,就是一種流水線生產測試場景的工具。
天下武功,無堅不摧,唯快不破。
自動駕駛也是如此,毫末智行參得最透。
數據大而多,處理快且準,一切以此為綱,才有了毫末不可思議的量產上車速度。
從技術看毫末智行
毫末智行內部把董事長張凱、CEO顧維灝稱作測試狂,每周都要花大量時間親自測試智能駕駛產品。
品牌日現場,董事長張凱也提到了長城汽車內部更是重視智能化,每周六都要求技術負責人、各公司高管必須參加智能化體驗測試。
不光是自家產品,市場上每一款產品都要體驗對比,有時魏建軍還會親自參加。
毫末的硬核技術底色盡顯。
同時張凱還說,規(guī)模上量速度最重要,自動駕駛公司2022年前還找不到規(guī)?;涞芈窂降?,無疑是致命的。
那么毫末到底是一家什么樣的公司?
進展迅猛和打磨技術,在毫末這里其實一脈相承,絲毫不矛盾。
毫末智行為什么中意Transformer?
上個月的特斯拉AI Day,馬斯克首次明確推出DOJO、并分享Transformer和大模型之于自動駕駛作用。
殊不知,類似思路在中國早有毫末智行團隊在踐行。
Q3品牌日上,我們看到Transformer已經成為了毫末重要的開發(fā)工具。
其實在毫末智行第一次公開亮相時,CEO顧維灝就表達了對Transformer的格外關注。
隨后在公開場合也不斷提及。
顧維灝認為,自動駕駛行業(yè)現狀是傳感器供應商、方案趨同,僅靠硬件堆料拉不開差距。
所以未來的決勝點一定在數據,數據多是前提,數據好是基礎。
如果時常關注AI技術前沿的一定有所了解,Transformer最早是進行語言處理任務的,具有避免循環(huán) (recurrent) 的模型結構,完全依賴于注意力機制對輸入輸出的全局依賴關系進行建模。
也就是說,只需要數據足夠大,就能訓練一個超大的模型。
近兩年,Transformer的對圖像識別的準確率、效率、魯棒性不斷刷新各種榜單,一騎絕塵。
這是真·大力出奇跡,因為這種方法要求龐大的數據集,恰好與毫末智行的數據采集、泛化的優(yōu)勢完美m(xù)atch。
為什么自動駕駛在云端決勝負?
談到毫末智行自研的算力平臺ICU 3.0時,顧維灝說現在有觀點認為車端算力已經達到幾個T,完全夠用了。
但毫末卻從實踐中得出了完全不一樣的結論。
單從攝像頭來看,今天汽車主流的攝像頭還是100萬像素的,而即將搭載毫末智能駕駛系統(tǒng)的長城車型,即將開始使用200萬像素和800萬像素攝像頭。
所以為長久計,長城汽車、毫末智行共同聯(lián)合高通推出了目前全球算力最高的可量產自動駕駛計算平臺ICU 3.0(即毫末智行“小魔盒3.0”),平臺單板算力達360TOPS,可持續(xù)升級到1440TOPS。
但是在未來,車端單個攝像頭的數據量可能還會增加100倍,而車端用的攝像頭數量也會增加十幾倍。
以此來看,車載計算芯片的算力再增加幾百倍都是不夠。
所以,大數據量帶來大計算量,非云端不能解決。
前面講到的服務(云)端大模型訓練車端小模型,核心邏輯就在于此。
整個Q3品牌日,毫末智行所分享的技術細節(jié)可以看出,企業(yè)核心就是大數據大模型、快速迭代。
具體方法,是打開一個迅速落地上量的場景,然后根據場景特征設計自己的高效數據方案,避免在有限場地內經年累月測試,遲遲不能落地。
有了場景后,毫末智行走的是漸進式的商業(yè)化落地路線,智能駕駛從加強人向取代人發(fā)展。
毫末的“快”,背后既有毫末董事長張凱代表的長城基因,另一方面還有顧維灝這樣中國最早在科技公司展開智能車探索的先驅。
這種行業(yè)罕見的強力配置,共同決定了毫末“最懂量產的自動駕駛公司”的底色。
- 具身智能洶涌,激光雷達爆單:頭部玩家600%年增長,出貨超20萬臺2025-08-08
- 智能座艙率先L3!AI Agent上車顛覆體驗,千里科技WAIC交卷2025-07-28
- 千里科技聯(lián)手階躍星辰、吉利發(fā)布下一代智能座艙Agent OS2025-07-26
- 老黃剛走,全球最強算力Robotaxi方案落地中國2025-07-24