清華校友研究再登Nature:3種方法解決自動駕駛“稀疏度災(zāi)難”
Corner case的數(shù)學(xué)本質(zhì)
賈浩楠 發(fā)自 副駕寺智能車參考 | 公眾號 AI4Auto
清華校友,最新自動駕駛研究成果再登Nature。

去年,Nature正刊曾罕見的將封面給了自動駕駛研究“仿真效率提升2000倍”——同樣是這個這個團隊的成果,成為自動駕駛?cè)?nèi)一時熱議的重大進展,智能車參考也詳細介紹過。
這次新研究發(fā)表在Nature子刊《Nature Communications》,關(guān)注更加底層、更加核心的AI技術(shù)難題:
稀疏度災(zāi)難。
研究了個啥?
有點“神乎其神”,稀疏度是個啥東西,咋就成了自動駕駛的災(zāi)難?
嚴(yán)謹(jǐn)?shù)亩x是這樣:
高維變量空間中安全關(guān)鍵事件的稀疏度。
通俗的說就是,拿來喂給AI司機的訓(xùn)練數(shù)據(jù)中,真正有用的不多。
舉個例子,現(xiàn)在車企、自動駕駛公司動輒說自己有幾百上千萬公里實測里程,或者仿真測試?yán)锍踢^億,但都回避了關(guān)鍵問題:
這些數(shù)據(jù)中,真正對系統(tǒng)能力有關(guān)鍵性提升的有多少?

比如自動駕駛在平直無車的高速上測試百萬公里,可能都不如在城市中遇見一次“鬼探頭”的提升大。
關(guān)鍵場景的查漏補缺,行業(yè)內(nèi)通常稱為“長尾場景”。
現(xiàn)在一般有兩種解決思路,一種是大力出奇跡,盡可能多的車,跑盡可能多的路,期望最大程度覆蓋各種罕見的交通狀況,讓自動駕駛能力從量變積累到質(zhì)變飛躍。
其實,包括現(xiàn)在成為行業(yè)共識的端到端技術(shù)體系,本質(zhì)上仍然是通過這樣的思路解決問題,只不過把整個自動駕駛流程中更多環(huán)節(jié)的權(quán)限移交給了AI。
另外一種,則是在有限算力、參數(shù)限制下,用人為手寫的規(guī)則,給自動駕駛套上“安全殼”,極限情況下通過降級或者剎停等等手段兜底。這是現(xiàn)在大部分量產(chǎn)智駕的方法,但劣勢很明顯:系統(tǒng)決策僵硬死板,泛化性差,體驗更差。

不知大家發(fā)現(xiàn)沒有,無論是哪一種方式,都沒有在AI算法這個層面剖析“稀疏度”本質(zhì),自然也就提不出針對性的解決方案。
作者在論文開篇就直接指出了這個問題:
盡管在公共道路上積累了數(shù)百萬英里的測試?yán)锍?,但自動駕駛?cè)噪y以有效處理頻發(fā)的“安全關(guān)鍵事件”。能商用的L4也一直落不了地。
所以將“稀疏度”稱為“自動駕駛的災(zāi)難”。
新研究解決稀疏度災(zāi)難的方法,是打開AI黑箱,嘗試用數(shù)學(xué)表達稀疏度本質(zhì),并提出了三種對應(yīng)的解決辦法。
怎么辦到的
具體來說,作者認為傳統(tǒng)上比較重視的安全關(guān)鍵事件的概率分布,其實并不核心。
相反,真正挑戰(zhàn)在于如何定義高度復(fù)雜場景中安全關(guān)鍵情況的稀有性,例如不同的天氣條件、不同的道路基礎(chǔ)設(shè)施以及道路使用者的行為差異…
這些安全關(guān)鍵情況,可能由于多種原因而出現(xiàn),比如對未知物體的錯誤識別,或?qū)Ω浇腥诉\動軌跡錯誤預(yù)測…這類事件發(fā)生的概率很低,大多數(shù)可用數(shù)據(jù)只包含很少的罕見事件信息。
因為罕見事件的寶貴信息可能被大量正常數(shù)據(jù)所掩蓋,所以深度學(xué)習(xí)模型其實很難有效學(xué)習(xí)到這些安全關(guān)鍵事件。

關(guān)鍵的地方來了。深度學(xué)習(xí)的本質(zhì)是通過優(yōu)化目標(biāo)函數(shù)對具有特定分布的數(shù)據(jù)期望,來獲得神經(jīng)網(wǎng)絡(luò)的最優(yōu)參數(shù)。
為了解決這個優(yōu)化問題,最常用的方法是基于梯度下降,在每個訓(xùn)練步驟使用一批數(shù)據(jù)通過蒙特卡洛估計來估計梯度。
然而,隨著安全關(guān)鍵事件的罕見性增加,估計方差會呈指數(shù)增加,導(dǎo)致“稀疏度災(zāi)難”。
解決方法有三個。
首先是使用更多罕見事件數(shù)據(jù)進行有效訓(xùn)練。
這種方法側(cè)重數(shù)據(jù),專門利用與罕見事件相關(guān)的數(shù)據(jù)來不斷改進系統(tǒng)能力。但定義和識別罕見事件不是那么簡單的。因為它們依賴于特定于問題的目標(biāo)函數(shù),并受到安全關(guān)鍵事件的時空復(fù)雜性的影響。更重要的,現(xiàn)在學(xué)界仍然缺乏可以指導(dǎo)罕見事件數(shù)據(jù)利用的理論基礎(chǔ)。
對于這樣的安全驗證任務(wù),團隊之前的試圖通過密集深度強化學(xué)習(xí) (D2RL) 方法來解決(即登上Nature封面的研究),實驗結(jié)果表明,D2RL 可以顯著降低策略梯度估計的方差,這是解決 CoR 的重要一步。
其次是提高機器學(xué)習(xí)模型的泛化和推理能力。實際上作者在這里討論的就是AGI的問題,目前在自動駕駛領(lǐng)域最前沿的嘗試是端到端模型。

人類可以在有限的經(jīng)驗(通常少于一百小時的訓(xùn)練)下學(xué)習(xí)駕駛,所以未來的AI也有可能在不依賴大量特定于任務(wù)的數(shù)據(jù)的情況下克服 CoR。這就要求AI同時具備自下而上的推理(感知數(shù)據(jù)驅(qū)動)和自上而下的推理(認知期望驅(qū)動)能力。
可以參考大型語言模型 (LLM) 和視覺語言模型 (VLM) 的方案,它們的基礎(chǔ)模型通過采用完全監(jiān)督微調(diào)、情境學(xué)習(xí)和思路鏈等技術(shù),展現(xiàn)出了出卓越的泛化和推理能力。
第三種方法,是通過減少安全關(guān)鍵事件的發(fā)生來減輕CoR對整個系統(tǒng)的影響。
直白的說就是盡量降低系統(tǒng)對場景、目標(biāo)的錯檢漏檢。具體方法有很多,比如將傳統(tǒng)深度學(xué)習(xí)模型和強化學(xué)習(xí)想結(jié)合,訓(xùn)練AI“預(yù)防性駕駛”能力、車路協(xié)同多傳感器融合、車云一體化方案等等。
三種解決 CoR 問題的潛在方法,從不同角度出發(fā)。不過作者強調(diào),這些方法并不相互排斥,結(jié)合起來會有巨大的潛力。
有什么意義?
CoR的影響不僅僅局限在感知環(huán)節(jié),而是滲透進了自動駕駛各個流程,逐級累加。一個概率極低的安全關(guān)鍵情況一旦出現(xiàn),可能造成很嚴(yán)重的后果。
例如,單幀中的物體分類錯誤可能不是什么大問題,而一系列幀(clips)中的多個物體分類錯誤可能會導(dǎo)致嚴(yán)重的錯誤識別和誤判,此類事件的發(fā)生概率遠低于任何單個錯誤的發(fā)生概率,因此 CoR 問題變得更加嚴(yán)重。
軌跡預(yù)測層面上,一個小小的預(yù)測錯誤可能會導(dǎo)致誤報或漏報,從而導(dǎo)致過于謹(jǐn)慎的駕駛決策或過于自信的決策而導(dǎo)致事故。所以行為預(yù)測模型必須有效處理容易出現(xiàn)CoR的罕見事件。

決策環(huán)節(jié),以往由于現(xiàn)實世界數(shù)據(jù)的缺乏和偶然性,深度學(xué)習(xí)模型很容易受到CoR的影響,這可能導(dǎo)致策略梯度估計的嚴(yán)重差異。
自然而然,由于CoR的存在,理論上評估自動駕駛的安全性能需要數(shù)億英里,這是不切實際且效率低下的,這也是為何仿真測試成了主流。但問題是,許多現(xiàn)有方法僅限于處理有限目標(biāo)的短場景段,無法捕捉現(xiàn)實世界安全關(guān)鍵事件的全部復(fù)雜性和多變性。
所以CoR盡管不是一個看得見、摸得著的bug,但危害深刻滲透進自動駕駛每個環(huán)節(jié)。
這項新研究最大的意義,是解釋了CoR的數(shù)學(xué)本質(zhì),并提出了幾種可能的解決方法。
作者團隊介紹
這項研究由美國密西根大學(xué)和清華大學(xué)研究人員合作完成。
一作、通訊作者劉向宏博士,現(xiàn)任美國密歇根大學(xué)講席教授、Mcity主任(密歇根大學(xué)主導(dǎo)的智能交通模擬城市項目)。
他在國內(nèi)最被外界熟悉的身份是滴滴前首席科學(xué)家。

劉向宏1993年本科畢業(yè)于清華大學(xué)汽車工程系,2000年在威斯康星大學(xué)麥迪遜分校取得博士學(xué)位。
劉教授是交通工程領(lǐng)域論文引用率最高的學(xué)者之一,他發(fā)明的用于精確測量交叉路口的排隊長度和旅行時間的SMART-Signal系統(tǒng)于2012年取得美國國家專利,并已在美國明尼蘇達州和加州得到廣泛應(yīng)用。
本文共同一作、通訊作者封碩,現(xiàn)在在清華自動化系任助理教授,曾前在劉向宏教授的Traffic Lab做博士后、研究員。

封碩本科和博士學(xué)位都在清華大學(xué)自動化系獲得,研究方向是優(yōu)化控制、互聯(lián)和自動駕駛評估以及交通數(shù)據(jù)分析。
從封碩和劉向宏教授團隊以往發(fā)表的成果和科研方向來看,他們一直在持續(xù)推進自動駕駛安全驗證評估和仿真測試的優(yōu)化升級。
比如之前我們報道過的D2RL,就是通過強化學(xué)習(xí)手段針對性生成高價值數(shù)據(jù),提高仿真測試的效率。
有趣的是,無論是自動駕駛、智能汽車產(chǎn)業(yè)界從工程實踐出發(fā),還是高校學(xué)者從數(shù)學(xué)原理層面抽象歸納總結(jié),竟然都指向了AGI、端到端、數(shù)據(jù)驅(qū)動的路徑。
所以端到端會是自動駕駛的最優(yōu)解,或者說它會是自動駕駛“歷史的終結(jié)”嗎?
- 具身智能洶涌,激光雷達爆單:頭部玩家600%年增長,出貨超20萬臺2025-08-08
- 智能座艙率先L3!AI Agent上車顛覆體驗,千里科技WAIC交卷2025-07-28
- 千里科技聯(lián)手階躍星辰、吉利發(fā)布下一代智能座艙Agent OS2025-07-26
- 老黃剛走,全球最強算力Robotaxi方案落地中國2025-07-24