毫末按下快進鍵后,自動駕駛迎來“相變”
毫末智行顧維灝詮釋“技術(shù)相變期”:數(shù)據(jù)驅(qū)動時代是完全不一樣的時代
在物理學(xué)中,我們都學(xué)過“相變”這個概念。舉例來說,水加熱會從液態(tài)變?yōu)闅?,降溫至零度以下,就會從水變成冰?/p>
從宏觀尺度上,地球也前后經(jīng)歷了多次溫暖氣候和冰期的交替?,F(xiàn)在常常提起的全球變暖,其結(jié)果也不僅是線性的溫度上升,而有可能在突破一個溫度值后,地球氣候可能在幾十年內(nèi)發(fā)生一場“相變”,變得不適宜人類生存,這正是當(dāng)前全力遏制全球變暖的根本原因所在。
相變,同樣也頻繁發(fā)生在人類的技術(shù)世界。
馬特里德利在《創(chuàng)新的起源》一書中指出,創(chuàng)新幾乎總是漸進的,而非突然發(fā)生的。一項技術(shù)創(chuàng)新總是在經(jīng)過多次創(chuàng)新積累之后就會在某一節(jié)點上發(fā)生“相變”,比如蒸汽機的改良和白熾燈的普及。
技術(shù)相變的邏輯,在今天仍然有效。在人工智能技術(shù)引發(fā)的新一輪技術(shù)革命下,自動駕駛被譽為智能產(chǎn)業(yè)中最先摘取的皇冠明珠。但自動駕駛又令人新生矛盾,當(dāng)眾人每次歡欣鼓舞地覺得無人駕駛會很快到來的時候,自動駕駛的現(xiàn)實困境就會當(dāng)頭潑上一盆冷水。
這一輪自動駕駛從萌芽、興起到點燃整個汽車產(chǎn)業(yè),也就過去僅僅十年時間。外行人很容易將智能汽車類比為智能手機。
十年間,智能手機的發(fā)展早已是滄海桑田,甚至都陷入創(chuàng)新瓶頸了,而十年對于自動駕駛汽車來說,才是一個開始,無人駕駛服務(wù)還在踟躕進行,輔助駕駛終于迎來了量產(chǎn)的黎明,準(zhǔn)備邁入城市場景落地的良辰。
幾經(jīng)波折背后,其實是自動駕駛技術(shù)的幾輪逐步演化。今天所面臨的的“規(guī)模量產(chǎn)”和“城市高階輔助駕駛”落地的局面,背后其實是自動駕駛技術(shù)迎來了新的“相變”時刻。
人工智能技術(shù)革命下,自動駕駛的兩次“相變”
自動駕駛的技術(shù)演進其實也遵循漸進創(chuàng)新的方式。在新一輪人工智能技術(shù)應(yīng)用于自動駕駛技術(shù)之前,科研人員和工程師們就已經(jīng)在探索讓車輛自動移動的可能。從最早的為道路預(yù)埋線圈軌道的方式,到加入激光雷達、攝像機以及自動控制技術(shù)來指揮車輛緩慢行進,奠定了自動駕駛的技術(shù)框架:感知、決策和控制,都是自動駕駛初期的一種探索。
而隨著以深度學(xué)習(xí)為代表的神經(jīng)網(wǎng)絡(luò)算法的興起,自動駕駛的實現(xiàn)出現(xiàn)了可能。經(jīng)過了美國DARPA所舉辦的無人車大賽的早期探索和第一波人才培養(yǎng),到2009年,自動駕駛開始進入商業(yè)世界,開始了狂飆突進的十年發(fā)展。
如何看待這十年的發(fā)展?國內(nèi)的一家自動駕駛獨角獸公司毫末智行在其HAOMO AI DAY上,從技術(shù)演進的角度提出了自動駕駛的3.0時代概念,也就是為自動駕駛過去狂飆的十年進行了斷代。
毫末把這近十年的自動駕駛技術(shù)發(fā)展分成了三個階段:最早的硬件驅(qū)動方式,可以稱為自動駕駛的1.0時代;最近幾年的軟件驅(qū)動方式,即自動駕駛的2.0時代;即將很快發(fā)生,并將持續(xù)發(fā)展的數(shù)據(jù)驅(qū)動方式,即是自動駕駛的3.0時代。
毫末為三個不同時期總結(jié)了其典型的技術(shù)特征,即不同的驅(qū)動力和技術(shù)工具,以及所實現(xiàn)的不同的技術(shù)高度上也。
在技術(shù)特征上,可以包括四個維度:產(chǎn)品和技術(shù)的測試?yán)锍蹋兄夹g(shù)的實現(xiàn)方法,認知技術(shù)的實現(xiàn)方法,技術(shù)模式的迭代方式。
在硬件驅(qū)動時代,自動駕駛車輛的典型特征就是車上掛滿了各種大大小小硬件,簡直武裝到了牙齒。感知能力,主要依靠昂貴的激光雷達,誰的線束多,誰的數(shù)量多,誰的能力就強;在認知上,也基本使用人工規(guī)則的方式來實現(xiàn)。由于測試車輛整體成本極高,車輛數(shù)量有限,同時技術(shù)效果一般,由此導(dǎo)致自動駕駛里程規(guī)模比較少,在100萬公里左右。
在軟件驅(qū)動時代,這個時候開始出現(xiàn)更大算力的中央計算芯片,同時車上車規(guī)級傳感器的數(shù)量在快速增加,AI算法開始在車上的廣泛應(yīng)用。在感知方向,各個傳感器各自為戰(zhàn),用一些小模型和少量數(shù)據(jù)做訓(xùn)練,得到單個傳感器的識別結(jié)果,然后進行感知結(jié)果級的融合;在認知方向,依然是人工規(guī)則為主;由于整體成本的下降和效果的提升,自動駕駛里程也快速在增加,達到上千萬公里。
毫末智行CEO顧維灝表示:“數(shù)據(jù)驅(qū)動的3.0時代,是完全不一樣的時代,是數(shù)據(jù)自己訓(xùn)練自己的時代,我們所做的一切的,都是為了能夠做出數(shù)據(jù)通道和計算中心,以便可以更高效的獲取數(shù)據(jù),并把數(shù)據(jù)轉(zhuǎn)化為知識。”
在感知方向,可依靠多個傳感器、不同模態(tài)傳感器的原始數(shù)據(jù)聯(lián)合輸出感知結(jié)果;在認知方向,通過大量人駕數(shù)據(jù)抽取可解釋的場景化駕駛常識,在配以AI的實時計算,可以更加擬人化的融入社會交通流中;訓(xùn)練的方式,也發(fā)生了很多變化,主要是從小模型少數(shù)據(jù),轉(zhuǎn)成剛才提及的大模型和真正的大數(shù)據(jù),是那種1億公里以上的輔助駕駛里程所產(chǎn)出的數(shù)據(jù)。
以上可以看到,在引入AI技術(shù)之后,自動駕駛技術(shù)隨著感知、認知技術(shù)模式的實現(xiàn)方式的不同,迎來了兩次“相變”,而我們所要做的就是搞懂這兩次“相變”的核心邏輯。
“特毫華”沖刺自動駕駛3.0的路向,走向合流?
當(dāng)前,自動駕駛技術(shù)正在從2.0邁向3.0時代,而其中以中美兩國自動駕駛公司和車企為主要推動力量,國外以特斯拉為代表,國內(nèi)以造車新勢力,華為、毫末等自動駕駛技術(shù)提供商為代表,在全力沖刺城市級輔助駕駛的量產(chǎn)落地。
去年底,特斯拉FSD的V10測試版已經(jīng)向全美推送升級,可實現(xiàn)基于導(dǎo)航的城市級輔助駕駛。而正在更新路上(已多次延遲)的FSD Beta V11,可實現(xiàn)單一軟件堆棧進行高速公路和城市內(nèi)駕駛的第一個版本。盡管一再跳票,特斯拉FSD正在展示出基于車端感知和導(dǎo)航地圖即可實現(xiàn)城市級輔助駕駛的能力。
毫末智行在去年4月發(fā)布國內(nèi)首個可大規(guī)模量產(chǎn)的重感知路線的城市NOH輔助駕駛系統(tǒng),并計劃在2023年實現(xiàn)打造城市NOH車輛的規(guī)模落地,并在2024年快速覆蓋中國100個以上的城市。其中,毫末所提出的“重感知、輕地圖”路線很快成為國內(nèi)幾乎所有自動駕駛公司的選擇。
去年,搭載華為和小鵬城市輔助駕駛功能的車輛開始上市,不過受限于“高精地圖”的范圍限制,這些車輛只能在廣州、上海等地的部分區(qū)域開啟城市輔助駕駛。此后,我們可以看到華為余承東公開表示,自動駕駛應(yīng)擺脫對高精地圖的依賴。而在小鵬今年開年的內(nèi)部信表示,要在2023年完全摒棄高精地圖落地城市輔助駕駛。
熱鬧歸熱鬧,那么推動量產(chǎn)自動駕駛技術(shù)從ADAS向高階輔助駕駛(城市級點對點導(dǎo)航輔助駕駛)演講的技術(shù)邏輯,其實正在自動駕駛3.0時代的要求。那就是以數(shù)據(jù)驅(qū)動的方式,來指導(dǎo)自動駕駛感知、認知算法的迭代,以及數(shù)據(jù)標(biāo)注、仿真訓(xùn)練等方式來提升自動駕駛系統(tǒng)克服極端場景的能力。
具體來說,自動駕駛技術(shù)從2.0向3.0時代演進,其實根本上體現(xiàn)為這樣兩個方面。
第一是以Transformer為典型的大模型引入到自動駕駛算法的訓(xùn)練中。它一方面帶來了對于訓(xùn)練數(shù)據(jù)的的規(guī)模需求和超大算力的使用需求,一方面它又帶來自動駕駛算法的加速優(yōu)化。
第二就是,自動駕駛訓(xùn)練數(shù)據(jù)結(jié)構(gòu)的優(yōu)化帶來的感知升維,以及大規(guī)模人駕數(shù)據(jù)的決策訓(xùn)練以及交互搜索等算法帶來的自決策,為替代原來由規(guī)劃決策手工規(guī)則的認知思路提供了解決辦法。
例如,毫末智行在2023年1月的一期AIDAY上,就一口氣發(fā)布了五個大模型。其中,視覺自監(jiān)督大模型,可以完成對BEV感知數(shù)據(jù)升級而成的4D clip數(shù)據(jù)的自動標(biāo)注;多模態(tài)互監(jiān)督大模型,可以完成通用障礙物的識別;3D重建大模型幫助毫末做數(shù)據(jù)生成,用更低成本解決數(shù)據(jù)分布問題,提升感知效果;動態(tài)環(huán)境大模型,可以精準(zhǔn)預(yù)測道路的拓撲關(guān)系,讓車輛始終行駛在正確的車道中;人駕自監(jiān)督認知大模型讓毫末的駕駛策略更加擬人化,安全及順暢。
MANA五大模型助力毫末車端感知架構(gòu)跨代升級:MANA最新的車端感知架構(gòu),從過去分散的多個下游任務(wù)都集成到一起,形成一個更加端到端架構(gòu),包括紅綠燈、局部路網(wǎng)、預(yù)測等任務(wù),實現(xiàn)了跨代升級。
整體來說,毫末在為自動駕駛3.0時代所作的技術(shù)準(zhǔn)備,實際上已經(jīng)成為全行業(yè)的一種共識。無論是特斯拉,還是新勢力以及強勢涌入賽道的華為、大疆等新玩家,都開始嘗試按照數(shù)據(jù)驅(qū)動的方式來搭載感知、認知的模型,以及數(shù)據(jù)組織管理的方式。自動駕駛技術(shù)路線正在走向合流。
對于數(shù)據(jù)驅(qū)動來說,可稱為3.0時代第三個特點的就是對于自動駕駛智算中心的重視。小鵬、毫末、吉利等主機車企都在紛紛搭載屬于自己的智算中心。近期,《人民日報》在科技版《智能算力,數(shù)字經(jīng)濟新引擎》中這樣評價毫末智行智算中心:有效降低了自動駕駛模型訓(xùn)練成本,大幅提升了計算效率,車端感知架構(gòu)實現(xiàn)升級。智算中心能夠帶動人工智能及相關(guān)產(chǎn)業(yè)倍速增長,成為經(jīng)濟增長的新動力。
結(jié)語:做穿越“相變”的新物種
大家知道,科技的演化正在呈現(xiàn)一種加速度。這使得所有科技領(lǐng)域的參與者都容易變得焦慮和痛苦,生怕自己反應(yīng)過慢,無法抓住時代賞賜的機遇。就如上一個還未結(jié)束的移動智能時代,曾經(jīng)的巨頭因為判斷失誤倒閉了,曾經(jīng)的小公司因為爆款產(chǎn)品變成了巨頭。無數(shù)人的光榮與夢想寄托在一個又一個的技術(shù)爆發(fā)中。
但這只是科技世界的一層表象,內(nèi)在的邏輯仍然是某一技術(shù)遵循自身的演進節(jié)奏和邏輯。往往對于人類產(chǎn)生革命性影響的技術(shù)樹越需要耐心和戰(zhàn)略定力。自動駕駛就是這樣一種。
回顧過去十年,我們會發(fā)現(xiàn),自動駕駛技術(shù)是無法一蹴而就的。而且自動駕駛進程并非如人們預(yù)料的一帆風(fēng)順,也沒有能一下子摘取到無人駕駛這一高懸樹頂?shù)墓麑崱,F(xiàn)在,自動駕駛正在沿著其本身自然的規(guī)律,從輔助駕駛的簡單場景向復(fù)雜場景,從限制性功能向高階功能進行演化。
面向正在呼嘯而來的自動駕駛3.0時代,也許只有少數(shù)保持戰(zhàn)略定力和持續(xù)投入的自動駕駛公司,才能抓住這次自動駕駛“相變”期,成為適應(yīng)新時代的新物種。
- 超詳細!2025科技創(chuàng)變者大會最新議程公布!2025-08-21
- 中科慧遠發(fā)布CASIVIBOT,以九年積累開啟AOI與機器人協(xié)同的品質(zhì)檢測新時代2025-08-20
- 嚯!剛剛,張麻子陪我玩黑猴了2025-08-19
- 機器人全產(chǎn)業(yè)鏈接會 FAIR plus 2026媒體見面會在京召開2025-08-16