樓教主:今天具身智能的狀態(tài)很像2018年的自動駕駛
”云代駕是偽概念,VLA基本幫不上L4“
一凡 發(fā)自 副駕寺
智能車參考 | 公眾號 AI4Auto
新一代Robotaxi家族車型亮相,小馬智行聯(lián)合創(chuàng)始人、CTO樓天城對外分享了關(guān)于自動駕駛的最新思考,從L2談到L4,從L4的技術(shù)談到運營,以及自動駕駛后新的AI浪潮:
AGI和具身智能。
在樓教主看來,L2與L4有著本質(zhì)的不同,“L2無法升維成L4”,L2做的越好,離L4越遠(yuǎn),反之亦然,當(dāng)下L2火熱的VLA范式甚至在L4“基本幫不上什么忙”。
作為L4最前沿的落地應(yīng)用,作為落地應(yīng)用的最前沿玩家,小馬智行Robotaxi進(jìn)展如何?未來有什么規(guī)劃?
如何看待今天具身智能的火熱?
以下為采訪對話實錄,經(jīng)編輯
談技術(shù):VLA幫不上L4,世界模型用5年了
Q:如何看待VLA?
樓天城:VLA在L4上基本幫不上忙,原因是一個模型有兩種東西,一個是能力,還有一個是本身的屬性。VLA的屬性就是遇到再復(fù)雜的情況,它也能給個大差不差的東西,它是一個全科大夫,但是L4要求極端安全,需要的是一個??拼蠓颉LA再強(qiáng)也看不了??撇?/strong>。拿長跑短跑舉例子,博爾特可能是一個優(yōu)秀的短跑運動員,但是你指望他跑長跑肯定不行,因為腿的肌肉都不一樣。
運動員有長跑短跑的屬性和他能力強(qiáng)不強(qiáng),這是兩碼事兒,他可以不斷鍛煉,讓自己變成博爾特這樣,但是不表示他長跑就有進(jìn)步。過去兩年我們技術(shù)最關(guān)鍵的變革,一個是端到端,一個是世界模型,其實世界模型在機(jī)器學(xué)習(xí)領(lǐng)域有30年的歷史了,我們用了大概有5年的時間,Waymo比我們略早一些,百度我覺得時間差不多,我沒有意識到大家不知道世界模型,所以我在去年底出來說了這個東西。
具身智能公司都在說這個東西,只要脫離人,不依賴人,獨立完成一個事情,基本都要用世界模型的概念。因為它要基于強(qiáng)化學(xué)習(xí)的概念,要基于世界模型的概念,所以這在機(jī)器人領(lǐng)域是一個非常常見的事,我沒有意識到這一點,所以就把這個概念帶給了市場。
世界模型的理念其實就是學(xué)習(xí)方式不同,人生有兩種學(xué)習(xí)模式,一種是傳統(tǒng)的教育模式,老師怎么做,我怎么比劃,這叫模仿學(xué)習(xí),這是最常見的學(xué)習(xí)方式。它的優(yōu)點是非常方便、快,也沒有什么不確定的因素。缺點很明顯,你很難超過老師。另一種是強(qiáng)化學(xué)習(xí),老師也不會做,但是老師給你創(chuàng)造實驗環(huán)境,就像我研究生時候,老師給我創(chuàng)造實驗環(huán)境,讓我朝這個方向去努力,自己去摸索,這叫強(qiáng)化學(xué)習(xí)。
所有L4公司用的都是強(qiáng)化學(xué)習(xí),也是為什么我們說世界模型的觀念,這是根本的不同,這個事情在行業(yè)中有四到五年的共識了,但是我沒有意識到大家不是這么想的。
Q:無人駕駛的成本什么時候低于傳統(tǒng)司機(jī)?
樓天城:新一代車型量產(chǎn)運營后一定能實現(xiàn)。上一代硬件成本還比較貴,所以做不到。這個過程有兩個大的里程碑,第一是要去掉人,如果有人的話肯定做不到。第二步就是用車規(guī)級量產(chǎn)硬件。這一代車型達(dá)到了這兩個目的。
Q:如何看待5G云代駕?
樓天城:這是一個偽概念,我從不會以任何方式嘗試云代駕的邏輯,在技術(shù)上太commonsense了。云代駕對網(wǎng)絡(luò)要求非常高,相當(dāng)于我花十倍無人車的錢來雇一個云代駕,而且網(wǎng)絡(luò)是很不穩(wěn)定的,一天上午就斷好幾次網(wǎng)。而且云代駕沒有身臨其境的感覺,所以它做的判斷也是有誤差的。小馬從沒有嘗試過任何云代駕的概念,但我們也有遠(yuǎn)程,你可以認(rèn)為我們的是一個客服,但是他絕不會操作車,其他家像Waymo也完全沒有做過這個東西。
Q:車隊到達(dá)什么量級可以去方向盤?
樓天城:要過萬。這也是我很想發(fā)生的事情。
但是我剛剛說的特斯拉的那個還在做。因為我是做技術(shù)的,特斯拉按結(jié)果來看他還不在桌上,他只是說他某天可以很快到桌上。
一個做技術(shù)人的表示,你上了桌再教別人打牌。
談Robotaxi運營:開城越快,盈利可能越慢
樓天城:我先簡單介紹自動駕駛今天的發(fā)展現(xiàn)狀,今天我們的Robotaxi大概至少跑了50萬個小時了,開到了市中心,高快速度,雨天、暴雨也都能跑,所以技術(shù)上的駕駛安全性上,2022年底就ready了。
為什么這一次我們講的都是成本、車規(guī)、量產(chǎn),就是基于這個前提,技術(shù)至少我覺得已經(jīng)是接近滿分的狀態(tài)了,這就是自動駕駛L4發(fā)展的狀態(tài)。
技術(shù)路線其實也經(jīng)歷了很多變革,其中一個變革其實就是端到端,這也是兩年前的事了,大概在那個時候,我了解到像我們、Waymo、百度都已經(jīng)用了。今天對L4公司已經(jīng)是標(biāo)配了,但是對L2公司不一定,所以有時候因為大家習(xí)慣講L2,會說你有沒有端到端,覺得你做的好不好。
剛才說的50萬小時,做到這個,那自動駕駛玩家就還在牌桌上,否則可能還在牌桌下。
Q:Robotaxi運營時零件壞了怎么辦?
樓天城:我們有冗余,就像飛機(jī)上很多零部件會失效,但是飛機(jī)也能帶我們回家。
Q:現(xiàn)在每輛車日均訂單有多少?
樓天城:我們每輛車每天有15單,現(xiàn)在不夠高的原因是因為車少,接單的時間會比較長,浪費很多時間。訂單量后面會隨著車增加會上漲,
Q:這一代套件成本怎么樣?
樓天城:相對來說比上一代降低了70%,它全都是車規(guī)級的價,比如我們雷達(dá),用的就是理想上的雷達(dá),我們的域控是蔚來上的芯片,都是這些零部件,所以加起來不會特別貴。
Q:這個成本是自動駕駛系統(tǒng)的成本,還是整車?
樓天城:剛才說70%是指自動駕駛的成本,因為整車的話,就像大家出門打車有優(yōu)享、專車和快車。我們現(xiàn)在有多個平臺,也有這方面的考慮,比如用更高端的車。
Q:會完全自己運營,還是會跟什么公司一同運營?
樓天城:現(xiàn)在是一個混合的狀態(tài),我們自己有app在運營,我剛剛推薦各位用我們的app,小程序也可以。但是像如祺、高德這樣的平臺,兩個是混合的狀態(tài),也幫我們補(bǔ)充一下。
Q:小馬出海規(guī)劃是怎樣的?
樓天城:我們現(xiàn)在出海順序是韓國、新加坡,大陸之外香港,還有中東,還有歐洲,我們都有這樣的布局。因為重大政策需要時間來準(zhǔn)備,我們就今天開始布局,然后到了幾年之后它能夠在海外有這樣的情況。
Q:為什么現(xiàn)在中國Robotaxi都在出海?
樓天城:今年也許國內(nèi)有很大的市場,但是三年以后,我還是希望海外是一個巨大的增長點。但是為了三年后海外增長,就得今天開始布局,不能等三年后再布局。
Q:第七代Robotaxi打車定價如何?
樓天城:非常好的問題,簡單來說我們會定在一個相對比較高的價格,我一直堅信AI應(yīng)該提供好的產(chǎn)品,為大家提供高質(zhì)量的服務(wù),而不是把很多事情卷的價格更低,這是AI的意義。
所以我希望我們的服務(wù)是高質(zhì)量的,然后收一個合理的價格。比如說我提供專車服務(wù)收優(yōu)享的錢,但是肯定是那個級別的,絕不會往下去做,因為這是我們的理念。我一直覺得AI這么多年,如果說只是為了提升效率,并不是AI的目的,AI還是提供高質(zhì)量的服務(wù),改善我們的生活,提高服務(wù)質(zhì)量。
Q:怎么吸引用戶去坐我們的車輛呢?
樓天城:性價比肯定是高的。一定是有好的服務(wù)。比如說這是一個私密空間,并且他開車的駕駛能力是非常一致的。有的時候你坐車,可能今天司機(jī)和明天司機(jī)的體驗都不一樣,而這個是非常一致的體驗,一種好的體驗是非常必要的。其次在這個好的體驗的前提下,是一個相對還優(yōu)惠的價格。
我們在北京遇到一個很神奇的用戶,他每天中午都打一趟我們的車,起點終點一樣,去哪一個地方繞一圈再回來,我就想這個哥們是干嗎的呢?我就去找了他,他說他中午想找個地方睡一覺,沒有地方打盹,就打我們車睡一覺。我說我們的車還能干這個。
Q:那我們的車未來會給用戶提供這樣的場景嗎?
樓天城:這是產(chǎn)品設(shè)計的亮點,但是真正產(chǎn)品改造還是以更多的客戶作為主要的策略來源,不會專門為某一個用戶去改。
Q:為什么歐洲Robotaxi價格比出租車高很多?
樓天城:其實這個跟出租車公司有關(guān)系,不同國家不太一樣,像日韓就挺高的,中東不明顯,新加坡很高??傮w上來說,確實我們出海的很多市場當(dāng)中單價高,也是很好的吸引我們的地方。至少兩三年后,單價對應(yīng)的是利潤,這個還是非常有幫助的。
Q:如果很多IT大廠入局Robotaxi,小馬智行如何應(yīng)對呢?
樓天城:我們有很多時間領(lǐng)先性,大廠要做技術(shù)上需要很長時間。比如說我們用了8年時間,大廠就算快一些,比如說用5年時間,但是5年之后,這個市場早就不同了,這個時間差是很難被追上的。我只是說如果說現(xiàn)在新做的話,相對來說IT公司會比車廠做得更好一些,至于說他有沒有這個決心是另外一回事。
Q:咱們現(xiàn)在的無人車是在量產(chǎn)車上做一些改款嗎?
樓天城:現(xiàn)在的車已經(jīng)不是這樣了,可以說是市面上車的改款,但是不再是人敲的那種東西了。
Q:會不會開城越快,盈利越慢?
樓天城:開城越多是會影響盈利點的。首先是分散,一個區(qū)域內(nèi)的車變少了,服務(wù)質(zhì)量下降了,盈利能力就弱了。其次城市之間的盈利點也不同,為什么我們做北上廣深,這就是中國收入最高的四個城市,不同城市司機(jī)收入不一樣。
為什么我不聚焦一個城市?作為一家初創(chuàng)公司也需要一些曝光量,四個城市的話,大家經(jīng)常多去去。我在一個城市的話,可能大家一年都不來一次,也有這方面的考慮。單純從盈利來說你說的是對的,就是太分散之后會影響盈利時間點。
還有一件小事,從駕駛能力上,不同城市之間,在L4領(lǐng)域其實差別不大的。大家說L2的時候,說你能覆蓋100個城市、200個城市,500個城市跟10個城市不一樣,但是L4不一樣。L4哪怕在海外的泛化性都是非常好的。原因是什么?原因是L4關(guān)鍵是解決極端場景的,就是其他那些非常瘋瘋癲癲的,不太守規(guī)矩的人。不同國家正常人開車習(xí)慣是不一樣的,但是瘋子是一樣的。所以泛化性是非常好的,為什么不多開城是一個商務(wù)決定。
Q:只做北上廣深是兼顧了兩個方面,既有足夠多的車,也可以保證未來有盈利的空間?
樓天城:是的。
Q:Robotaxi量起來后如何監(jiān)管呢?
樓天城:有自駕辦專門來監(jiān)管這件事情,首先我們是有牌照的,我們要繳稅的。他會利用一些已有的法規(guī)來監(jiān)管,比如說定責(zé),比如說牌照怎么發(fā)。比如說一個人駕駛證是12分,但是企業(yè)不能說12分,但是他會有一個比如說出了事故就扣分,扣沒了就考照,除了事故之后如何定損、定責(zé),各地有一套這樣的東西。下一步可能會有中央的突破,現(xiàn)在還是在各個城市,但是這方面相對來說都已經(jīng)很健全了。
Q:今天最新一代有車型基本架構(gòu)似乎和阿波羅5代差不多,怎么理解?
樓天城:是一個節(jié)奏的區(qū)別,其實RT 6我估計已經(jīng)觸碰到問題的答案了。對我來說,我更看重先把成本下來再上規(guī)模,所以讓你覺得上規(guī)模比他晚一些,但是我降成本會比他降得早一些,其實是一個錯位的點,其實在整個速度上大家是一致的,你看RT 6,先不管他報出多少價格,大家用的東西其實都是這些東西,成本上我們是有共識的。如果你說我們的不同點,我們可能在車規(guī)上走得更極致,就是我們現(xiàn)在車上所有的零部件100%都是車規(guī)的,其他家一定都沒做到。這一點上,Waymo是做得最差的。
Q:那Waymo會掉隊嗎?
樓天城:只要它還是Waymo,就一時半會兒不會。
談具身智能:今天的狀態(tài)就像2018年的自動駕駛
Q:小馬自動駕駛的技術(shù)未來會不會復(fù)用在機(jī)器人上?
樓天城:現(xiàn)在我先說“不”,至少我們現(xiàn)在沒有任何具身智能的計劃,究其原因不是因為技術(shù)不通用,而是說真正把一個應(yīng)用落地,我覺得自動駕駛是機(jī)器人領(lǐng)域最好落地的東西,如果說這個做不到,那就無從談起。而且具身智能需要蜇伏更長的時間。
大家會覺得在中國做技術(shù),這恐怕是一個很難的點,就是一旦一個技術(shù)要做到三五年的時間,很難有一個團(tuán)隊在一個地方能夠容忍他做那么久把事情做出來。比如說大的互聯(lián)網(wǎng)公司錢很多,但是不要說三年了,三個月不出東西老板就要找你了。對于我來說我也很累,我今天給投資人講這個,下一次講什么?過一年之后我跟投資人說我沒有進(jìn)展,你覺得投資人會怎么想你?所以都有這個壓力。所以就需要找真正懂這件事的合作伙伴。
Q:現(xiàn)在有一個說法是具身智能這波浪潮,基本上是自動駕駛失敗者聯(lián)盟,您同意這個說法嗎?
樓天城:首先創(chuàng)業(yè)失敗是很正常的事,所以犯不著叫失敗者聯(lián)盟,創(chuàng)業(yè)有一些磕磕碰碰很正常。具身智能今天的狀態(tài)和自動駕駛2018年的狀態(tài)非常像,我非常懷念那個時候,做做Demo就行了,但是我也知道到2019年會發(fā)生什么,那也就是自動駕駛接下來一年發(fā)生的事情。
自動駕駛有一個很重要的紅利就是我們蜇伏的那幾年剛好是疫情,疫情的時候大家心態(tài)比較平比較淡一些,幫助團(tuán)隊撐過了那段真空期。否則在快速發(fā)展的時候,今天說人家做了什么,你怎么不做?我說稍等,但是這個等可能就撐不住了。不說別的,我的很多同事,他可以自己相信這件事,他家人也得相信。比如說他老婆問他說你這個有什么進(jìn)展?看不出來,車還是這樣。
Q:越懂技術(shù)的人是不是對未來發(fā)展越悲觀?
樓天城:首先這和懂技術(shù)的態(tài)度不太一樣,做技術(shù)的人往往會對結(jié)果更敏感,對過程更淡化。但是我先說人工智能的威脅。比如說今天上午介紹過人工智能的分級,人工智能的第一級已經(jīng)過去了,第二級是Copilot,就是今天的DeepSeek、豆包,它是一種輔助工具,幫助你干事,但是決策還是要自己做。比如說今天的材料很多問題就是DeepSeek給我推薦,但是還是要我來寫究竟應(yīng)該怎么做。第三級就是L4 Robotaxi,就是它來負(fù)責(zé),不用人管,它自己解決,叫Agent,具身智能在AI的分級叫Agent。下面一級的AI叫innovation AI,就是AI會自己創(chuàng)造發(fā)明,這是一個極其可怕的事情,就是AI做到這里已經(jīng)很可怕了,AI會自己創(chuàng)新了,你就不知道他要干什么東西了,AI的威脅是源于這個。innovation AI再往后是AI會自己建立體系了,那是真正要開啟硅基生命了。其實AI不是前兩級有威脅,而是后兩級有。我覺得馬斯克看到了所以他失望,但是不是今天這些。
Q:所以您是認(rèn)可AI的威脅?
樓天城:簡單來說,我覺得可能人是攔不住的。
Q:所以還是悲觀的。
樓天城:這不算悲觀,這就是時代發(fā)展。說的更夸張點就是優(yōu)勝劣汰。
Q:AGI這兩年有比較好的商業(yè)模式嗎?能快速實現(xiàn)嗎?
樓天城:AGI就是通用人工智能,我覺得它會經(jīng)歷自動駕駛一樣的真空期,如何過真空期還要打一個問號,什么叫真空期呢?就是今天具身智能做很多展示,拍很多視頻,看著很炫酷,今年OK,那明年呢?明年繼續(xù)拍,后年呢?它總會到一個大家對于視頻,對于demo麻木的狀態(tài),去做到下一個節(jié)點,也就是真正商業(yè)化,需要考慮很多長尾的問題,這個過程中有很長時間的一個真空期:
這三年時間對外展示不了任何進(jìn)展,這個時候有多少公司能撐過去?非常困難。然后才是應(yīng)用的價值,大家愿不愿意為它買單,這是另一回事,所以這兩個挑戰(zhàn)都是自動駕駛曾經(jīng)遭遇過的,因為我經(jīng)歷過,我知道有多困難,AGI肯定也是躲不掉的。
談輔助駕駛:L2永遠(yuǎn)無法升維成L4
Q:L2永遠(yuǎn)無法升維成L4?
樓天城:簡單來說“是”。
剛剛說了模仿和強(qiáng)化其實就是一個原因,但是這是技術(shù)怎么做,我還是從產(chǎn)品表現(xiàn)來說。
比如車位到車位,是一種產(chǎn)品的形式,技術(shù)上終究會有一些時候要讓人來介入。
換句話說,安全有一個及格線,L4的安全及格線很好說,你就可以認(rèn)為是一個滿分線,當(dāng)然滿分線不是無窮大,因為我不撞別人別人會撞我。
我那天在路邊停了兩分鐘,還有一個車就把我撞了,去掉這種跟自己無關(guān)事件之后的事故,我們叫滿分線,因為滿分不可能被超越了,及格線基本就是滿分線,L4真正的挑戰(zhàn)是在這里。
L2還差得非常遠(yuǎn),而且這幾年大家講的都是平權(quán),都是成本,都沒有再繼續(xù)優(yōu)化這件事情。所以它其實根本過不了L4及格線,而且會越差越遠(yuǎn)。
究其原因是背后的做法,回到我之前舉的長跑、短跑的例子,你腿部肌肉都不一樣,你短跑跑得越好,你長跑越難成為專業(yè)長跑選手,博爾特永遠(yuǎn)不會成為專業(yè)長跑選手。
Q:車企卷到最后發(fā)現(xiàn)L2無路可走,會不會轉(zhuǎn)向L4?
樓天城:任何企業(yè)都可以某一天突然決定開始做L4,任何企業(yè)都可以。但是單從競爭角度來說,IT公司更擅長。
因為做L4需要很多東西,比如說世界模型,本質(zhì)上是需要AI的人才和對算力的把握,這些是IT公司更擅長的事情。如果說這些車廠他卷不動L2要做L4的話,他需要從頭把L4公司走過的路都走一遍。并不是說因為他有一個什么基礎(chǔ)就可以走得更快,因為我剛剛說了,世界模型是一個虛擬世界,真實數(shù)據(jù)不是干這個的,也不是用來模仿的,所以那些東西沒有什么直接的幫助。所以我的觀點是任何家都可以做,IT背景的公司可以做得更快。
Q:假設(shè)車企放棄L2上和供應(yīng)商合作,然后來找小馬合作,那小馬的L4有沒有下放的可能?
樓天城:首先小馬已經(jīng)和北汽和廣汽合作了。如果是說放到量產(chǎn)車上賣給個人,這是一個非常有價值的市場,但我覺得這個技術(shù)上需要更長的時間。Robotaxi是一個,專門控制區(qū)域,專門運營,天天車自己看護(hù)的業(yè)務(wù),還有遠(yuǎn)程客服,到今天也就只做了幾個城市,在這幾個城市Robotaxi夠了。但是賣給個人是要開全天下的,這個難度不可同日而語。
Q:L3是存在的嗎?
樓天城:首先來說L2,L2基本上非常明顯導(dǎo)向成本優(yōu)化了,都在講平權(quán)了,再回到L3,如果想實現(xiàn)比L2更高的功能,確實要考慮不再依賴人,這是對的。但是基于L3本身,還是有很多做法上延續(xù)了L2的影子,讓大家覺得很像L2延續(xù),但其實大家忽視了非常多L2跟L3不同的地方,關(guān)于這一點,有一些太反直覺的東西,之后我們找更合適的場合跟大家分享。
我們仔細(xì)思考過L3這件事,但是我覺得現(xiàn)象級L3的思考都還是有非常重的L2的影子,同時大家對L4的理解也有偏差。
Q:如何理解L4是有技術(shù)壁壘的?
樓天城:這個壁壘不是說不能做,只是要從頭開始做,你要重新再做五年才能達(dá)到這個狀態(tài),L2不會做著做著突然變成L4。這和長跑、短跑還不太一樣,人不能把肌肉卸了,不能返老還童到年輕的時候再來一遍,但是如果說能再來一遍,其實可以變成另外一個運動員。
Q:如果把L4下放到輔助駕駛的話成本會很高?
樓天城:不僅是成本,還有另外一個很大的問題。舉個例子,其實人開車開得并不好,我個人是一個圍棋愛好者,當(dāng)年AI就是由AlphaGo這個故事開始的,現(xiàn)在已經(jīng)叫Master了,我看Master下棋我看不懂的話,我第一反應(yīng)是我太蠢了,我沒看懂它下棋,我水平不夠。
今天我們的L4車上已經(jīng)出現(xiàn)這個情況了,很多人覺得你車怎么不這么開,我說是你開得太差了。但是L2不能這樣,因為L2的話,用戶絕不會覺得是他自己開得差,因為助手就是要為主人幫好忙。所以L4越做這個東西,這方面會越嚴(yán)重。
就好像L2版的AlphaGo,我推薦你下棋怎么下,但是每一步一定要在你的理解范圍之內(nèi),所以它變得越智能之后你反而變得越不理解了,那就是一個不好的情況,雖然很少有這個問題,但是確實是這樣的。
所以我三個月前說L2做得越好,距離L4越遠(yuǎn),其實反面也是的。
Q:你在國內(nèi)有體驗過其他家的智能輔助駕駛嗎?
樓天城:經(jīng)常體驗一下大家的智駕的,但我非常清楚智駕的極限,我可不會在智駕里睡覺或者干別的,我個人是各種新能源車都會去嘗試。
- 蔚來新ES8售價降低是因為減配?李斌回應(yīng)了2025-08-22
- 31萬!蔚來開賣國產(chǎn)最大純電SUV,網(wǎng)友排隊給CEO李斌道歉2025-08-22
- 行業(yè)首個AI座艙:能嘮嗑會辦事兒,吉利銀河M9率先搭載,杭州出品2025-08-21
- 20個要點,看完李想4小時超長訪談2025-08-20