百度最新無人車技術(shù)低調(diào)發(fā)布!6位大牛,人均至少T11
“CTO級大牛不稀缺,也就百八十個吧”
賈浩楠 發(fā)自 副駕寺
智能車參考 | 公眾號 AI4Auto
“CTO級無人車大牛不稀缺,我們這也就百八十個吧”。
可能只有百度Apollo有資本這樣說。
而且也許也只有Apollo有膽量這么做:
年初一語,年末兌現(xiàn)。
百度無人車技術(shù)天團(tuán)集體現(xiàn)身,從軟件、硬件、系統(tǒng)全方位分享展示自動駕駛從技術(shù)到商業(yè)的進(jìn)展。
這些以往在幕后的大牛都是誰?他們分享了哪些東西?
如何從Apollo這面“鏡子”,一窺無人車發(fā)展的最新態(tài)勢?
(發(fā)言在未改變原意的基礎(chǔ)上,僅做流暢性編輯)
百度如何設(shè)計自動駕駛技術(shù)體系?
百度自動駕駛首席架構(gòu)師陳競凱,從整體圖景上分析了Apollo自動駕駛系統(tǒng)的核心原則和架構(gòu)。
自動駕駛系統(tǒng)應(yīng)該如何設(shè)計?一直都有兩個思路:一個是偏學(xué)術(shù)的,傾向于統(tǒng)一建模,端到端的解決問題;另外一個思路是偏向工程的,去拆分系統(tǒng),分治突破。
端到端的建模非常的簡潔優(yōu)美,從長遠(yuǎn)來看,也是一個非常有前途的方向。
在這種思路下,在其他的領(lǐng)域里面也看到了一些不錯的進(jìn)展,比如說技術(shù)模型在NLP領(lǐng)域里面已經(jīng)取得了統(tǒng)治性的地位。在圖像領(lǐng)域,大模型也給我們帶來很多的驚喜。同樣,我們對于這種端到端的大模型的解決方案, 在自動駕駛系統(tǒng)的發(fā)展也充滿了期待。
這個方案的問題在于存在很大的不確定性。我們不能確定它究竟何時成熟,是兩年還是十年,這是一個問題。
所以我們目前的主要的思路還是沿著工程化的路線推進(jìn),同時也沒有放棄我們在端到端方面上的一些探索。探索的過程中間,也會把階段性的成果應(yīng)用到一些路線上。
車載系統(tǒng)大體分成四個部分:地圖、感知、預(yù)測決策、規(guī)劃控制。
地圖系統(tǒng)不管是離線或在線地圖,總是自動駕駛系統(tǒng)的底層表達(dá)。離線地圖是超視距整體性的感知,它在自動駕駛系統(tǒng)中發(fā)揮著重要的作用。
離線地圖制作成本是不是很高?會不會成為障礙?在實(shí)踐過程中間我們發(fā)現(xiàn),離線地圖并不是一個高成本的障礙,反而是前進(jìn)的助力。
問題在于地圖的實(shí)時性才是它的問題,而不是它的更新率或者它的成本。
目前的實(shí)踐中,車端實(shí)時生產(chǎn)的地圖和規(guī)?;a(chǎn)的地圖其實(shí)上還是有質(zhì)量上的一些差距。需要通過我們自動駕駛策略去適應(yīng)這兩種地圖差異。但這種適應(yīng)對自動駕駛能力來說是有折損的。
所以我們認(rèn)為,在目前的條件下,一個規(guī)?;a(chǎn)的高精地圖還是不可或缺的,實(shí)時地圖更多的會被我們用在應(yīng)對現(xiàn)實(shí)世界的變更,這時候我們會把自動駕駛的策略調(diào)整到一個更加安全謹(jǐn)慎的方式。
感知系統(tǒng)目前在整個業(yè)界的發(fā)展思路還是比較統(tǒng)一的,基本上是一個數(shù)據(jù)加模型驅(qū)動的系統(tǒng)。
主要的分歧在于傳感器的配置。
我們的判斷是這樣的:應(yīng)該去充分發(fā)揮各個傳感器的能力,先要把事情做成,然后再去追求更好、更低成本。具體實(shí)踐中從后融合的方案轉(zhuǎn)向前融合的方案。
前融合使得我們能夠充分地發(fā)揮各個傳感器的優(yōu)勢。另外,我們也會充分的利用百度大模型技術(shù)方面的積累提升感知能力。
預(yù)測決策系統(tǒng)直接面對復(fù)雜外部環(huán)境的一個非常重要的部分。
百度最初的自動駕駛系統(tǒng),預(yù)測和決策是分開的。預(yù)測帶有自標(biāo)注的任務(wù),一直都是數(shù)據(jù)驅(qū)動的,決策、規(guī)劃、控制,當(dāng)初沿用的都是一些偏規(guī)則的傳統(tǒng)方案。
基于規(guī)則的方案,通常是把遇到的問題劃分成各種場景,在每個場景下,針對不同出現(xiàn)的問題,再做相應(yīng)的處理。為了不讓各個規(guī)則之間發(fā)生沖突,通常會仔細(xì)地限定每個規(guī)則的作用范圍,一層一層地拆分下去,如果做得好的話,我們會形成一個類似樹形的拆分結(jié)構(gòu);如果處理得不好的話,就會變成一個補(bǔ)丁摞補(bǔ)丁的系統(tǒng)。
上述規(guī)則系統(tǒng)在最初的時候,可以最大化人類的經(jīng)驗(yàn)和知識,迅速地提升自動駕駛能力,但是隨著時間的推移,有兩個問題不可避免。一是策略分叉;二是面對城市擴(kuò)展、場景變化的時候,需要調(diào)整規(guī)則去適應(yīng)。
因此,百度認(rèn)為學(xué)習(xí)性的PNC是實(shí)現(xiàn)全無人的一個必由之路。陳競凱表示:“預(yù)測和決策其實(shí)是一個問題的兩面,預(yù)測是決策的自我預(yù)言實(shí)現(xiàn)。所以我們構(gòu)造了一個預(yù)測和決策的多任務(wù)系統(tǒng),聯(lián)合處理這個問題。我們對信號燈、道路元素等都做了一些建模和交互的處理,最后形成預(yù)測和決策的一個結(jié)果。”
百度的最終目標(biāo)也不是用學(xué)習(xí)系統(tǒng)去完全替代規(guī)則系統(tǒng)。陳競凱稱,一方面因?yàn)榻煌ㄏ到y(tǒng)本來就是一個靠規(guī)則約束的系統(tǒng);另一方面也需要規(guī)則去守護(hù)最后的底線。
仿真系統(tǒng)方面,百度追求的是做一個有用的仿真系統(tǒng),要能夠滿足對于問題迭代的需求。為此,其做了大量工作。如Worldsim系統(tǒng),使得能夠批量地去構(gòu)造大量的場景,去驗(yàn)證在各種場景下的綜合能力;L2W系統(tǒng),能夠精確地復(fù)現(xiàn)道路的場景,幫助其去分析和驗(yàn)證路上的問題。
另外,從一個城市向另一個城市遷移過程中,數(shù)據(jù)統(tǒng)計、數(shù)據(jù)分布是有變化的,這時候要求我們的自動駕駛能力、策略要做一些細(xì)微的調(diào)整,整體的場景庫也對遷移過程提供很多保障。
仿真系統(tǒng)在自動駕駛技術(shù)迭代的過程中間發(fā)揮了非常重要作用,是技術(shù)能力提升的重要支撐。
百度自動駕駛地圖,有什么不同?
百度人工智能技術(shù)委員會主席黃際洲介紹了百度自動駕駛地圖的相關(guān)進(jìn)展。
近期有一部分L2智能駕駛在提”重感知,輕地圖”這一主張。這主要原因是很難翻越高精地圖面臨的“三座大山”,即資質(zhì)壁壘、自研壁壘和供給稀缺。我們的觀點(diǎn)是輕成本、重體驗(yàn)的地圖對自動駕駛至關(guān)重要。
對于L4的自動駕駛而言,要達(dá)到99.99%以上的成功率,高精地圖更是其中必不可少的核心能力之一,并要做到“把成本做輕、把體驗(yàn)做重”。
“輕成本”主要從自動化數(shù)據(jù)融合和地圖自動化標(biāo)注兩方面展開。
自動化數(shù)據(jù)融合,是高精地圖大規(guī)模生產(chǎn)的重要基礎(chǔ)和核心能力,其目標(biāo)是全自動地將多次采集到的傳感器的數(shù)據(jù),比如說激光點(diǎn)云或者道路的影像,在統(tǒng)一的坐標(biāo)系下進(jìn)行融合,主要的挑戰(zhàn)就在于這個融合的絕對或者是相對的精度要達(dá)到厘米級。
為了實(shí)現(xiàn)上述目標(biāo),百度通常先將這些數(shù)據(jù)按照塊或者道路進(jìn)行劃分,在每個分塊里首先進(jìn)行數(shù)據(jù)的融合,然后再對塊之間進(jìn)行高精要素的串線和幾何的調(diào)整,以增強(qiáng)塊間高精要素的連續(xù)性。
如何保證上述所得到的基礎(chǔ)數(shù)據(jù)都是完全對齊的?百度的解決方案是按照數(shù)據(jù)空間分布劃分去構(gòu)建多層級的圖結(jié)構(gòu),確保全圖的精度是一致的。這其中主要的技術(shù)創(chuàng)新有三個方面:第一是多層級的圖優(yōu)化;第二點(diǎn)是場景化關(guān)聯(lián)和匹配;第三是基于學(xué)習(xí)的匹配算法。
地圖自動化標(biāo)注,指的是基于點(diǎn)云和圖像數(shù)據(jù)自動生成高精地圖的過程,是顯著降本增效的核心驅(qū)動。
為了達(dá)到高自動化率,百度在要素識別、矢量提取、自動建模等關(guān)鍵步驟上都進(jìn)行技術(shù)創(chuàng)新。
其中,要素識別上,采用的是多層級的點(diǎn)云識別方式,識別的結(jié)果要遠(yuǎn)遠(yuǎn)優(yōu)于一次識別的結(jié)果;矢量提取上,對點(diǎn)云和圖像中提取的矢量要素進(jìn)行后融合,保證要素的高精度和高召回;自動建模上,基于車道級的拓?fù)淠0暹M(jìn)行矢量要素匹配,極大地提高拓?fù)涞纳梢约败嚨谰€串接的準(zhǔn)確性。
重體驗(yàn)部分,則主要包括安全、舒適和高效三個方面。
安全方面,百度采用的方案是融合車端感知數(shù)據(jù)與多源地圖來實(shí)時地生成在線地圖;舒適方面,百度引入駕駛知識圖譜來實(shí)現(xiàn);高效方面,百度解決方案是,基于百度智能交通以及百度地圖,構(gòu)建交通大腦,賦能自動駕駛出行。
此外,為了保證更好的自動駕駛體驗(yàn),百度提出了Apollo自動駕駛地圖,主要分為四層:
第一層是靜態(tài)層,這一層也是傳統(tǒng)高精地圖內(nèi)容,包括車道級的數(shù)據(jù)、拓?fù)鋽?shù)據(jù)以及輔助車輛定位的定位數(shù)據(jù)。
第二層是動態(tài)層,包括實(shí)時的交通的事件、實(shí)時的交通的態(tài)勢以及實(shí)時的環(huán)境的變化,這需要依賴于海量的時空數(shù)據(jù)以及車路協(xié)同等。
第三層是知識層,最核心的是駕駛知識圖譜,以及與自動駕駛體驗(yàn)強(qiáng)相關(guān)的安全駕駛、舒適駕駛行為與知識等。
第四層是駕駛層,知識與駕駛策略的融合,實(shí)現(xiàn)深度融合地圖和感知、決策、控制應(yīng)用;而數(shù)據(jù)實(shí)時感知的融合,數(shù)據(jù)閉環(huán)還有實(shí)時更新,實(shí)現(xiàn)了高鮮度的地圖的數(shù)據(jù)。
Apollo自動駕駛地圖已經(jīng)實(shí)現(xiàn)了規(guī)模化的應(yīng)用:
首先,蘿卜快跑快速發(fā)展,累計訂單量達(dá)到140萬單;其次,提供智能駕駛?cè)珗鼍绑w驗(yàn)ANP領(lǐng)航輔助駕駛解決方案;最后,百度地圖率先推出了城市車道級導(dǎo)航、車位級導(dǎo)航、智能紅綠燈等自動駕駛級導(dǎo)航產(chǎn)品功能。
感知系統(tǒng):大模型成核心驅(qū)動力
百度計算機(jī)視覺首席架構(gòu)師王井東,介紹了百度自動駕駛感知系統(tǒng)的情況。
百度自動駕駛感知經(jīng)歷了兩代。
感知1.0的百度經(jīng)過了三個階段:第一階段主要依賴激光雷達(dá)點(diǎn)云感知,輔助紅綠燈的識別,同時利用了毫米波目標(biāo)陣列;第二階段增加了環(huán)視圖像的感知,與激光雷達(dá)點(diǎn)云感知形成兩層感知融合,提升了識別效果;第三階段,自研了毫米波點(diǎn)云感知算法,形成了三層感知的融合。
這些多模感知實(shí)際上用的是后融合方案,它通常需要規(guī)則的方法,是不可學(xué)習(xí)的,因此相對來說泛化能力不夠。
感知2.0主要部分是多模態(tài)前融合端到端的方案,在點(diǎn)云和圖像的表征層次上進(jìn)行融合。與此同時,遠(yuǎn)視距的視覺感知,通常在200米以上視覺的感知效果相對比較好;近距離采用了魚眼感知,從魚眼感知實(shí)現(xiàn)了freespace的預(yù)測。
感知環(huán)境,需要豐富和高質(zhì)量的數(shù)據(jù),基于此,百度感知2.0還利用大模型進(jìn)行數(shù)據(jù)挖掘和數(shù)據(jù)的自動標(biāo)注。
而在自動駕駛感知里往往會遇到一些挑戰(zhàn)。一是遠(yuǎn)距離的視覺感知問題;二是在點(diǎn)云空間去做3D的標(biāo)注非常困難;三是長尾數(shù)據(jù)挖掘問題,包括少見的車型、各種形態(tài)、各種姿態(tài)行人,以及低矮物體、交通、施工元素等。
如何解決上述三種挑戰(zhàn)?百度的方法是利用大模型技術(shù),來提升自動駕駛感知能力。
首先利用文心大模型自動駕駛感知的技術(shù),來提升車載小模型的感知能力。同時在數(shù)據(jù)方面,利用了文心大模型圖像弱監(jiān)督預(yù)訓(xùn)練模型來挖掘長尾數(shù)據(jù),提升模型訓(xùn)練效果。
在自動駕駛感知模型訓(xùn)練方面,百度采用的是半監(jiān)督方法,充分利用2D標(biāo)注和沒有3D標(biāo)注數(shù)據(jù)。
具體方法是采用迭代的自訓(xùn)練方案。首先在既有2D又有3D的訓(xùn)練數(shù)據(jù)上,去訓(xùn)練一個感知大模型出來,然后給沒有3D標(biāo)注數(shù)據(jù)打上3D偽標(biāo)注。再繼續(xù)訓(xùn)練一個感知大模型出來,如此迭代,逐步把感知大模型效果提升,同時也使得3D的尾標(biāo)注的效果越來越好。
上述感知大模型不僅用于視覺,也用于點(diǎn)云,也用于多模態(tài)端到端方案。
大模型已經(jīng)成為自動駕駛能力提升的核心驅(qū)動力。
Apollo數(shù)據(jù)閉環(huán)
百度自動駕駛專家李昂,分享了百度Apollo在數(shù)據(jù)閉環(huán)方面的思考。
隨著自動駕駛的規(guī)?;涞兀诔鞘械缆分行旭偟臒o人駕駛車會不斷遇到新問題和意想不到的新場景。自動駕駛需要持續(xù)學(xué)習(xí),而數(shù)據(jù)閉環(huán)是其實(shí)現(xiàn)持續(xù)學(xué)習(xí)能力的重要基礎(chǔ)架構(gòu)。
面對大規(guī)模數(shù)據(jù)隨之帶來的存儲、標(biāo)注以及計算量壓力,百度Apollo提出了「高提純、高消化」的數(shù)據(jù)閉環(huán)設(shè)計思路。數(shù)據(jù)提純路徑利用車端小模型和云端大模型,實(shí)現(xiàn)高效率數(shù)據(jù)挖掘和自動化標(biāo)注。
數(shù)據(jù)規(guī)模不是唯一標(biāo)準(zhǔn),數(shù)據(jù)純度也是重要考量;數(shù)據(jù)純度即為單位數(shù)據(jù)的信息量,數(shù)據(jù)挖掘與標(biāo)注是提高數(shù)據(jù)純度的兩個手段。百度正是根據(jù)這樣的思路,設(shè)計了自動駕駛的數(shù)據(jù)提純通路。
而且,百度Apollo發(fā)現(xiàn),數(shù)據(jù)提純效率很大程度由推理引擎的效率決定,而推理引擎效率又可以分為數(shù)據(jù)讀取速度以及模型的推理和計算速度,后者可以通過分布式方式來提升。
為此,Apollo與百度飛槳團(tuán)隊(duì)合作,將百度自研的PaddleFlow數(shù)據(jù)緩存的基礎(chǔ)架構(gòu)集成引入數(shù)據(jù)閉環(huán)平臺,使推理引擎的數(shù)據(jù)讀取效率獲得10倍以上的提升。
此外,全量數(shù)據(jù)回傳無法支撐規(guī)?;?,數(shù)據(jù)提純的呈現(xiàn)方式實(shí)際上是云端到車端模型和策略的雙重降維。
獲取高純度的數(shù)據(jù)后,另一個重要的問題就是如何高效率、高質(zhì)量地消化這些數(shù)據(jù),將其轉(zhuǎn)化為車輛的自動駕駛能力。數(shù)據(jù)分布不斷變化、多個模塊相互關(guān)聯(lián)、自動化效率,是無人駕駛系統(tǒng)的復(fù)雜性給數(shù)據(jù)消化帶來的三個挑戰(zhàn)。
為應(yīng)對上述問題,百度是通過數(shù)據(jù)、模型、指標(biāo)的集中式、端到端整合,來實(shí)現(xiàn)高質(zhì)量的數(shù)據(jù)消化,其基于持續(xù)學(xué)習(xí)與AutoML概念在數(shù)據(jù)閉環(huán)里設(shè)計了一套自動化訓(xùn)練引擎,并做了多模塊聯(lián)合優(yōu)化以及數(shù)據(jù)分布方面的一系列工作。
以行為預(yù)測為例,其實(shí)可以通過問三個問題來映射所有的數(shù)據(jù)到不同的場景,而這三個問題,可以分別是主車的行為、障礙物的行為,以及障礙物的類型。當(dāng)對每個場景的數(shù)據(jù)進(jìn)行統(tǒng)計,就可以最終獲得整個數(shù)據(jù)集所對應(yīng)的數(shù)據(jù)分布描述。
總結(jié)來看,百度提出了以高提純、高消化為核心驅(qū)動力的數(shù)據(jù)閉環(huán)的設(shè)計思路。高提純通過小模型和大模型的車云協(xié)同,實(shí)現(xiàn)高效的數(shù)據(jù)挖掘和自動化標(biāo)注;高消化通過數(shù)據(jù)、模型、指標(biāo)的集中式、端到端整合來實(shí)現(xiàn)。
除此之外,訓(xùn)練、推理以及數(shù)據(jù)分布是在數(shù)據(jù)消化中可以形成有效的一個反饋機(jī)制,進(jìn)一步提升數(shù)據(jù)消化的整體效率和效果。
百度造芯,如何支持自動駕駛?
昆侖芯科技CEO歐陽劍,介紹了百度在自動駕駛芯片方面的布局和進(jìn)展。
昆侖芯已經(jīng)量產(chǎn)了兩代,第三代、第四代芯片在研發(fā)過程中。
其中,第一代AI芯片采用14納米的工藝、2.5D的封裝,這款芯片剛量產(chǎn)就在百度數(shù)據(jù)中心里部署了超過2萬片;第二代AI芯片為7納米工藝,采用了XPU第二代的架構(gòu)。截至2022年,第二代昆侖芯已經(jīng)在數(shù)據(jù)中心、工業(yè)、自動駕駛等領(lǐng)域進(jìn)行了大規(guī)模的部署和落地。
昆侖芯產(chǎn)品有三點(diǎn)優(yōu)勢:第一,昆侖芯是為數(shù)不多能夠在真實(shí)系統(tǒng)上大規(guī)模部署和應(yīng)用的AI芯片;第二,其生態(tài)完備性是國內(nèi)做的最好的,跟國內(nèi)所有的處理器、操作系統(tǒng)都進(jìn)行了適配;第三,它靈活易用,提供的SDK,給予開發(fā)者非常低的學(xué)習(xí)門檻和非常快的迭代效率。
截至目前,昆侖芯已經(jīng)在車路協(xié)同、物流系統(tǒng)、智慧交通等與交通相關(guān)領(lǐng)域落地。具體到自動駕駛方面,昆侖芯二代芯片已經(jīng)在百度RoboTaxi系統(tǒng)上做了完全適配。
我們用昆侖芯二代芯片跟業(yè)界最主流顯卡做了性能對比,性能優(yōu)于這個顯卡,而功耗只有不到它的一半。我們也跟主流的AI加速卡做了性能對比,是它的兩倍以上,同時我們也做了一個端到端的測試,在不到它的一半的功耗之下,取得了比較領(lǐng)先的性能。
除了AI的模型,在一些控制規(guī)劃模型上,昆侖芯也取得相對一些顯卡更好的性能效果。
不止與RoboTaxi駕駛系統(tǒng)適配,昆侖芯也在一些仿真系統(tǒng)和在路測系統(tǒng)上做了測試,效果達(dá)到客戶的要求。
今天的高階自動駕駛計算系統(tǒng),與數(shù)據(jù)中心系統(tǒng)有非常相似的地方,它的算法非常多元,迭代速度非常的快,復(fù)雜度越來越高。這對芯片的要求也越來越高,它一定是要求非常好編程、好移植,否則那些先進(jìn)的算法沒法很快迭代到車上來使用,系統(tǒng)也就沒法保證領(lǐng)先性。此外,穩(wěn)定性也要非常好這不僅包括硬件,還包括整個軟件,乃至整個系統(tǒng)。
在車載計算系統(tǒng)上,過去有觀點(diǎn)認(rèn)為它是相對封閉的系統(tǒng),要做非常深度的軟件和硬件定制。五六年前在云端AI芯片上也一樣有人在講這個觀點(diǎn)。但今天回頭來看,過去五六年提上述觀點(diǎn)的AI芯片公司全部已經(jīng)不在市場里。
因此,未來車載計算系統(tǒng)一定是相對開放,能夠給用戶提供高算力、高通用,可以滿足客戶個性化需求的計算系統(tǒng)。
未來,昆侖芯也會考慮面向高階自動駕駛系統(tǒng)定制車規(guī)高性能的SOC。
商業(yè)落地:L4降維真的能走通?
百度智能駕駛事業(yè)群組技術(shù)委員會主席王亮,介紹了Apollo在L2、L4方向的商業(yè)化進(jìn)展,以及如和將兩種不同的技術(shù)棧,統(tǒng)一在一個數(shù)據(jù)閉環(huán)之中。
百度L4自動駕駛運(yùn)營測試?yán)锍汤塾嫵^4000萬公里;蘿卜快跑在多個城市開啟對市民的運(yùn)營,累計訂單超過140 萬;今年8月百度在武漢和重慶國內(nèi)首次實(shí)現(xiàn)“全無人商業(yè)化運(yùn)營”,這是中國自動駕駛歷史上的重要里程碑。
輔助駕駛方面,目前國內(nèi)市場智駕產(chǎn)品以高速領(lǐng)航輔助駕駛和記憶泊車為主。有數(shù)據(jù)顯示,中國居民日常出行中,城市通勤占比在70%以上,有城市自動駕駛能力的L2+產(chǎn)品將是未來市場的主流趨勢。
百度將在2023年面向市場推出一款L2+領(lǐng)航輔助駕駛旗艦產(chǎn)品ANP3.0,將支持復(fù)雜城市道路場景,并且銜接融通高速和泊車場景。
智能駕駛計算單元,采用的是百度自主研發(fā)的智駕域控制器,搭載了2顆英偉達(dá)Orin-x芯片,AI算力為500 TOPS;傳感器方面,部分搭載了800萬像素高清攝像頭,視距可以達(dá)到400米。同時搭配半固態(tài)激光雷達(dá),每秒產(chǎn)生百萬以上的點(diǎn)云。
ANP3.0以視覺方案為主,同時系統(tǒng)也搭配激光雷達(dá)。ANP3.0視覺、激光雷達(dá)兩套系統(tǒng)獨(dú)立運(yùn)作、低耦合。
ANP3.0視覺感知技術(shù)始于2019年啟動的Apollo Lite項(xiàng)目,采用了“單目感知”加“環(huán)視后融合”的技術(shù)框架。
今年百度對視覺感知框架進(jìn)行了升級,推出了第二代純視覺感知系統(tǒng)Lite++。
Lite++通過Transformer把前視特征轉(zhuǎn)到BEV,在特征層面對相機(jī)觀測進(jìn)行前融合后,直接輸出三維感知結(jié)果,并融合時序特征實(shí)現(xiàn)運(yùn)動估計Learning化;模型設(shè)計層面,基于transformer結(jié)構(gòu),實(shí)現(xiàn)時空特征融合。
在空間融合階段將位置編碼變換從全局BEV空間轉(zhuǎn)換到局部相機(jī)坐標(biāo)系,消除相機(jī)內(nèi)外參差異帶來的差異。時序上盡可能多的融合主車運(yùn)動與多幀信息,提升障礙物檢測穩(wěn)定性。同時基于時序特征,障礙物的速度、意圖、未來軌跡預(yù)測等關(guān)鍵信息都可以進(jìn)行端到端的輸出。
此外,Lite++對后處理的多相機(jī)融合依賴更低,算力需求更輕,泛化性更好。
ANP3.0的目標(biāo)是讓自動駕駛能夠隨時隨地的開啟,技術(shù)路徑是用好百度多年在高精地圖領(lǐng)域積累的優(yōu)勢;結(jié)合百度對自動駕駛算法的理解,定義了為智駕規(guī)模化泛化而生的“輕量化”自動駕駛地圖。在降低地圖制作成本的同時,通過建設(shè)在線地圖學(xué)習(xí)能力,用算法應(yīng)對現(xiàn)實(shí)變更、冗余地圖的標(biāo)注問題。
目前ANP3.0已進(jìn)入北上廣深多地泛化測試階段,將在2023年夏天隨著第一個客戶車型上市與大家見面。
隨著L4規(guī)?;虡I(yè)試運(yùn)營的到來和高級輔助駕駛產(chǎn)品的普及,百度如何利用L2+產(chǎn)品反哺L4技術(shù),加速Robotaxi的規(guī)模化商用?
實(shí)現(xiàn)無人駕駛商業(yè)化的最佳路徑是,前期在限定區(qū)域?qū)崿F(xiàn)技術(shù)積累,通過技術(shù)降維和L4數(shù)據(jù),為L2+產(chǎn)品做熱啟動;更長期看,利用L2的規(guī)模優(yōu)勢,提前收集L4泛化所需要儲備的長尾問題。這也正是百度目前所采取的技術(shù)路徑。
在王亮看來,百度領(lǐng)航輔助駕駛產(chǎn)品未來3-5年搭載量有望突破百萬。百萬量級行駛在城市道路上的L2+乘用車,可有效地收集和補(bǔ)充長尾問題,加速L4無人駕駛系統(tǒng)在更大范圍運(yùn)營,數(shù)據(jù)壁壘也將成為百度的L4技術(shù)護(hù)城河。
2025年L2+產(chǎn)品將跨越消費(fèi)者鴻溝,L4的商業(yè)模式也將在局部區(qū)域和城市實(shí)現(xiàn)跑通,兩者的緊密配合將正式開啟,二者的結(jié)合將比任何單一路徑都更快速、更高效地實(shí)現(xiàn)自動駕駛。
L4技術(shù)降維L2+產(chǎn)品已經(jīng)走通。
2023年后,ANP3.0數(shù)據(jù)反哺L4的規(guī)劃也在進(jìn)行中,并已經(jīng)完成了前期的技術(shù)布局,隨著智駕ANP3.0產(chǎn)品上市,后續(xù)L4和L2+技術(shù)的協(xié)同飛輪將運(yùn)轉(zhuǎn)起來,形成正反饋。
百度L4、L2+技術(shù)和定義描述是:
一方為另一方提供有利于生存的幫助,同時也獲得對方的幫助,兩種技術(shù)方案和產(chǎn)品形態(tài)共存,相互依賴,彼此有利,此為“共生”。
亮相的百度無人車技術(shù)大牛,都是什么來頭?
以上,就是剛剛結(jié)束的Apollo開放日亮相的所有技術(shù)大牛的分享內(nèi)容。
總體來看,百度把6個之前多在幕后的一線技術(shù)研發(fā)負(fù)責(zé)人推向臺前,詳細(xì)介紹描繪了Apollo自動駕駛的整體架構(gòu)、子系統(tǒng)優(yōu)勢特征,以及商業(yè)化進(jìn)展。
Apollo架構(gòu)體系,包括地圖、感知、數(shù)據(jù)閉環(huán)等等要素,是任何自動駕駛公司都繞不過去的必經(jīng)之路。
但百度又能依托集團(tuán)長時間耕耘其他AI領(lǐng)域的能力,給每一個技術(shù)板塊都賦予獨(dú)特優(yōu)勢。
比如文心大模型帶車端小模型的方法,提升車端感知能力;再比如昆侖芯在云端計算、仿真系統(tǒng)為Apollo提供的助力等等。
而這其中最重要的,是百度在目前L4遇冷的環(huán)境下,再次自證“降維”路線能夠走通,提出了可供全行業(yè)參考的業(yè)務(wù)模型。
最后,來簡單認(rèn)識一下這次出場的百度無人車“CTO級”技術(shù)天團(tuán)。
陳競凱,2002年畢業(yè)于北京大學(xué)計算機(jī)系,碩士。是百度內(nèi)部低調(diào)又謙遜的技術(shù)大神之一。先后在搜索、廣告和地圖等業(yè)務(wù)上統(tǒng)領(lǐng)過技術(shù)工作,并任百度技術(shù)委員會聯(lián)席主席。2018年開始,陳競凱出任百度自動駕駛首席架構(gòu)師。
黃際洲,博士,正高級工程師,百度人工智能技術(shù)委員會主席,百度地圖首席研發(fā)架構(gòu)師。多年來一直從事自然語言處理、知識圖譜、數(shù)據(jù)挖掘等人工智能相關(guān)技術(shù)研發(fā)及大規(guī)模產(chǎn)業(yè)化工作,先后擔(dān)任百度阿拉丁、圖片搜索、搜索推薦、信息流推薦、百度地圖等產(chǎn)品的研發(fā)架構(gòu)師。
王井東,2001和2004年在清華大學(xué)自動化系先后獲得學(xué)士學(xué)位和碩士學(xué)位,2007年在香港科技大學(xué)計算科學(xué)與工程系獲得博士學(xué)位。2007年進(jìn)入微軟亞洲研究院,現(xiàn)任百度計算機(jī)視覺首席架構(gòu)師。2021年當(dāng)選IEEE Fellow?,F(xiàn)任百度計算機(jī)視覺首席架構(gòu)師。
介紹數(shù)據(jù)閉環(huán)體系的自動駕駛專家李昂,公開資料較少,但毫無疑問一定是Apollo口中的“CTO級”大牛之一。
昆侖芯科技CEO歐陽劍,本科畢業(yè)于北航電子工程專業(yè),碩士畢業(yè)于中科大。2016年進(jìn)入百度,負(fù)責(zé)自動駕駛數(shù)據(jù)體系架構(gòu),2020年起任百度首席芯片架構(gòu)師。是百度造芯的主要操盤手。
王亮博士,2000級北航計算機(jī)系校友,2012年從肯塔基大學(xué)博士畢業(yè),在Adobe實(shí)過習(xí),畢業(yè)后先去了微軟雷德蒙德總部……2013年加入百度美研,參與AR平臺打造,主要是發(fā)揮其機(jī)器視覺和3D建模方面的專長。至今,官方title是杰出研發(fā)架構(gòu)師,百度無人駕駛環(huán)境感知方向技術(shù)負(fù)責(zé)人、百度智能駕駛事業(yè)群組技術(shù)委員會主席。
所以這次亮相的幾位技術(shù)大牛都是T幾?
很可能至少人均T11,因?yàn)橥趿?年前提到T11,而陳競凱很多年前就是T11了。
而按照百度技術(shù)職級,最高是T12,不過至今未聽說誰是T12…