具身智能工業(yè)場景需求明確,擴(kuò)大應(yīng)用場景處理復(fù)雜數(shù)據(jù)是發(fā)展重點(diǎn)
未來要提高機(jī)器人在更多行業(yè)的泛化能力
編輯部 發(fā)自 凹非寺
量子位 |?公眾號(hào) QbitAI
具身智能,無疑是2024最熱科技話題之一。
很多人會(huì)好奇,有著超級(jí)AI大腦的機(jī)器人,何時(shí)能夠參與到我們的日常生活當(dāng)中?什么時(shí)候才能給我們建立一個(gè)真實(shí)的物理世界模擬器?
現(xiàn)在,國內(nèi)具身智能創(chuàng)新應(yīng)用引領(lǐng)者云深處,在MEET 2025智能未來大會(huì)上分享了自己的觀點(diǎn):
具身智能提高了傳統(tǒng)機(jī)器人的泛化能力,處理真實(shí)環(huán)境中的復(fù)雜數(shù)據(jù)仍是未來訓(xùn)練重點(diǎn)。
目前具身智能行業(yè)處于L2級(jí),工業(yè)場景中的需求非常明確。
云深處科技公司成立于2017年,專注于具身智能的研發(fā)與應(yīng)用,擁有超過15年的腿足機(jī)器人研發(fā)經(jīng)驗(yàn),其產(chǎn)品已在電力、消防、救援、建筑、安防等多個(gè)行業(yè)中實(shí)現(xiàn)商業(yè)化應(yīng)用。
在MEET 2025智能未來大會(huì)上,量子位邀請到了云深處科技公司的聯(lián)合創(chuàng)始人兼CTO李超,探討了云深處科技公司旗下機(jī)器人產(chǎn)品的發(fā)展歷程、目前具身智能行業(yè)的發(fā)展重點(diǎn)、未來公司的商業(yè)和技術(shù)方面的規(guī)劃等話題。
MEET 2025智能未來大會(huì)是由量子位主辦的行業(yè)峰會(huì),20余位產(chǎn)業(yè)代表與會(huì)討論。線下參會(huì)觀眾1000+,線上直播觀眾320萬+,獲得了主流媒體的廣泛關(guān)注與報(bào)道。
核心觀點(diǎn)梳理
- 多模態(tài)數(shù)據(jù)及真實(shí)性(To-Real問題)仍是制約具身智能進(jìn)一步發(fā)展的關(guān)鍵因素之一。
- 類似于自動(dòng)駕駛的分級(jí)標(biāo)準(zhǔn),具身智能也呈現(xiàn)出從L0到L4的不同級(jí)別,目前基本處于L2階段。
- 行業(yè)內(nèi)對(duì)具身智能的未來充滿樂觀,預(yù)計(jì)將在工業(yè)及其他非家用場景中率先實(shí)現(xiàn)大規(guī)模商業(yè)化應(yīng)用。
- 云深處通過對(duì)具體場景做適配、并對(duì)模型能力進(jìn)行約束,已實(shí)現(xiàn)強(qiáng)化學(xué)習(xí)算法的產(chǎn)品化落地。
以下是李超在MEET大會(huì)現(xiàn)場圓桌論壇的QA實(shí)錄,為了完整體現(xiàn)他的思考,在不改變原意的基礎(chǔ)上,量子位對(duì)問答部分進(jìn)行了編輯整理,希望能給你帶來更多啟發(fā)。
提高傳統(tǒng)機(jī)器人智能泛化能力
量子位:云深處很早開始就直奔具身智能終點(diǎn),做仿生類形態(tài),你們是怎么思考這個(gè)問題?
李超:云深處科技從今年開始專注具身智能的技術(shù)創(chuàng)新與行業(yè)引領(lǐng),客觀來說我們云深處是具身智能第一批受益者,也真實(shí)產(chǎn)生了一些市場價(jià)值。
我們最早是做機(jī)器狗的,幾年前,這些機(jī)器狗很多是基于模型進(jìn)行控制,它的泛化能力和適應(yīng)性沒有現(xiàn)在這么好。
這兩年我們在這方面持續(xù)投入,去年整個(gè)團(tuán)隊(duì)就已經(jīng)在做跟訓(xùn)練相關(guān)的具身智能,去年開始我們的四足機(jī)器人有了很好的應(yīng)用,今年開始規(guī)模化應(yīng)用。
我們有面向一些消防場景,還有救援的、特種的,包括電力巡檢等,具身智能給機(jī)器人賦予了靈魂,有了這個(gè)靈魂加持,加上機(jī)器人的應(yīng)變能力本身也很強(qiáng),目前已開始實(shí)現(xiàn)一年增長兩三倍的規(guī)?;瘧?yīng)用。
到明年還會(huì)有更多應(yīng)用,面向更開放的環(huán)境,陸陸續(xù)續(xù)會(huì)在一些民用的場景有更好的應(yīng)用。
量子位:具身智能這個(gè)概念來自于艾倫·圖靈,是他在半個(gè)世紀(jì)以前開始定義或者構(gòu)想的事情,到現(xiàn)在我們才真正定義元年,云深處當(dāng)時(shí)是看到什么趨勢,或者產(chǎn)業(yè)內(nèi)有什么樣技術(shù)或者要素變化,讓你們覺得可以開始做具身智能了?
李超:具身這個(gè)概念早些年其實(shí)我不太熟悉,云深處團(tuán)隊(duì),包括浙大團(tuán)隊(duì),最早是把學(xué)習(xí)引入到機(jī)器人控制中。
我們在2019年時(shí)其實(shí)就做了這個(gè)工作——多專家系統(tǒng),也登上Science Robotics子刊。
但是這里面的工作,是不是真的能超過以前的一些算法,能否實(shí)現(xiàn)產(chǎn)品化落地,才是更加重要的部分。云深處花了三年時(shí)間才真正把強(qiáng)化學(xué)習(xí)的東西做落地。
機(jī)器人在應(yīng)用的時(shí)候要基于具體的一個(gè)場景做適配,對(duì)它的能力要進(jìn)行一定*約束。
我們現(xiàn)在感覺,智能模型的能力有點(diǎn)太強(qiáng)了,如果放在機(jī)器人身上,能力會(huì)超出我們之前的預(yù)期。
核心的一點(diǎn)是,以前早期的機(jī)器人是基于規(guī)則的控制,但現(xiàn)在基于訓(xùn)練的方法,能力極大超出了我們認(rèn)知的邊界,而且還在不斷進(jìn)化。
隨著機(jī)器人能力的增加,以前我們覺得只能在固定場景下應(yīng)用,但今年在完全開放的環(huán)境里效果也可以非常棒。
我們上月發(fā)布的輪足形態(tài)機(jī)器人山貓,對(duì)這個(gè)行業(yè)來說是有顛覆性的,尤其是對(duì)未來二、三十公斤以下的移動(dòng)平臺(tái)來說。
它可以用最好的能力解決各種小場景下突破性的問題,是一個(gè)極大的提升,它相當(dāng)于一個(gè)有生命的物理系統(tǒng),這是我們最大的感受。
重點(diǎn)是處理復(fù)雜真實(shí)場景中的數(shù)據(jù)
量子位:數(shù)據(jù)在你們的實(shí)踐落地過程中是一個(gè)關(guān)鍵挑戰(zhàn)嗎?
李超:目前客觀地說還不是,云深處有一個(gè)很重要的使命,讓AI+機(jī)器人的技術(shù)真正落地,產(chǎn)生價(jià)值。目前從我的角度看,除了數(shù)據(jù),還有技術(shù)的成熟度,商業(yè)的成本,包括部署等挑戰(zhàn)。
在機(jī)器人能力層面,云深處做本體和小腦會(huì)更多一點(diǎn),在數(shù)據(jù)層面上,確實(shí)沒有遇到太多的障礙,因?yàn)閿?shù)據(jù)沒有大模型用的這么多。未來要結(jié)合更復(fù)雜的場景空間和操作,到明年這方面應(yīng)該是我們的一個(gè)挑戰(zhàn)。
量子位:對(duì)于如何處理真實(shí)數(shù)據(jù),像類似Sora的模型,或者Sim-To-Real的解決方法,您有什么看法?
李超:我們經(jīng)常困擾在To-Real這個(gè)事情里面,確實(shí)是問題很多。
剛才說到動(dòng)畫的數(shù)據(jù),可能體現(xiàn)在一些色彩,真實(shí)的場景里面的數(shù)據(jù),還包括質(zhì)感等更多方面,我們希望有更加多模態(tài)的。
比如像機(jī)器人在野外行駛的時(shí)候,看到一些草地,或者和雪地、水這些東西融合在一塊,對(duì)機(jī)器人來說如何做出通過與否的決策,這個(gè)是現(xiàn)在蠻大的一個(gè)挑戰(zhàn),這些都是To-Real的問題,我們每天都在解決這樣的問題。
工業(yè)生產(chǎn)場景中需求明確
量子位:像云深處這樣實(shí)踐者,你們會(huì)考慮把具身智能實(shí)踐按照一些能力技術(shù)的標(biāo)準(zhǔn)去劃分嗎?類比智能駕駛領(lǐng)域里面的L2—L5的劃分,你們會(huì)有類似的標(biāo)準(zhǔn)嗎?
李超:有,而且很明確,去年以前我們很多是L1,準(zhǔn)確說是L0,因?yàn)橛泻芏?strong>行業(yè)應(yīng)用,比如消防和應(yīng)急救援,還是人在操控。
現(xiàn)在我們用的最多的,工業(yè)巡檢場景下,在固定場景下、小范圍的L4,機(jī)器人自主去做決策,去做判斷,這是分行業(yè)的。
但是像山貓機(jī)器人在開放環(huán)境下,我們覺得目前是L2多一點(diǎn)點(diǎn),大部分情況下它可以靠自己判斷去做,還有一半時(shí)間需要靠人做決策。
明年希望進(jìn)化到L3級(jí)別,但對(duì)機(jī)器人來說場景太大了。
量子位:類比ChatGPT的發(fā)展軌跡的話,您覺得現(xiàn)在是具身智能的幾點(diǎn)0?
李超:我更樂觀一些,因?yàn)閯偤锰幵谶@個(gè)行業(yè)里面,我們也解決了很多惡劣環(huán)境下的實(shí)踐。
第一個(gè)被改變的格局還不確定,有些公司太瞄準(zhǔn)家用,家用是不是很快有這些需求還不確定。
但是我相信在工業(yè)生產(chǎn)中,很多場景已經(jīng)發(fā)生深刻的改變了,我處在這個(gè)圈子里面已經(jīng)感受很大了。
- 打臉!GPT-4o輸出長度8k都勉強(qiáng),陳丹琦團(tuán)隊(duì)新基準(zhǔn)測試:所有模型輸出都低于標(biāo)稱長度2025-01-15
- 好家伙,海螺直接拍了個(gè)AI版的《教父》2025-01-10
- 2025-01-08
- 用大模型吃瓜更智能了!阿里通義實(shí)驗(yàn)室提出新時(shí)間線總結(jié)框架2025-01-07