Rokid創(chuàng)始人祝銘明:元宇宙的本質(zhì)、底層和核心技術(shù) | MEET2022
從產(chǎn)業(yè)角度看,AR眼鏡要怎么發(fā)展?
編輯部 整理自 MEET 2022
量子位 報(bào)道 | 公眾號 QbitAI
回望2021年的科技圈,最繞不開的關(guān)鍵詞非“元宇宙”莫屬。
今天,當(dāng)人們反復(fù)談及這個新興概念時(shí),總是會忍不住大談暢想和未來,幻想這個虛擬世界會有怎樣的新功能。
但在MEET 2022智能未來大會現(xiàn)場,Rokid創(chuàng)始人及CEO祝銘明卻給出了不一樣的思考:
我們想關(guān)注更本質(zhì)、底層的技術(shù)。
在元宇宙爆火的背景下,這一觀點(diǎn)顯得冷靜又克制。
而作為一家從2014年就入場AR領(lǐng)域、專注人機(jī)交互的科技公司,Rokid從產(chǎn)業(yè)角度出發(fā)已經(jīng)有了多年的經(jīng)驗(yàn)與思考。
為了完整體現(xiàn)祝銘明有關(guān)AR智能眼鏡落地探索的思考,在不改變原意的基礎(chǔ)上,量子位對他的演講內(nèi)容進(jìn)行了編輯整理。希望也能給你帶來新的啟發(fā)。
關(guān)于MEET 智能未來大會:MEET大會是由量子位主辦的智能科技領(lǐng)域頂級商業(yè)峰會,致力于探討前沿科技技術(shù)的落地與行業(yè)應(yīng)用。MEET2022采取線上參會形式,20余家直播平臺和渠道轉(zhuǎn)播大會直播,200萬行業(yè)用戶線上參會。除量子位微信、頭條號、知乎、微博等全媒體矩陣外,新華社、鳳凰科技、騰訊科技、澎湃新聞等數(shù)十家主流媒體紛紛報(bào)道大會及相關(guān)內(nèi)容,線上曝光量累計(jì)超過2000萬。
演講要點(diǎn)
- 談Metaverse,便要關(guān)注感知、理解、協(xié)同、展現(xiàn)、數(shù)字資產(chǎn)5個方面。
- 元宇宙還是一條非常漫長的路,Rokid想從核心能力出發(fā),一步步帶領(lǐng)大家走向那個終點(diǎn)。
- 從使用場景和功能屬性兩個維度出發(fā),AR眼鏡可被劃分為4個種類。
- Rokid不認(rèn)為現(xiàn)在可以用一個通用產(chǎn)品來覆蓋所有場景,因此需要對每種產(chǎn)品進(jìn)行專門地打磨。
- 硬件、技術(shù)之外,Rokid還打造了自己的OS,并開放給更多開發(fā)者用。
關(guān)注元宇宙更本質(zhì)、底層的東西
Rokid從成立第一天起,我們對自己就有一個明確的定位:
我們更關(guān)注的是如何將真實(shí)世界與虛擬世界融合。
由此,我們把開發(fā)的重點(diǎn)放在了AI和AR上,在VR方面不做過多探索。今天,大家談元宇宙都很喜歡暢想未來,但是Rokid想關(guān)注一些更本質(zhì)、更底層的東西。
對此,我總結(jié)了5個方面。
第一,是感知能力。這會偏向于麥克風(fēng)、照相機(jī)等傳感器方面的技術(shù)。
第二,是理解能力。AI的范疇非常廣,Rokid更關(guān)注AI在感知的基礎(chǔ)上如何理解這個世界,通過周邊的環(huán)境理解人與事。
第三,是協(xié)同能力。實(shí)現(xiàn)人機(jī)交互,首先要對人與人之間、人與事物之間的協(xié)同深度思考。
比如Facebook推出的VR遠(yuǎn)程辦公應(yīng)用、我們這次線上直播會議,也都是某種協(xié)同。
Rokid也在這個領(lǐng)域里面,有一些自己的思考。我們認(rèn)為協(xié)同不僅是在虛擬世界中進(jìn)行,更是真實(shí)世界與數(shù)字世界的融合。
第四,是展現(xiàn)能力。
現(xiàn)在大家談?wù)揂R、VR、MR,更多關(guān)注的還是容易吸引眼球的東西。
這就體現(xiàn)了展現(xiàn)能力,其背后是基于光學(xué)、圖形引擎、空間引擎和算法等方面技術(shù)。
最后還有一個方面不得不重視,是數(shù)字資產(chǎn)。
這其中包括創(chuàng)作工具、生產(chǎn)工具、管理及安全等方面的能力。
以上這個5個方面,Rokid會有自己的思考,但也不會自己單打獨(dú)斗做所有的內(nèi)容。
我們會和整個產(chǎn)業(yè)界合作,最終將這5個能力融合到自己的操作系統(tǒng)中,為大家提供對應(yīng)的硬件產(chǎn)品和開放平臺。
為什么Rokid更關(guān)注底層能力架構(gòu)?
因?yàn)樘剿鱉etaverse是一條非常漫長的路,會延續(xù)5年、10年、20年甚至更久。作為一個實(shí)業(yè)類的公司,我們和其他研究型團(tuán)隊(duì)或者機(jī)構(gòu)不大一樣,我們會更加關(guān)注一些核心能力和整個路線該怎么走。
Rokid想做的是一步一步帶大家到那個地方去。
四個象限劃分AR眼鏡
而從一家產(chǎn)品平臺型公司的角度出發(fā),我們還會考慮技術(shù)的載體。
除了前面提到的5個能力,針對終端設(shè)備,我們也有4方面的思考。
橫軸從使用場景出發(fā),縱軸從功能屬性出發(fā),我們將AR眼鏡大致分為四個象限。
首先看第四象限,偏工具屬性、強(qiáng)調(diào)日常長時(shí)間佩戴。
其中這款產(chǎn)品叫做Rokid Glass,現(xiàn)在已經(jīng)升級到了第二代Rokid Glass 2.
2019年我們就發(fā)布了這個產(chǎn)品,已經(jīng)在全球范圍內(nèi)有了應(yīng)用和落地。
就在今早我們剛剛得知消息,代表全球最精密生產(chǎn)線的瑞士手表,也將我們列為了它的生產(chǎn)合作伙伴,并且在主頁上有長篇介紹。
再看第三象限,這部分希望AR眼鏡可以用在專業(yè)領(lǐng)域、更強(qiáng)調(diào)計(jì)算能力。
其中這款產(chǎn)品叫做X-Craft,它強(qiáng)調(diào)展現(xiàn)計(jì)算能力,帶有GPS、GPU、NPU等大量計(jì)算單元。
它也是一款在全球范圍內(nèi)銷售的產(chǎn)品,國內(nèi)許多能源制造企業(yè)中都已經(jīng)有了應(yīng)用。
而在第二象限,我們也在考慮如何讓AR眼鏡逼近每一個人的日常生活,
所以今年我們上線了一款名為Rokid Air的產(chǎn)品。
它雖然還不能做到像普通眼鏡那般容易佩戴,但也已非常輕便,放在口袋里毫無壓力的那種。
同時(shí)它的能力也更偏向內(nèi)容交互。
今天我們談?wù)揗etaverse,很多人可能是受到這一象限產(chǎn)品的影響。
目前在一些眾籌網(wǎng)站上已經(jīng)有人搶先體驗(yàn)到了這款產(chǎn)品,反響很不錯;所以我們最近也在籌備大規(guī)模銷售,今年年底它或許就會和大家見面。
當(dāng)然我們也不會放棄繼續(xù)探索可每天日常佩戴的場景。
在第一象限內(nèi),我們一直保持的產(chǎn)品研究方向叫Rokid Vision,目標(biāo)是希望它能像普通佩戴眼鏡一樣方便,而不僅僅只是用在一些特定場合。
以上就是我們對整個AR產(chǎn)品的布局、衡量和定位。
覆蓋智能制造、文旅、娛樂等領(lǐng)域
其實(shí)德國很多汽車廠都在使用Rokid Glass系列產(chǎn)品,如奧迪、寶馬、奔馳、保時(shí)捷等等。
尤其在疫情期間,Rokid的產(chǎn)品非常受歡迎,直到今天仍然暢銷。
與此同時(shí),我們還將AR眼鏡和疫情防控結(jié)合在一起,其優(yōu)勢更多體現(xiàn)在人性關(guān)懷。
當(dāng)測溫人員佩戴AR眼鏡后,在幾米遠(yuǎn)的位置就能識別到每個人的體溫,由此便無需將人攔下來,通過測溫門或者體溫槍指著人的方式來測溫。
這其中用到了大量的AI技術(shù),可以保障很高的精確度、穩(wěn)定度,還能同時(shí)識別多人體溫。
這個產(chǎn)品目前在全球有70多個國家和地區(qū)使用。
智能制造業(yè)方面,美的、比亞迪等國內(nèi)燈塔工廠都在使用我們的產(chǎn)品。
如下展示的,就是在生產(chǎn)線上使用Rokid Glass2的場景。其核心在于如何讓使用者不用編寫代碼、就能完成對自己整個工作流程的設(shè)定。
我們將AI能力與無代碼、低代碼配置平臺結(jié)合,讓更多人能夠快速將我們的產(chǎn)品用在不同生成領(lǐng)域,這也是行業(yè)里比較領(lǐng)先的做法。
事實(shí)上,當(dāng)我們談?wù)揂R或Metaverse時(shí),硬件只是其中之一,更重要的是后臺算力等方面的能力。
在此,我給大家舉一個例子。
在中石油AR智能輔助系統(tǒng)中,X-Craft更強(qiáng)調(diào)安全性,它配有北斗和GPS,同時(shí)也防塵防爆防污染,是一個專門針對重工業(yè)領(lǐng)域的產(chǎn)品。
而這個系統(tǒng)與國家電網(wǎng)的AR巡檢/運(yùn)維系統(tǒng),在產(chǎn)品形態(tài)上有所不同,但基本平臺是互通的。
這其實(shí)就是Rokid根據(jù)場景對產(chǎn)品的定制和細(xì)分。
但在此也分享一個我們的觀點(diǎn):Rokid不認(rèn)為現(xiàn)在可以用一個通用產(chǎn)品來覆蓋所有場景。
如果想要在行業(yè)里落地,我們都是會針對每一行業(yè)的特性對產(chǎn)品進(jìn)行打磨。
而除了工業(yè)上的應(yīng)用,我們還希望Rokid能夠走到消費(fèi)類市場。
比如Rokid Air,它最早被使用在文旅場景里。國內(nèi)很多景點(diǎn)都在用Rokid Air進(jìn)行文物或景區(qū)解說、導(dǎo)覽、甚至一些古建筑重現(xiàn)。
大家知道現(xiàn)存的很多古建筑遺址,無法重現(xiàn)往日的輝煌,但是我們通過AR技術(shù)可以將它們重現(xiàn)。
目前我們也在如火如荼地推進(jìn)這塊業(yè)務(wù),已經(jīng)成立了團(tuán)隊(duì)專門建設(shè)生態(tài)體系,同時(shí)我們還引進(jìn)很多伙伴幫忙進(jìn)行內(nèi)容創(chuàng)作、線下服務(wù)和推廣。
我相信AR技術(shù)在文博領(lǐng)域會對傳統(tǒng)導(dǎo)游解說、機(jī)器解說、二維碼講解帶來一次全新的變革。
這里要強(qiáng)調(diào)一個概念,Rokid做人機(jī)交互是由不同階段的。
從最早的指令型人機(jī)交互,再到圖形化人機(jī)交互,顯然是對人越來越友好的。
我們認(rèn)為下一代人機(jī)交互會和AI息息相關(guān),我們將它定位為基于專注力和意圖的人機(jī)交互。
在文博領(lǐng)域,我們就是在打造這樣的能力。
舉例來說,如果使用Rokid的AR眼鏡,在逛博物館時(shí)無需做任何指令,不需要任何點(diǎn)擊、操作,只要盯著界面就可以操控。
這樣的AR眼鏡自身可以去理解周圍環(huán)境,能掌握使用者的注意力在哪里,最后還能推薦信息。
整體的操作會非常簡單,不管是老人孩子,甚至是不會使用手機(jī)的人,戴上這樣的AR眼鏡走進(jìn)博物館,都能有非常好的體驗(yàn)。
再給大家分享一個產(chǎn)品,就是我們對消費(fèi)級AR眼鏡的嘗試——Rokid Air。
它更側(cè)重于讓每一個人都能體驗(yàn)到AR。
在此當(dāng)然娛樂先行,比如更加高清的視頻體驗(yàn)、娛樂游戲互動,它不僅僅是更大屏幕,而是從交互上給大家展現(xiàn)更多不一樣的內(nèi)容。
Rokid認(rèn)為,如果元宇宙是一個發(fā)展方向,那元宇宙不應(yīng)該局限于虛擬世界、不應(yīng)該與真實(shí)世界割裂,它應(yīng)該是考慮如何將人與真實(shí)世界、虛擬世界進(jìn)行融合。
所以我們會不遺余力地在AR領(lǐng)域探索,讓我們的產(chǎn)品成為大家進(jìn)入元宇宙的一個入口或橋梁。
開放Rokid的系統(tǒng)給大家用
最后再和大家介紹一下Rokid的系統(tǒng)。
我自己、我們團(tuán)隊(duì)中,很多人都有做AR研發(fā)的背景,在這個領(lǐng)域里大家可以看到,Rokid一直致力于建立自己的系統(tǒng)。
很多人或許會問,在Metaverse中系統(tǒng)和過去的OS、基礎(chǔ)平臺會有怎樣的區(qū)別?
在此我和大家分享一些Rokid的思考:
我們認(rèn)為有3個核心區(qū)別。
第一,當(dāng)然是從2D到3D的變化。而且這個3D還不是傳統(tǒng)意義上的3D屏幕,而是一個空間的概念。
第二,是在界面、輸入方面的變化。原來我們通過鍵盤、鼠標(biāo)來操作系統(tǒng),未來則可能通過你的眼睛、語言、意圖、姿態(tài)、大腦或者更多方式,這個將會非常有趣。
簡單講,就是從指令式交互變成注意力或意圖交互。
第三,是將真實(shí)世界和虛擬世界融合的變化。這是大勢所趨,也是Rokid在構(gòu)建自己的系統(tǒng)時(shí),一個非常重要的理念。
大家可以看到,我們將傳統(tǒng)的OS系統(tǒng)作為底層,向上來構(gòu)建能力。
這樣一來,開發(fā)者就不用關(guān)心AI、不用關(guān)心AR,也不用關(guān)心數(shù)字引擎、空間引擎等,只需要去做內(nèi)容開發(fā)和相關(guān)應(yīng)用就好,
這一系統(tǒng)我們也會對外開放,目前已經(jīng)有超過200個專業(yè)開發(fā)者在使用Rokid的OS。
如果大家之后擁有了我們的產(chǎn)品,就能在上面看到非常多精彩的游戲和應(yīng)用。
但是Rokid本身并不認(rèn)為,Metaverse很快會發(fā)展到每個人都能用的階段,不會有那么快。
不過Rokid還是會耐著心一步一步打造我們的基本能力、平臺、產(chǎn)品,幫助大家一步一步走到未來的那個世界。
最后,和大家分享一下Rokid的口號:Leave Nobody Behind。
我們希望將來科技和人文可以融合,讓越來越多人都能夠使用我們的產(chǎn)品、讓科技為他們服務(wù),真正做到每個人、每天都會使用未來新技術(shù)。
- 字節(jié)突然開源Seed-OSS,512K上下文主流4倍長度,推理能力刷紀(jì)錄2025-08-21
- “現(xiàn)在讀AI博士已經(jīng)太晚了”2025-08-19
- 谷歌AI攻克亞洲語言難題,2300種語言數(shù)字化計(jì)劃正在推進(jìn)2025-08-18
- AMD蘇姿豐公開懟扎克伯格!反對1億年薪挖人,使命感比鈔票更重要2025-08-18