12張PPT看懂中國虛擬數(shù)字人產(chǎn)業(yè)現(xiàn)狀:應(yīng)用不止于虛擬偶像,2030年市場(chǎng)達(dá)2700億|量子位智庫(附下載)
千億級(jí)數(shù)字虛擬人產(chǎn)業(yè)報(bào)告
榮偉 發(fā)自 凹非寺
量子位 報(bào)道 | 公眾號(hào) QbitAI
這位小姐姐,真不是人。
僅僅出道一年,已經(jīng)拍了VogueMe雜志,上了央視綜藝,還接了特斯拉的代言。

(卑微的打工人看著她的履歷,流下了委屈的眼淚。)
這么颯的小姐姐,這么強(qiáng)的打工人,到底是何方神圣呢?
其實(shí),她真不是人。她是來自Metaverse的虛擬數(shù)字人。
這位小姐姐叫翎Ling,是由Xmov魔琺科技與次世文化共同打造的虛擬偶像。
但都2021年了,如果你以為虛擬數(shù)字人還只能當(dāng)個(gè)虛擬偶像唱唱跳跳,再偶爾接個(gè)廣告,那可真就OUT了。

替代真人服務(wù)、多模態(tài)AI助手、虛擬世界第二分身,這些虛擬數(shù)字人也統(tǒng)統(tǒng)都能拿下。
到了2030年,圍繞虛擬數(shù)字人我國將會(huì)形成一個(gè)高達(dá)2700億的藍(lán)海市場(chǎng)。
想從這背后找到創(chuàng)業(yè)投資的機(jī)會(huì)嗎?快跟著看一下這份量子位智庫出品《虛擬數(shù)字人深度產(chǎn)業(yè)分析報(bào)告(精華版)》。文末還有完整版報(bào)告的下載鏈接。
技術(shù)重點(diǎn)在哪里?

虛擬數(shù)字人當(dāng)然是只存在于虛擬世界的“假人”。
圖片、視頻和實(shí)時(shí)直播等都是他們的容身之所,而VR設(shè)備與全息投影也將成為他們大展才華之地。
身為虛擬數(shù)字人,雖具有外表、行為或交互的多重人類特征,卻是由計(jì)算機(jī)手段創(chuàng)造出來并供人使用的。
目前成熟的技術(shù)手段包括計(jì)算機(jī)圖形學(xué)、圖形渲染、動(dòng)作捕捉、深度學(xué)習(xí)和語音合成等。
但無論用的什么技術(shù),讓虛擬數(shù)字人更像人是技術(shù)選擇與應(yīng)用的核心度量。高度擬人化為用戶帶來的親切感、關(guān)懷感與沉浸感是消費(fèi)者的核心使用動(dòng)力。
能否提供足夠自然逼真的相處體驗(yàn),是虛擬數(shù)字人能夠在各個(gè)場(chǎng)景中取代真人,完成語音交互方式升級(jí)的重要標(biāo)準(zhǔn)。

由于采用技術(shù)的分野,虛擬數(shù)字人可分為真人驅(qū)動(dòng)型和計(jì)算驅(qū)動(dòng)型兩類。
真人驅(qū)動(dòng)型采用CG建模+真人動(dòng)作捕捉方式:在完成原畫建模和關(guān)鍵點(diǎn)綁定后,虛擬數(shù)字人由動(dòng)作捕捉設(shè)備或攝像頭基于真人的動(dòng)作和表情驅(qū)動(dòng)。
這種技術(shù)思路可看作傳統(tǒng)影視制作CG技術(shù)的延續(xù),近年來的技術(shù)突破主要是算法的進(jìn)步,這讓動(dòng)作捕捉的設(shè)備門檻被大大降低。
計(jì)算驅(qū)動(dòng)型采用深度學(xué)習(xí)方式:虛擬數(shù)字人的語音表達(dá)、面部表情、具體動(dòng)作由深度學(xué)習(xí)模型的運(yùn)算結(jié)果實(shí)時(shí)或離線驅(qū)動(dòng)。
計(jì)算驅(qū)動(dòng)型虛擬數(shù)字人的呈現(xiàn)效果受到語音合成、NLP技術(shù)和語音識(shí)別共同影響,因而國內(nèi)只有在這三個(gè)方面同時(shí)具有較強(qiáng)綜合能力的AI技術(shù)公司,才會(huì)開展這項(xiàng)業(yè)務(wù)。

而按照應(yīng)用場(chǎng)景的不同,虛擬數(shù)字人又可分成服務(wù)型和身份型兩種。
服務(wù)型可視為服務(wù)行業(yè)社會(huì)角色的虛擬化,代替掉主持人、導(dǎo)游和購物主播等人工工種。虛擬數(shù)字人會(huì)顯著降低已有服務(wù)型產(chǎn)業(yè)的成本,為存量市場(chǎng)降本增效。
在多模態(tài)技術(shù)的應(yīng)用下,服務(wù)型亦可理解成具有關(guān)懷感和真實(shí)感的AI助手。交互效果的提升,會(huì)讓AI助手的接受度與適用場(chǎng)景得到擴(kuò)展。
身份型目前主要用作虛擬偶像或真人偶像輔助分身,未來隨著XR(Extended Reality,包含AR、VR和MR )技術(shù)成熟應(yīng)用,會(huì)成為個(gè)體在Metaverse中的第二分身和核心交互中介。
市場(chǎng)規(guī)模有多大?

經(jīng)量子位分析師測(cè)算,2030年我國虛擬數(shù)字人整體市場(chǎng)規(guī)模將達(dá)到2700億。
得益于虛擬IP/偶像的巨大潛力,以及虛擬世界第二分身的起步,身份型虛擬數(shù)字人將占據(jù)主導(dǎo)地位,統(tǒng)領(lǐng)約1750億的市場(chǎng)份額。
服務(wù)型虛擬數(shù)字人則相對(duì)穩(wěn)定發(fā)展:多模態(tài)AI助手仍有待進(jìn)一步發(fā)展,多種對(duì)話式服務(wù)升級(jí)為虛擬數(shù)字人形態(tài),總規(guī)模超過950億。
理想的市場(chǎng)規(guī)模得益于行業(yè)天花板高,實(shí)現(xiàn)路徑明確,且已出現(xiàn)了有相當(dāng)競(jìng)爭力的技術(shù)公司。
在各行業(yè)逐漸意識(shí)到其技術(shù)可行性和商業(yè)價(jià)值后,虛擬數(shù)字人行業(yè)將快速進(jìn)入高速發(fā)展期。

火山引擎、追一科技等公司基于自身觀察,認(rèn)為虛擬數(shù)字人行業(yè)目前仍處于孵化培育的階段。
相芯科技基于XR行業(yè)技術(shù)成熟度曲線,認(rèn)為虛擬化身技術(shù)在未來2-5年內(nèi)將進(jìn)入穩(wěn)步爬坡期。
基于自身認(rèn)知,相芯科技將虛擬數(shù)字人的未來發(fā)展劃分為三個(gè)階段,依次為:
- B端行業(yè)探索與教育的成長期。該階段主要用于完善行業(yè)解決方案,同時(shí)通過2B2C對(duì)C端客戶完成市場(chǎng)教育。
- B端場(chǎng)景成熟向C端滲透的發(fā)展期。該階段B端應(yīng)用場(chǎng)景與行業(yè)深度結(jié)合,逐漸成熟。廠商開始關(guān)注UGC,消費(fèi)級(jí)工具、C端消費(fèi)訂閱制、虛擬內(nèi)容生產(chǎn)迎來井噴。
- B、C端應(yīng)用成熟,形成數(shù)字資產(chǎn)及經(jīng)濟(jì)體系,技術(shù)迭代的成熟期。
據(jù)量子位分析師觀察,目前三大階段對(duì)應(yīng)現(xiàn)象均已有所出現(xiàn)。這當(dāng)中,面向B端探索成熟的落地場(chǎng)景是各廠商的主要關(guān)注點(diǎn)。

在服務(wù)型虛擬數(shù)字人的落地上,國內(nèi)國外由于CG技術(shù)的差距走出了實(shí)用型和關(guān)懷型的路線差異。
目前,國內(nèi)的服務(wù)型虛擬數(shù)字人主要用于代替真人進(jìn)行內(nèi)容生產(chǎn)和簡單交互。
內(nèi)容生產(chǎn)上,以新聞播報(bào)為主要場(chǎng)景的虛擬數(shù)字人內(nèi)容生產(chǎn)平臺(tái)是各家廠商共同的著力點(diǎn)。
但在可供選擇的虛擬數(shù)字人數(shù)量,以及預(yù)設(shè)模板等制作細(xì)節(jié)上,國內(nèi)廠商與國外廠商仍存差距。
簡單交互上,國內(nèi)廠商多專注于虛擬數(shù)字人能提供簡單業(yè)務(wù)交互的特定細(xì)分市場(chǎng)。
虛擬主播是目前國內(nèi)商業(yè)化競(jìng)爭最為激烈的場(chǎng)景,價(jià)格門檻已從萬元級(jí)別降至千元。其它場(chǎng)景,還包括虛擬客服、虛擬教師、導(dǎo)航導(dǎo)覽等。
由于在CG方面具有技術(shù)優(yōu)勢(shì),國外基于真人形象,打造出具有高度關(guān)懷感和真實(shí)感的多模態(tài)AI助手型虛擬數(shù)字人。
這種虛擬數(shù)字人在特定關(guān)懷類場(chǎng)景乃至通用化交互中,可以提供顧問、關(guān)懷、陪伴,以及事務(wù)處理等服務(wù)。
國外廠商已有的落地場(chǎng)景包括個(gè)性化理財(cái)顧問、心理咨詢顧問和購物助理等。

而在目前變現(xiàn)能力更強(qiáng)的身份型虛擬數(shù)字人的落地上,虛擬IP/偶像受到了國內(nèi)外的共同關(guān)注。
虛擬IP/偶像解決了MCN對(duì)特定IP/偶像長期穩(wěn)定持有的問題。
盡管虛擬IP/偶像也會(huì)采用真人驅(qū)動(dòng)的方式運(yùn)營,但其對(duì)應(yīng)的真人演員(二次元圈子稱為“中之人”)與虛擬IP/偶像本身并無強(qiáng)綁定關(guān)系。
不像真人IP/偶像可能發(fā)生各類突發(fā)事件,收費(fèi)昂貴且品牌方難以積累自有流量,虛擬IP/偶像依托機(jī)構(gòu)進(jìn)行運(yùn)作,人設(shè)穩(wěn)定還能高頻次出席品牌活動(dòng)。
至于分身型虛擬數(shù)字人,面向的主要是未來的虛擬世界。
相芯科技將虛擬形象視為用戶與虛擬世界鏈接交互的第一入口,為每個(gè)人未來的虛擬世界乃至Metaverse中創(chuàng)造專屬身份,將成為必然趨勢(shì)。
目前還待解決的核心問題在于交互手段。
第二身份的核心在于精細(xì)描述使用者當(dāng)前的反應(yīng)姿態(tài),包括位置、外貌、注意力、情緒等一系列要素,為使用者提供基于第二身份的存在感。
這離不開一系列基礎(chǔ)配套設(shè)施的完善。在虛擬產(chǎn)業(yè)的內(nèi)容、硬件、軟件等方面基本成熟后,分身型虛擬數(shù)字人有望迎來快速爆發(fā)。
行業(yè)生態(tài)怎么樣?

虛擬數(shù)字人產(chǎn)業(yè)中,中游供應(yīng)商按照自身經(jīng)營特性,主要包含垂直虛擬人廠商、綜合類/互聯(lián)網(wǎng)技術(shù)廠商、專長類AI廠商、CG廠商和XR廠商。
雖然參與的玩家不少,但虛擬數(shù)字人廠商還是可以從是否垂直和是否全棧兩方面來劃分出個(gè)陣營。
是否垂直,表明了廠商對(duì)虛擬數(shù)字人業(yè)務(wù)的重視度,決定著其能否專注于此并做大做強(qiáng)。
是否全棧,體現(xiàn)了廠商在行業(yè)中的影響力和產(chǎn)業(yè)鏈上的控制權(quán),決定著其能否在產(chǎn)業(yè)形成龍頭地位。
(我國的虛擬數(shù)字人產(chǎn)業(yè)生態(tài),具體有哪些廠商在參與建設(shè),它們?cè)诋a(chǎn)業(yè)鏈上位置和所處的陣營又到底為何,詳細(xì)可參閱上圖。)
我國虛擬數(shù)字人領(lǐng)域未來的廠商群體可能會(huì)更加豐富,具體所在的業(yè)務(wù)領(lǐng)域與切入方式會(huì)和公司的基因高度相關(guān),頭部客戶和中部客戶差異明顯。


盡管玩家數(shù)量在快速增長,但由于行業(yè)對(duì)公司的綜合技術(shù)實(shí)力和渠道合作能力要求較高,國內(nèi)國外具備相當(dāng)實(shí)力和影響力的頭部公司仍相對(duì)有限。
在中國,虛擬直播、虛擬偶像等潛力確定的細(xì)分市場(chǎng),出現(xiàn)部分針對(duì)中小客戶或承接經(jīng)紀(jì)等延展業(yè)務(wù)的專業(yè)虛擬數(shù)字人公司。

整體而言,國內(nèi)外在細(xì)分市場(chǎng)上競(jìng)爭的各家廠商都處于試驗(yàn)產(chǎn)品可行性、打造標(biāo)桿客戶的階段,商業(yè)化規(guī)模推廣任重而道遠(yuǎn)。
但值得注意的是,中外的虛擬數(shù)字人廠商在具體玩家、技術(shù)水平、關(guān)鍵場(chǎng)景、產(chǎn)品形態(tài)和運(yùn)營方式上都具有明顯差異。
國內(nèi)和國外這種行業(yè)性的差異,技術(shù)落差當(dāng)然是根本原因,但也有我國直播業(yè)態(tài)興起、互聯(lián)網(wǎng)元素復(fù)雜、人口基數(shù)大等多方面因素的助推。
不過經(jīng)量子位分析師觀察,未來中外在虛擬數(shù)字人的具體使用場(chǎng)景上會(huì)有所合并。目前這種體系化差異也不應(yīng)被理解為不同的發(fā)展速度,畢竟未來即便是在同一細(xì)分市場(chǎng),也可能會(huì)出現(xiàn)完全不同的業(yè)態(tài)。
發(fā)展壯大靠什么?

未來什么虛擬數(shù)字人公司最有前途?
第一是技術(shù)上限極高。
在眾多廠商心中,技術(shù)依舊是進(jìn)入行業(yè)的核心門檻。
追一科技指出進(jìn)入玩家不僅要在機(jī)器視覺、語音交互和自然語言處理方面具有深厚的技術(shù)積累,還得有能力將三者有機(jī)結(jié)合。
科大訊飛更強(qiáng)調(diào)虛擬數(shù)字人向自我管理的演化,認(rèn)知智能、靈活性、個(gè)性化、情感化都是虛擬數(shù)字人技術(shù)上待提升的方面。
虛擬數(shù)字人動(dòng)作的細(xì)膩度和豐富度則被魔琺科技等廠商關(guān)注。
不同廠商強(qiáng)調(diào)的技術(shù)側(cè)重點(diǎn)有差異,但無論如何在技術(shù)的某一方面能做到上限極高,是公司逐鹿中原必不可少的條件。
第二是業(yè)務(wù)認(rèn)知成熟。
由于未來虛擬數(shù)字人行業(yè)需要和各垂直行業(yè)進(jìn)行深度融合,對(duì)業(yè)務(wù)的深度了解被越來越看重。
火山引擎認(rèn)為,好的廠商需要站在客戶的業(yè)務(wù)場(chǎng)景之下考慮虛擬形象給客戶帶來的價(jià)值和效率提升。
比如在教育、直播等此類場(chǎng)景中,盡管交互只占據(jù)虛擬數(shù)字人整體工作中的一部分,但在魔琺科技看來,問答的高轉(zhuǎn)化率是當(dāng)前場(chǎng)景中的價(jià)值關(guān)鍵。
對(duì)客戶業(yè)務(wù)場(chǎng)景具有充足行業(yè)知識(shí)積累,語言交互做得好、對(duì)接原場(chǎng)景業(yè)務(wù)能力強(qiáng)的公司,未來自然更容易受其他行業(yè)熱捧。
第三是標(biāo)準(zhǔn)化復(fù)制能力強(qiáng)。
國內(nèi)廠商目前主要服務(wù)高度定制化的需求場(chǎng)景,項(xiàng)目的整體工期和客單價(jià)都較高,在大規(guī)模復(fù)制上存在問題,虛擬數(shù)字人的應(yīng)用因而還無法快速推廣至各行業(yè)。
可嘗試的解決辦法包括:尋找合適的場(chǎng)景合作方,用SDK/API實(shí)現(xiàn)標(biāo)準(zhǔn)化;以SaS模式直接提供最終成果。
率先在各細(xì)分市場(chǎng)實(shí)現(xiàn)應(yīng)用標(biāo)準(zhǔn)化復(fù)制的公司,未來將有機(jī)會(huì)快速搶占頭部市場(chǎng)。
下載原版報(bào)告PDF
在量子位公眾號(hào)后臺(tái)回復(fù)“虛擬數(shù)字人”,下載量子位智庫出品《虛擬數(shù)字人深度產(chǎn)業(yè)報(bào)告(完整版)》。
關(guān)于量子位智庫:
量子位旗下科技創(chuàng)新產(chǎn)業(yè)鏈接平臺(tái)。致力于提供前沿科技和技術(shù)創(chuàng)新領(lǐng)域產(chǎn)學(xué)研體系化研究。面向前沿AI&計(jì)算機(jī)、生物計(jì)算、量子技術(shù)及健康醫(yī)療等領(lǐng)域最新技術(shù)創(chuàng)新進(jìn)展,提供系統(tǒng)化報(bào)告和認(rèn)知。通過媒體、社群和線下活動(dòng),幫助決策者更早掌握創(chuàng)新風(fēng)向。

特別感謝:魔琺科技、相芯科技、追一科技、中科深智、火山引擎、小冰公司、黑鏡科技、科大訊飛、搜狗、百度及相關(guān)行業(yè)從事者對(duì)本報(bào)告的深度參與(排名不分先后)。