12張PPT看懂中國虛擬數(shù)字人產(chǎn)業(yè)現(xiàn)狀:應用不止于虛擬偶像,2030年市場達2700億|量子位智庫(附下載)
千億級數(shù)字虛擬人產(chǎn)業(yè)報告
榮偉 發(fā)自 凹非寺
量子位 報道 | 公眾號 QbitAI
這位小姐姐,真不是人。
僅僅出道一年,已經(jīng)拍了VogueMe雜志,上了央視綜藝,還接了特斯拉的代言。

(卑微的打工人看著她的履歷,流下了委屈的眼淚。)
這么颯的小姐姐,這么強的打工人,到底是何方神圣呢?
其實,她真不是人。她是來自Metaverse的虛擬數(shù)字人。
這位小姐姐叫翎Ling,是由Xmov魔琺科技與次世文化共同打造的虛擬偶像。
但都2021年了,如果你以為虛擬數(shù)字人還只能當個虛擬偶像唱唱跳跳,再偶爾接個廣告,那可真就OUT了。

替代真人服務、多模態(tài)AI助手、虛擬世界第二分身,這些虛擬數(shù)字人也統(tǒng)統(tǒng)都能拿下。
到了2030年,圍繞虛擬數(shù)字人我國將會形成一個高達2700億的藍海市場。
想從這背后找到創(chuàng)業(yè)投資的機會嗎?快跟著看一下這份量子位智庫出品《虛擬數(shù)字人深度產(chǎn)業(yè)分析報告(精華版)》。文末還有完整版報告的下載鏈接。
技術重點在哪里?

虛擬數(shù)字人當然是只存在于虛擬世界的“假人”。
圖片、視頻和實時直播等都是他們的容身之所,而VR設備與全息投影也將成為他們大展才華之地。
身為虛擬數(shù)字人,雖具有外表、行為或交互的多重人類特征,卻是由計算機手段創(chuàng)造出來并供人使用的。
目前成熟的技術手段包括計算機圖形學、圖形渲染、動作捕捉、深度學習和語音合成等。
但無論用的什么技術,讓虛擬數(shù)字人更像人是技術選擇與應用的核心度量。高度擬人化為用戶帶來的親切感、關懷感與沉浸感是消費者的核心使用動力。
能否提供足夠自然逼真的相處體驗,是虛擬數(shù)字人能夠在各個場景中取代真人,完成語音交互方式升級的重要標準。

由于采用技術的分野,虛擬數(shù)字人可分為真人驅動型和計算驅動型兩類。
真人驅動型采用CG建模+真人動作捕捉方式:在完成原畫建模和關鍵點綁定后,虛擬數(shù)字人由動作捕捉設備或攝像頭基于真人的動作和表情驅動。
這種技術思路可看作傳統(tǒng)影視制作CG技術的延續(xù),近年來的技術突破主要是算法的進步,這讓動作捕捉的設備門檻被大大降低。
計算驅動型采用深度學習方式:虛擬數(shù)字人的語音表達、面部表情、具體動作由深度學習模型的運算結果實時或離線驅動。
計算驅動型虛擬數(shù)字人的呈現(xiàn)效果受到語音合成、NLP技術和語音識別共同影響,因而國內(nèi)只有在這三個方面同時具有較強綜合能力的AI技術公司,才會開展這項業(yè)務。

而按照應用場景的不同,虛擬數(shù)字人又可分成服務型和身份型兩種。
服務型可視為服務行業(yè)社會角色的虛擬化,代替掉主持人、導游和購物主播等人工工種。虛擬數(shù)字人會顯著降低已有服務型產(chǎn)業(yè)的成本,為存量市場降本增效。
在多模態(tài)技術的應用下,服務型亦可理解成具有關懷感和真實感的AI助手。交互效果的提升,會讓AI助手的接受度與適用場景得到擴展。
身份型目前主要用作虛擬偶像或真人偶像輔助分身,未來隨著XR(Extended Reality,包含AR、VR和MR )技術成熟應用,會成為個體在Metaverse中的第二分身和核心交互中介。
市場規(guī)模有多大?

經(jīng)量子位分析師測算,2030年我國虛擬數(shù)字人整體市場規(guī)模將達到2700億。
得益于虛擬IP/偶像的巨大潛力,以及虛擬世界第二分身的起步,身份型虛擬數(shù)字人將占據(jù)主導地位,統(tǒng)領約1750億的市場份額。
服務型虛擬數(shù)字人則相對穩(wěn)定發(fā)展:多模態(tài)AI助手仍有待進一步發(fā)展,多種對話式服務升級為虛擬數(shù)字人形態(tài),總規(guī)模超過950億。
理想的市場規(guī)模得益于行業(yè)天花板高,實現(xiàn)路徑明確,且已出現(xiàn)了有相當競爭力的技術公司。
在各行業(yè)逐漸意識到其技術可行性和商業(yè)價值后,虛擬數(shù)字人行業(yè)將快速進入高速發(fā)展期。

火山引擎、追一科技等公司基于自身觀察,認為虛擬數(shù)字人行業(yè)目前仍處于孵化培育的階段。
相芯科技基于XR行業(yè)技術成熟度曲線,認為虛擬化身技術在未來2-5年內(nèi)將進入穩(wěn)步爬坡期。
基于自身認知,相芯科技將虛擬數(shù)字人的未來發(fā)展劃分為三個階段,依次為:
- B端行業(yè)探索與教育的成長期。該階段主要用于完善行業(yè)解決方案,同時通過2B2C對C端客戶完成市場教育。
- B端場景成熟向C端滲透的發(fā)展期。該階段B端應用場景與行業(yè)深度結合,逐漸成熟。廠商開始關注UGC,消費級工具、C端消費訂閱制、虛擬內(nèi)容生產(chǎn)迎來井噴。
- B、C端應用成熟,形成數(shù)字資產(chǎn)及經(jīng)濟體系,技術迭代的成熟期。
據(jù)量子位分析師觀察,目前三大階段對應現(xiàn)象均已有所出現(xiàn)。這當中,面向B端探索成熟的落地場景是各廠商的主要關注點。

在服務型虛擬數(shù)字人的落地上,國內(nèi)國外由于CG技術的差距走出了實用型和關懷型的路線差異。
目前,國內(nèi)的服務型虛擬數(shù)字人主要用于代替真人進行內(nèi)容生產(chǎn)和簡單交互。
內(nèi)容生產(chǎn)上,以新聞播報為主要場景的虛擬數(shù)字人內(nèi)容生產(chǎn)平臺是各家廠商共同的著力點。
但在可供選擇的虛擬數(shù)字人數(shù)量,以及預設模板等制作細節(jié)上,國內(nèi)廠商與國外廠商仍存差距。
簡單交互上,國內(nèi)廠商多專注于虛擬數(shù)字人能提供簡單業(yè)務交互的特定細分市場。
虛擬主播是目前國內(nèi)商業(yè)化競爭最為激烈的場景,價格門檻已從萬元級別降至千元。其它場景,還包括虛擬客服、虛擬教師、導航導覽等。
由于在CG方面具有技術優(yōu)勢,國外基于真人形象,打造出具有高度關懷感和真實感的多模態(tài)AI助手型虛擬數(shù)字人。
這種虛擬數(shù)字人在特定關懷類場景乃至通用化交互中,可以提供顧問、關懷、陪伴,以及事務處理等服務。
國外廠商已有的落地場景包括個性化理財顧問、心理咨詢顧問和購物助理等。

而在目前變現(xiàn)能力更強的身份型虛擬數(shù)字人的落地上,虛擬IP/偶像受到了國內(nèi)外的共同關注。
虛擬IP/偶像解決了MCN對特定IP/偶像長期穩(wěn)定持有的問題。
盡管虛擬IP/偶像也會采用真人驅動的方式運營,但其對應的真人演員(二次元圈子稱為“中之人”)與虛擬IP/偶像本身并無強綁定關系。
不像真人IP/偶像可能發(fā)生各類突發(fā)事件,收費昂貴且品牌方難以積累自有流量,虛擬IP/偶像依托機構進行運作,人設穩(wěn)定還能高頻次出席品牌活動。
至于分身型虛擬數(shù)字人,面向的主要是未來的虛擬世界。
相芯科技將虛擬形象視為用戶與虛擬世界鏈接交互的第一入口,為每個人未來的虛擬世界乃至Metaverse中創(chuàng)造專屬身份,將成為必然趨勢。
目前還待解決的核心問題在于交互手段。
第二身份的核心在于精細描述使用者當前的反應姿態(tài),包括位置、外貌、注意力、情緒等一系列要素,為使用者提供基于第二身份的存在感。
這離不開一系列基礎配套設施的完善。在虛擬產(chǎn)業(yè)的內(nèi)容、硬件、軟件等方面基本成熟后,分身型虛擬數(shù)字人有望迎來快速爆發(fā)。
行業(yè)生態(tài)怎么樣?

虛擬數(shù)字人產(chǎn)業(yè)中,中游供應商按照自身經(jīng)營特性,主要包含垂直虛擬人廠商、綜合類/互聯(lián)網(wǎng)技術廠商、專長類AI廠商、CG廠商和XR廠商。
雖然參與的玩家不少,但虛擬數(shù)字人廠商還是可以從是否垂直和是否全棧兩方面來劃分出個陣營。
是否垂直,表明了廠商對虛擬數(shù)字人業(yè)務的重視度,決定著其能否專注于此并做大做強。
是否全棧,體現(xiàn)了廠商在行業(yè)中的影響力和產(chǎn)業(yè)鏈上的控制權,決定著其能否在產(chǎn)業(yè)形成龍頭地位。
(我國的虛擬數(shù)字人產(chǎn)業(yè)生態(tài),具體有哪些廠商在參與建設,它們在產(chǎn)業(yè)鏈上位置和所處的陣營又到底為何,詳細可參閱上圖。)
我國虛擬數(shù)字人領域未來的廠商群體可能會更加豐富,具體所在的業(yè)務領域與切入方式會和公司的基因高度相關,頭部客戶和中部客戶差異明顯。


盡管玩家數(shù)量在快速增長,但由于行業(yè)對公司的綜合技術實力和渠道合作能力要求較高,國內(nèi)國外具備相當實力和影響力的頭部公司仍相對有限。
在中國,虛擬直播、虛擬偶像等潛力確定的細分市場,出現(xiàn)部分針對中小客戶或承接經(jīng)紀等延展業(yè)務的專業(yè)虛擬數(shù)字人公司。

整體而言,國內(nèi)外在細分市場上競爭的各家廠商都處于試驗產(chǎn)品可行性、打造標桿客戶的階段,商業(yè)化規(guī)模推廣任重而道遠。
但值得注意的是,中外的虛擬數(shù)字人廠商在具體玩家、技術水平、關鍵場景、產(chǎn)品形態(tài)和運營方式上都具有明顯差異。
國內(nèi)和國外這種行業(yè)性的差異,技術落差當然是根本原因,但也有我國直播業(yè)態(tài)興起、互聯(lián)網(wǎng)元素復雜、人口基數(shù)大等多方面因素的助推。
不過經(jīng)量子位分析師觀察,未來中外在虛擬數(shù)字人的具體使用場景上會有所合并。目前這種體系化差異也不應被理解為不同的發(fā)展速度,畢竟未來即便是在同一細分市場,也可能會出現(xiàn)完全不同的業(yè)態(tài)。
發(fā)展壯大靠什么?

未來什么虛擬數(shù)字人公司最有前途?
第一是技術上限極高。
在眾多廠商心中,技術依舊是進入行業(yè)的核心門檻。
追一科技指出進入玩家不僅要在機器視覺、語音交互和自然語言處理方面具有深厚的技術積累,還得有能力將三者有機結合。
科大訊飛更強調虛擬數(shù)字人向自我管理的演化,認知智能、靈活性、個性化、情感化都是虛擬數(shù)字人技術上待提升的方面。
虛擬數(shù)字人動作的細膩度和豐富度則被魔琺科技等廠商關注。
不同廠商強調的技術側重點有差異,但無論如何在技術的某一方面能做到上限極高,是公司逐鹿中原必不可少的條件。
第二是業(yè)務認知成熟。
由于未來虛擬數(shù)字人行業(yè)需要和各垂直行業(yè)進行深度融合,對業(yè)務的深度了解被越來越看重。
火山引擎認為,好的廠商需要站在客戶的業(yè)務場景之下考慮虛擬形象給客戶帶來的價值和效率提升。
比如在教育、直播等此類場景中,盡管交互只占據(jù)虛擬數(shù)字人整體工作中的一部分,但在魔琺科技看來,問答的高轉化率是當前場景中的價值關鍵。
對客戶業(yè)務場景具有充足行業(yè)知識積累,語言交互做得好、對接原場景業(yè)務能力強的公司,未來自然更容易受其他行業(yè)熱捧。
第三是標準化復制能力強。
國內(nèi)廠商目前主要服務高度定制化的需求場景,項目的整體工期和客單價都較高,在大規(guī)模復制上存在問題,虛擬數(shù)字人的應用因而還無法快速推廣至各行業(yè)。
可嘗試的解決辦法包括:尋找合適的場景合作方,用SDK/API實現(xiàn)標準化;以SaS模式直接提供最終成果。
率先在各細分市場實現(xiàn)應用標準化復制的公司,未來將有機會快速搶占頭部市場。
下載原版報告PDF
在量子位公眾號后臺回復“虛擬數(shù)字人”,下載量子位智庫出品《虛擬數(shù)字人深度產(chǎn)業(yè)報告(完整版)》。
關于量子位智庫:
量子位旗下科技創(chuàng)新產(chǎn)業(yè)鏈接平臺。致力于提供前沿科技和技術創(chuàng)新領域產(chǎn)學研體系化研究。面向前沿AI&計算機、生物計算、量子技術及健康醫(yī)療等領域最新技術創(chuàng)新進展,提供系統(tǒng)化報告和認知。通過媒體、社群和線下活動,幫助決策者更早掌握創(chuàng)新風向。

特別感謝:魔琺科技、相芯科技、追一科技、中科深智、火山引擎、小冰公司、黑鏡科技、科大訊飛、搜狗、百度及相關行業(yè)從事者對本報告的深度參與(排名不分先后)。
- 云原生首超Linux成最熱,92%公司表示開源人才留不住|Linux基金會最新報告2021-09-24
- 醫(yī)學頂刊BMJ打臉谷歌:AI取代醫(yī)生檢測乳腺癌還遠著呢 ?2021-09-23
- 波士頓動力機器狗再進化:已學會自主規(guī)劃路線2021-09-18
- 人均獎金300萬,2021年“科學探索獎”名單揭曉:高會軍周昆上榜,女性獲獎人8位創(chuàng)紀錄2021-09-16