黃仁勛把自己做成了虛擬娃娃
英偉達(dá)也要搞數(shù)字虛擬人了,第一個(gè)就拿黃仁勛“開刀”
明敏 發(fā)自 凹非寺
量子位 報(bào)道 | 公眾號 QbitAI
英偉達(dá)是推出黃仁勛手辦了嗎???

看上去還挺可愛的呢。
不過事情可沒有這么簡單,接下來這一幕或許就會(huì)讓你大為震撼。
因?yàn)?,這個(gè)萌版老黃,是 會(huì) 動(dòng) 的。
不僅如此,他還能說會(huì)道,上知天文下知地理的那種。
氣候變化帶來的最大威脅是什么?天文學(xué)家如何尋找行星?蛋白質(zhì)在細(xì)胞中的作用是什么?
這些問題通通難不倒他,簡直是行走的百科全書。
而且連說話的聲音都是老黃同款,反差感極大。
所以,這么一個(gè)集可愛智慧與成熟男人魅力的化身,到底是什么來頭啊?
老黃的AI化身
以上這個(gè)萌物,當(dāng)然不是手辦,但也不是機(jī)器人,甚至你都無法摸到它。
這其實(shí)是老黃在GTC 2021上發(fā)布的虛擬人形象——Toy-Me。
它最擅長的事情就是和人聊天,可以快速回答人們提出的問題。
怎么有點(diǎn)語音助手那味兒了?
還真是,這不老黃還帶來了一個(gè)Toy-Me的同類,它就是一個(gè)可以引導(dǎo)顧客點(diǎn)餐的餐廳客服虛擬形象。
屏幕中這個(gè)小機(jī)器人,可以通過語音識別、眼神追蹤來推斷顧客的意圖,并能在2秒左右作出反應(yīng),回答顧客提出的問題或要求。
并且還放在更多場景里,比如自動(dòng)駕駛。
小機(jī)器人能夠在和駕駛員溝通后,調(diào)整車輛的行駛模式,搖身一變成為小管家。
而除了這些可愛的虛擬助手,老黃的“虛擬大法”還用在了視頻會(huì)議上。
平常我們視頻會(huì)議時(shí),難免會(huì)出現(xiàn)需要低頭看手機(jī)、或者查看其他窗口的情況,這會(huì)造成不好的觀感。
由此,英偉達(dá)就做出了一個(gè)虛擬的畫像,讓人們即使沒有注視屏幕時(shí),也能保持和屏幕的眼神交流。
并且還能將人們講的話實(shí)時(shí)翻譯成多種語言,聲音也會(huì)貼合本人原聲。
背后全是英偉達(dá)自家技術(shù)
以上這些所有炫酷的效果,其實(shí)都來自于英偉達(dá)在GTC 2021上發(fā)布的一個(gè)新平臺——NVIDIA Omniverse Avatar。
(就是阿凡達(dá)那個(gè)Avatar)
它可以讓人們可以在此創(chuàng)造不同的虛擬形象,還是有光追的那種哦。

△看老黃眼鏡上的反光
這背后當(dāng)然也需要多種技術(shù)的支持,比如語音識別、自然語言理解、計(jì)算機(jī)視覺等等。
其中最讓人眼前一亮的,莫過于軟件開發(fā)包Riva。
它能識別多種語言的語音,還能生成類人聲音。
據(jù)英偉達(dá)官方介紹,Riva只需要30分鐘的音頻數(shù)據(jù),就能合成出相似的語音效果。
Q版老黃的聲音、視頻會(huì)議中實(shí)時(shí)翻譯后保持原聲,靠的都是這項(xiàng)技術(shù)。
而能讓“黃仁勛”陪你聊星辰大海,就要靠Megatron 530B了。
其實(shí)就是一個(gè)月以前發(fā)布的全球最大規(guī)模NLP模型威震天-圖靈(Megatron Turing-NLG)。
5300億參數(shù)、4480塊英偉達(dá)A100 GPU訓(xùn)練后,該模型能夠很好識別、理解和生成人類語言。
官方介紹,Megatron 530B可以在很少或沒有訓(xùn)練的情況下完成句子、回答主題廣泛的問題、總結(jié)長而復(fù)雜的故事、翻譯成其他語言,并應(yīng)對許多它未接受過專門訓(xùn)練的情景。

除此之外,推薦引擎NVIDIA Merlin可以讓虛擬助手提出明智的建議。
計(jì)算機(jī)視覺框架NVIDIA Metropolis能夠賦予虛擬形象感知能力。
生動(dòng)自然的動(dòng)畫形象則由NVIDIA Video2Face和Audio2Face?支持。
當(dāng)然,要把這些都結(jié)合在一起,最離不開的就是Omniverse。
它能跨平臺支持所有用戶的物理渲染、模擬和仿真,還能讓創(chuàng)作者、審核者在任何地方,只通過軟件應(yīng)用就在一個(gè)共享的虛擬世界中進(jìn)行合作。
在Omniverse里,可以做火山模擬、可以構(gòu)建虛擬工廠、也能還原一個(gè)老黃的廚房。
國內(nèi)央視的《飛向月球》太空紀(jì)錄片,也同樣有用到Omniverse,尤其是里面的數(shù)字人:
數(shù)字人產(chǎn)業(yè)發(fā)展如何了?
在GTC 2021大會(huì)上,老黃對數(shù)字人的未來可以說是非??春茫硎荆?/p>
智能虛擬助手的前景一片光明。
針對數(shù)字人產(chǎn)業(yè),量子位智庫在充分調(diào)研海內(nèi)外狀況,深度采訪國內(nèi)十余家頭部企業(yè)的基礎(chǔ)上,撰寫了數(shù)字虛擬人產(chǎn)業(yè)報(bào)告。從關(guān)鍵分類、技術(shù)細(xì)節(jié)、發(fā)展階段、細(xì)分場景、中外對比等角度全面分析這一產(chǎn)業(yè),提供專業(yè)參考。



我們同時(shí)成立了虛擬數(shù)字人的專業(yè)讀者社群,歡迎添加智庫小助手掃碼進(jìn)入。

下載原版報(bào)告PDF
點(diǎn)擊如下鏈接打開百度網(wǎng)盤,即可下載量子位智庫出品《虛擬數(shù)字人深度產(chǎn)業(yè)報(bào)告(完整版)》。
鏈接: https://pan.baidu.com/s/11F7dOpe6BUI0uBBz0eJ0jw 提取碼: 7cae
或在量子位公眾號后臺回復(fù)“虛擬數(shù)字人”亦可完成下載。
參考鏈接:
https://nvidianews.nvidia.com/news/nvidia-announces-platform-for-creating-ai-avatars
- 4o-mini華人領(lǐng)隊(duì)也離職了,這次不怪小扎2025-08-19
- 宇樹機(jī)器人“撞人逃逸”火到國外,王興興回應(yīng):下次不遙控了2025-08-16
- 突破Claude-4編程上限!自進(jìn)化Agent框架拿下新SOTA,已開源2025-08-19
- 讓OpenAI只領(lǐng)先5天,百川發(fā)布推理新模型,掀翻醫(yī)療垂域開源天花板2025-08-11