表情最逼真機(jī)器人靠AIGC再進(jìn)化!接入Stable Diffusion能用筆畫畫
“如果你不喜歡我的畫,你可能只是不懂藝術(shù)”
夢晨 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
把Stable Diffusion接入機(jī)器人會怎樣?
告訴它你想讓它畫什么,然后一筆一筆畫出來。

只見它一邊與旁邊的人類工程師談笑風(fēng)生,一邊熟練地用馬克筆在白板上畫出一只簡筆的貓。

最后還不忘簽下自己的名字“Ameca”,然后抬起執(zhí)筆的手,用眼神繼續(xù)審視著剛剛完成的作品。

當(dāng)Ameca詢問人類對它的作品是否滿意的時候,工程師老哥耿直地回答“這畫的有點(diǎn)簡略了”。

然后高能來了。
Ameca生氣地嗆了回去:
如果你不喜歡我的畫,你可能只是不懂藝術(shù)。

機(jī)器人Ameca,來自英國公司Engineered Arts,之前就以表情逼真到嚇人出名過一次。

現(xiàn)在它get到用筆畫畫的新能力,又驚艷了一眾網(wǎng)友。
每一筆畫完后輕輕舉起筆,就像一個真正的素描藝術(shù)家一樣,這個小細(xì)節(jié)太酷了。

機(jī)器人怎么用筆畫畫的?
Ameca具體是怎么學(xué)會畫畫的,它自己就能解釋明白:
我使用開源的Stable Diffusion,對生成的圖像做骨架化和向量化,然后再把轉(zhuǎn)化出的軌跡轉(zhuǎn)換成動作并執(zhí)行。

就這樣,Ameca的身體動作和面部表情由Engineered Arts自研技術(shù)驅(qū)動,語言能力來自GPT-3(沒錯,不是3.5),再加上Stable Diffusion,組成了一位機(jī)器人畫家。
有網(wǎng)友表示,這樣的能力在教育中很有用,對于學(xué)生來說,用機(jī)器人比盯著電腦屏幕看有意思多了。

Engineered Arts自研技術(shù)包括機(jī)器人操作系統(tǒng)Tritium和機(jī)器人生產(chǎn)平臺Mesmer。
首先用36臺攝像機(jī)無死角捕捉海量真人面部數(shù)據(jù),包括骨骼結(jié)構(gòu),皮膚紋理和表情等。

對這些數(shù)據(jù)做3D建模,并3D打印出機(jī)器人的硅膠皮膚。

Tritium操作系統(tǒng)連接了硬件、軟件和云端,可以驅(qū)動機(jī)器人的每一個組件,除了面部,還會牽動頭頸、肢體的不同“肌肉”。

最終實(shí)現(xiàn)更逼真的表情。

再加上語言模型GPT-3和語音技術(shù),Ameca已經(jīng)初步具備了與人類互動的能力。

這次除了畫畫以外,Engineered Arts還公布了另一條人類與Ameca討論音樂的視頻,或許暗示這是下一個挑戰(zhàn)方向。
Ameca說自己喜歡爵士古典和電子樂,人類給他出的難題“如果要把這三種風(fēng)格融合在一起寫一首歌,第一句歌詞是什么?!?/p>
Ameca略加思索就給出了回答。
另外Ameca還在搞一場與網(wǎng)友互動的活動。
如果你有什么問題想問它,可以去原視頻評論區(qū)留言,下一條視頻可能就是Ameca回答你的問題了。
參考鏈接:
[1]https://www.youtube.com/watch?v=_1OA_9_wW70
[2]https://www.youtube.com/watch?v=L32BRcvnWRU
[3]https://www.engineeredarts.co.uk/mesmer-creation/
- 稚暉君新大招:機(jī)器人二次開發(fā)0門檻了!2025-08-22
- 賣酒的茅臺要學(xué)AI了!和奔馳麥當(dāng)勞一起拜師百度2025-08-17
- VLA進(jìn)化后降維打擊!雙手揀貨,漂移操作,還能批量化秀舞,太空艙直接開上街,被銀河通用卷到了2025-08-11
- 硅谷AI大佬都在造末日地堡:小扎夏威夷修了465平米,奧特曼承認(rèn)有加固地下室2025-08-08