OpenAI解散機(jī)器人團(tuán)隊(duì),曾試圖打造AGI機(jī)器人,創(chuàng)始人:這是最好的決定
“目標(biāo)沒變,還是AGI”
蕭簫 發(fā)自 凹非寺
量子位 報(bào)道 | 公眾號 QbitAI
剛剛,OpenAI突然宣布解散機(jī)器人團(tuán)隊(duì)!
據(jù)VentureBeat報(bào)道,OpenAI聯(lián)合創(chuàng)始人、機(jī)器人團(tuán)隊(duì)負(fù)責(zé)人Wojciech Zaremba表示,目前公司已經(jīng)將重心轉(zhuǎn)移到其他領(lǐng)域。
OpenAI機(jī)器人團(tuán)隊(duì)最著名的研究,是它研發(fā)的機(jī)械手,單手就能擰魔方:
直到今年1月,他們還發(fā)表了一篇用單一策略解決多類機(jī)器人任務(wù)的論文:
對于OpenAI的決定,許多網(wǎng)友表示遺憾。
有網(wǎng)友非常震驚:我真的非常喜歡他們的一篇機(jī)器人論文(文末有鏈接)!
斯坦福AI Lab在讀博士生Andrey Kurenkov對此不太驚訝,但也表示難過:
機(jī)器人研究確實(shí)非常困難!
此前主要研發(fā)機(jī)械手
從技術(shù)來看,早在2017年,OpenAI的機(jī)器人團(tuán)隊(duì),就發(fā)布過用于模擬機(jī)器人控制的開源軟件Roboschool。
2018年,團(tuán)隊(duì)研發(fā)出來的機(jī)械臂已經(jīng)能自如地“盤核桃”,即靈活把玩木塊:
2019年誕生的“單手?jǐn)Q魔方”的機(jī)械臂,是團(tuán)隊(duì)這兩年打造的機(jī)械臂“結(jié)晶”。
不過,從擰魔方的耗時(shí)來看,這個(gè)機(jī)械手并不算非常出色。比較創(chuàng)新的地方在于,它能在被捆綁、干擾的情況下也完成擰魔方的動作,適應(yīng)能力非常強(qiáng):
但后來,團(tuán)隊(duì)似乎在AGI機(jī)器人的研究上遇到了瓶頸。
據(jù)VB報(bào)道,去年10月,OpenAI的一位發(fā)言人在聲明中表示:
去年10月,在通過Rubik’s Cube等項(xiàng)目在強(qiáng)化學(xué)習(xí)領(lǐng)域達(dá)到SOTA后,我們就決定不再繼續(xù)進(jìn)行機(jī)器人研究。
我們認(rèn)為,根據(jù)人類反饋進(jìn)行強(qiáng)化學(xué)習(xí)的AI能取得更好的效果。
從方向來看,機(jī)器人團(tuán)隊(duì)曾經(jīng)確實(shí)是OpenAI的戰(zhàn)略之一。
其一,如何實(shí)現(xiàn)更高級的AI。語言團(tuán)隊(duì)認(rèn)為,可以讓機(jī)器通過單純的語言學(xué)習(xí)重塑對世界的理解;機(jī)器人團(tuán)隊(duì)則認(rèn)為智能的發(fā)展需要突破物理的限制。
其二,如何讓AI更安全,例如,AI如何正確反映人類的價(jià)值觀。
這些戰(zhàn)略都與AGI有關(guān),但從“解散機(jī)器人團(tuán)隊(duì)”這一舉動來看,OpenAI應(yīng)該改變了行動的方向。
這也在Wojciech Zaremba的采訪中得到了證實(shí),他表示,OpenAI正轉(zhuǎn)向“更容易獲取數(shù)據(jù)”的領(lǐng)域:
如果我們是一家機(jī)器人公司,或許會繼續(xù)在機(jī)器人技術(shù)上有所發(fā)展。但現(xiàn)在來看,我們離AGI似乎還缺些什么其他的東西。
對于OpenAI來說,這是目前最好的決定。
△OpenAI機(jī)器人團(tuán)隊(duì)領(lǐng)導(dǎo)人Wojciech Zaremba
“目標(biāo)沒變,還想做AGI”
當(dāng)然,從OpenAI近期的動向就能看出,他們的AGI(通用人工智能)目標(biāo)還是沒變。
無論是去年推出的GPT-3,還是今年年初發(fā)布的DALL·E,都是能完成多個(gè)任務(wù)的大語言模型。
以DALL·E為例,本質(zhì)上它就是一個(gè)創(chuàng)意生成器,能聽懂描述性語言,并合成想要的設(shè)計(jì)圖像,能控制包括物體、年代等多種細(xì)節(jié)在內(nèi)的物體屬性。
但據(jù)VB分析,OpenAI放棄機(jī)器人團(tuán)隊(duì),可能也有“經(jīng)濟(jì)上的原因”。
畢竟雖然號稱“非營利公司”,但OpenAI目前的合作也正在變得更加商業(yè)化。
除了在2020年底接受10億資金后,開放GPT-3接口給微軟使用以外,微軟目前還宣布,會將GPT-3與旗下的Power Apps進(jìn)行“深度”整合。
類似的公司例子也有不少,像谷歌旗下的DeepMind就一直在燒錢,最近也開始將目光放在更容易商業(yè)化的應(yīng)用上,例如預(yù)測蛋白質(zhì)折疊的AlphaFold2。
從行業(yè)來看,研究機(jī)器人的許多公司及項(xiàng)目,現(xiàn)狀也并不很好。
工業(yè)機(jī)器人Rethink Robotics在尋求收購失敗后倒閉破產(chǎn);波士頓動力被谷歌收購后,又賣給軟銀,現(xiàn)在又被現(xiàn)代接盤;本田公司的Asimo robotics項(xiàng)目,目前已經(jīng)退役。
現(xiàn)在,OpenAI解散機(jī)器人團(tuán)隊(duì),看來將研究的“理想”轉(zhuǎn)變?yōu)椤艾F(xiàn)實(shí)”,確實(shí)沒那么容易。
OpenAI部分機(jī)器人論文:
[1]機(jī)械手:https://d4mucfpksywv.cloudfront.net/papers/solving-rubiks-cube.pdf
[2]The assymetric self play paper:https://arxiv.org/abs/2101.04882
參考鏈接:
[1]https://venturebeat.com/2021/07/16/openai-disbands-its-robotics-research-team/
[2]https://twitter.com/Kyle_L_Wiggers/status/1416105801501003777