DeepMind創(chuàng)始人最新訪談:AGI十年內(nèi)降臨,重塑醫(yī)療能源氣候…
DeepMind CEO:十年內(nèi)實(shí)現(xiàn)AGI,我一點(diǎn)都不驚訝
叨樂 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
AGI何時(shí)會實(shí)現(xiàn)?谷歌DeepMind CEO哈薩比斯在最新的采訪中預(yù)言:
十年。
如果AGI在接下來的十年內(nèi)出現(xiàn),我不會感到驚訝。
在這次訪談中,哈薩比斯大談特談AI的發(fā)展趨勢。
其中不乏一些大家比較感興趣的話題,例如:
短期內(nèi)AI存在炒作過度的情況,但長期來看,其潛力和影響仍被低估
Google DeepMind作為谷歌的“超級團(tuán)隊(duì)”,需在商業(yè)利益與科學(xué)研究間找到平衡
開源對科技進(jìn)步很重要,但遇到可能被濫用的技術(shù)時(shí),可能需要等上一年再將其開源,以此來評估和限制濫用。
更多具體內(nèi)容,且看下面的文字版分享~
早期AI的“落地問題”
Q:今天的訪談,我今天邀請了DeepMind的聯(lián)合創(chuàng)始人兼現(xiàn)任Google DeepMind CEO,哈薩比斯。
哈薩比斯:謝謝你,非常高興還能參與你的訪談。之前我們探討了概念和語言如何在現(xiàn)實(shí)世界中得到應(yīng)用,比如在模擬環(huán)境中或者作為機(jī)器人具備的實(shí)際智能,這可能是我們理解周圍世界所必需的。
然而,必須承認(rèn)的是,這些系統(tǒng)目前還未達(dá)到那個(gè)理想水平,它們會犯下許多錯(cuò)誤,并且尚未真正構(gòu)建一個(gè)關(guān)于世界的完整模型。盡管如此,僅通過語言學(xué)習(xí),它們所取得的進(jìn)步已經(jīng)遠(yuǎn)遠(yuǎn)超出了我們的預(yù)期。
Q:是的,我們上一次討論了很多關(guān)于如何將語言在現(xiàn)實(shí)世界中落地的問題。不過你能不能簡要解釋一下什么是“落地”?防止第一次看我們訪談的朋友聽不懂。
哈薩比斯:“落地”這一概念,源于80年代和90年代在諸如MIT等學(xué)術(shù)機(jī)構(gòu)所構(gòu)建的經(jīng)典AI系統(tǒng)。這些系統(tǒng)多為龐大的邏輯體系,可以想象為內(nèi)含眾多相互關(guān)聯(lián)的單詞的巨型數(shù)據(jù)庫。
然而,問題在于,盡管你能在數(shù)據(jù)庫中找到如“狗有四條腿”這樣的陳述,但當(dāng)系統(tǒng)面對一張真實(shí)的狗的照片時(shí),卻無法將這些像素點(diǎn)與數(shù)據(jù)庫中的符號相對應(yīng),這就是所謂的“落地問題”。
換言之,系統(tǒng)擁有了符號或抽象表示,卻無法理解這些表示在現(xiàn)實(shí)世界中的具體含義。此后,盡管人們嘗試解決這個(gè)問題,但始終無法達(dá)到完美的狀態(tài)。
與過去的系統(tǒng)不同,如今的AI系統(tǒng)直接從數(shù)據(jù)中學(xué)習(xí),并在一開始就建立了數(shù)據(jù)與現(xiàn)實(shí)世界的聯(lián)系。
有趣的是,即使這些系統(tǒng)最初只是基于語言進(jìn)行學(xué)習(xí),理論上應(yīng)該缺乏大量的“落地”所需信息,因?yàn)樗鼈儾⑽磁c現(xiàn)實(shí)世界中的模擬器、機(jī)器人或其他形式的輸入相連接,而僅僅是在語言空間中進(jìn)行學(xué)習(xí)。
然而,令人驚訝的是,這些系統(tǒng)仍然能夠從中推斷出關(guān)于現(xiàn)實(shí)世界的一些知識。
Q:這可能是因?yàn)?,在人們與系統(tǒng)互動(dòng)的過程中,會告訴系統(tǒng)哪些答案是正確的,哪些是錯(cuò)誤的。通過這種方式的反饋,系統(tǒng)得以接收到部分“落地”信息,從而逐漸建立起與現(xiàn)實(shí)世界的聯(lián)系。
哈薩比斯:確實(shí),如果系統(tǒng)在早期版本中因?yàn)槿狈Α奥涞亍毙畔⒍o出了錯(cuò)誤的回答,比如錯(cuò)誤地回答了“狗會怎么叫”這樣的問題,那么人們的反饋就會對其進(jìn)行糾正。
這種反饋是基于我們自身的“落地”知識,所以,在某種程度上,系統(tǒng)會吸收并學(xué)習(xí)這種反饋中的信息。
短期內(nèi)被炒作,長遠(yuǎn)看被低估
Q:除此之外,我還有點(diǎn)想問問你關(guān)于AI炒作的問題。你覺得我們現(xiàn)在的處境,目前的情況,是炒作不足,還是炒作過度?
哈薩比斯:我認(rèn)為更多的是后者。我想說,從近期來看,炒作有些過頭了。
我覺得人們說AI能做各種事情,但是實(shí)際上它卻沒有人們說的那么厲害?,F(xiàn)在有很多初創(chuàng)公司和風(fēng)險(xiǎn)投資都在追逐那些不切實(shí)際的想法,他們的想法都不是很成熟。
但另一方面,我認(rèn)為即使是現(xiàn)在,它仍然是被低估的,或者說還沒有得到足夠的重視。尤其是在我們到達(dá)AGI和后AGI階段時(shí),我仍然覺得人們沒有完全理解這將會是一個(gè)多么大的變化,以及隨之而來的責(zé)任。
所以,我認(rèn)為從短期來看,確實(shí)有點(diǎn)炒作過頭了,但是從長遠(yuǎn)來看的話,它還是被低估了的。
從多模態(tài)Gemini到Astra通用AI代理
Q:好的,現(xiàn)在我要提一個(gè)這次訪談中一個(gè)比較重要的問題,你認(rèn)為Gemini與其他實(shí)驗(yàn)室發(fā)布的大型語言模型有何不同呢?
哈薩比斯:我們從Gemini項(xiàng)目的最開始就設(shè)定了一個(gè)目標(biāo),那就是讓它能夠同時(shí)處理多種類型的數(shù)據(jù)。我們希望它不僅能理解文字,還能解析聲音、視頻、圖片和代碼等,基本上就是各種形式的信息。
我們深信,只有讓系統(tǒng)能夠理解和處理真實(shí)世界中的各種信息,它們才能真正地理解這個(gè)世界,進(jìn)而構(gòu)建出更加精確和全面的世界模型。
這其實(shí)也是我們上面提到的“落地”問題的一個(gè)延伸,只不過這次我們是利用語言作為基礎(chǔ)來實(shí)現(xiàn)這一點(diǎn)。
Q:所以“落地”仍然是整個(gè)項(xiàng)目的關(guān)鍵?
哈薩比斯:確實(shí),這一點(diǎn)至關(guān)重要。
我們還有一個(gè)終極目標(biāo),那就是打造一個(gè)全能的助手。我們已經(jīng)開發(fā)了一個(gè)名為Astro的項(xiàng)目原型,Astro不僅能理解你的輸入,還能感知你所處的環(huán)境背景。
試想一下,如果你的個(gè)人助理或數(shù)字助理能更深入地理解你的問題背景或你所處的情境,那它將更加得力。因此,我們始終堅(jiān)信,這種系統(tǒng)類型將更具實(shí)用價(jià)值。
為此,我們從項(xiàng)目啟動(dòng)之初就將多模態(tài)功能融入系統(tǒng)中。在當(dāng)時(shí),這是唯一一個(gè)具備此功能的模型,而現(xiàn)在,其他模型也在努力追趕。
Q:Astro項(xiàng)目是新興的通用AI代理,它能夠處理視頻和音頻數(shù)據(jù)。我記得在Google I/O大會上,你們展示了Astro如何幫助用戶記住眼鏡放置位置的實(shí)例。我對此技術(shù)的淵源很感興趣,它是否僅僅是舊版Google Glass的一種高級進(jìn)化形態(tài)?
哈薩比斯:Google在眼鏡類設(shè)備的開發(fā)領(lǐng)域擁有悠久的歷史,早在2012年左右就已涉足。因此,他們在這一領(lǐng)域具有顯著的先發(fā)優(yōu)勢??赡墚?dāng)時(shí)缺乏必要的技術(shù)來使智能助手理解其所見之物。但如今,有了這款數(shù)字助理的陪伴,它能夠理解你周圍的世界,讓人感覺非常自然。
Q:我想追溯Gemini的起源,因?yàn)樗醋越M織內(nèi)的兩個(gè)獨(dú)立部門,它是由他們共同完成的?
哈薩比斯:確實(shí),去年我們把Alphabet(谷歌母公司)的兩個(gè)研究部門,也就是原來的DeepMind和Google Brain,合并成了一個(gè)新的部門,我們管它叫“超級部門”。
這樣一來,公司里所有頂尖的人才都聚到了一個(gè)團(tuán)隊(duì)里,我們把所有研究領(lǐng)域的最棒的知識都融合在一起了,特別是在語言模型方面。
我們之前有一些項(xiàng)目,比如Trin Chilla、Gopher,它們都參與過早期語言模型,像Palm和Lambda的開發(fā)。這些模型各有各的長處和短處,而我們都把它們?nèi)诤系搅薌emini這個(gè)項(xiàng)目里,這是合并后的第一個(gè)非常重要的項(xiàng)目。
另外,還有一個(gè)特別重要的點(diǎn),就是我們把所有的計(jì)算資源都整合到一起了。這樣一來,我們就能進(jìn)行大規(guī)模的訓(xùn)練運(yùn)行,實(shí)際上就是把所有的計(jì)算力量都集中到一起,讓Gemini更加強(qiáng)大和高效。
這兩個(gè)團(tuán)隊(duì)一直以來都盯著AI的最前沿,之前在個(gè)人研究上也已經(jīng)有很多合作了,但可能在戰(zhàn)略上還沒那么緊密?,F(xiàn)在合并后的團(tuán)隊(duì),我將其描述為Google的“引擎室”。
我覺得兩個(gè)團(tuán)隊(duì)的工作方式其實(shí)挺像的,差別不大。接下來,我們會繼續(xù)加強(qiáng)在基礎(chǔ)研究上的優(yōu)勢,比如琢磨下一個(gè)Transformer架構(gòu)會是啥樣,我們都想自己搞出來。
說起來,之前的Transformer是Google Brain搞出來的,我們又把它和Deep Reinforcement Learning結(jié)合到一起,但我覺得還得有更多創(chuàng)新才行。我相信,就像過去10年一樣,不管是Brain還是DeepMind,我們都會繼續(xù)出力。
Google的“引擎室”
Q:你剛才說,Google DeepMind現(xiàn)在是Google的“引擎室”,這是一個(gè)很大的變化。我想知道現(xiàn)在Google是不是在你身上下重注了?
哈薩比斯:我覺得是的。我認(rèn)為Google一直都很清楚AI的重要性。皮猜在他剛擔(dān)任CEO的時(shí)候就說過,Google是一家“AI優(yōu)先”的公司。
我們在他剛上任的時(shí)候就討論過這個(gè)話題,他看到了AI作為繼移動(dòng)互聯(lián)網(wǎng)之后的下一個(gè)重大范式轉(zhuǎn)變的潛力,而且它的影響力比這些還要深遠(yuǎn)。
但我認(rèn)為,在過去一兩年里,我們才開始真正理解這意味著什么,不僅僅是從研究的角度來看,還包括產(chǎn)品和其他各個(gè)方面。所以,這是一個(gè)非常激動(dòng)人心的時(shí)刻,但我認(rèn)為這是我們整合所有人才并全力以赴的正確選擇。
Q:從另一個(gè)角度來看,對于DeepMind而言,現(xiàn)在成為Google的“引擎室”,是否意味著你們必須在考慮商業(yè)利益與純粹的科學(xué)研究之間找到更多的平衡?
哈薩比斯:確實(shí),我們現(xiàn)在需要更多地考慮商業(yè)利益,這已經(jīng)成為我們職責(zé)的一部分。不過,實(shí)際上還是有一些觀點(diǎn)需要澄清,我們會繼續(xù)推進(jìn)我們的科學(xué)研究工作,我們在這方面的投入還在不斷增加。
我認(rèn)為,這是我們在Google DeepMind所做的一件獨(dú)一無二的事情,甚至我們的競爭對手也將這些成果視為AI帶來的普遍益處。
“開源”很有必要
Q:好的,這就引出了我想問的下一個(gè)問題:開源。當(dāng)技術(shù)普及到大眾手中時(shí),就像你說的,可能會發(fā)生一些非常了不起的事情。我知道DeepMind過去開源了很多研究項(xiàng)目,但現(xiàn)在似乎這種情況有所改變。你能聊聊你對開源的看法嗎?
哈薩比斯:開源很有必要,我們一直是開源和開放科學(xué)的堅(jiān)定支持者。就像你知道的,我們幾乎發(fā)布了所有做過的研究項(xiàng)目,包括像Transformer和AlphaGo這樣的項(xiàng)目,我們都在《自然》和《科學(xué)》這樣的頂級雜志上公開了。
AlphaFold也是開源的,這些都是我們做出的明智選擇。你說得對,這種方式之所以有效,是因?yàn)橥ㄟ^共享信息,科技和科學(xué)可以以最快的速度進(jìn)步。在大多數(shù)情況下,開源都是普遍有益的,這也是科學(xué)的運(yùn)作方式。
不過,也有例外情況,那就是當(dāng)涉及到具有雙重用途的技術(shù)時(shí),比如AGI和強(qiáng)大的AI。
問題在于,你希望能夠啟用所有的良性用例,希望那些真正的科學(xué)家和技術(shù)人員能夠基于這些想法進(jìn)行構(gòu)建和批判,從而推動(dòng)社會快速進(jìn)步。但同時(shí),如何限制那些可能濫用這些系統(tǒng)的壞人,這就是問題所在。
現(xiàn)在還好,因?yàn)槲矣X得這些系統(tǒng)還不夠強(qiáng)大,但在兩三年后,尤其是當(dāng)你開始獲得具有代理行為的系統(tǒng)時(shí),可能會造成嚴(yán)重的傷害。
我們有自己開源的Gemini模型,叫做Gemma,但它們是較小的模型,不是最前沿的模型。
它們的能力對于開發(fā)人員來說仍然非常有用,因?yàn)樗鼈兛梢栽诠P記本電腦上運(yùn)行,也因?yàn)樗鼈兊膮?shù)量較少。它們的能力在目前這個(gè)階段已經(jīng)被充分理解,因?yàn)樗鼈儾⒉皇亲钚碌淖钋把啬P汀?/p>
可能我們最終會采取的做法是,我們會有開源模型,但它們會落后于最新的前沿模型一年左右,這樣我們可以在用戶的公開測試中真正評估這些模型的能力。
開源的一個(gè)問題是,如果出了問題,你無法召回它。對于專有模型,如果壞人開始以不良方式使用它,你可以關(guān)閉它,在極端情況下甚至可以關(guān)閉整個(gè)系統(tǒng)。但一旦你開源了某個(gè)東西,就無法收回了,這是單向的門。
AGI將在十年內(nèi)實(shí)現(xiàn)
Q:現(xiàn)在各種AI模型都是科研人員研發(fā)的,但是我想知道,如果我們進(jìn)入AI支持所有科學(xué)研究的階段,研發(fā)機(jī)構(gòu)是否還會有存在的空間?
哈薩比斯:我認(rèn)為還是有存在空間的,我們現(xiàn)在正處于通用AGI出現(xiàn)前的階段,我認(rèn)為這需要社會、學(xué)術(shù)界、政府和工業(yè)實(shí)驗(yàn)室之間的緊密合作。
我真的堅(jiān)信,這是我們最終達(dá)成目標(biāo)的唯一途徑。如果你問的是AGI之后的情況,那可能才是你真正想了解的。AGI一直是我渴望構(gòu)建的目標(biāo),因?yàn)槲覀兛梢岳盟鼇硖剿饕恍╆P(guān)于現(xiàn)實(shí)本質(zhì)、物理學(xué)、意識等方面的最基本問題。
Q:計(jì)算機(jī)科學(xué)家Stuart Russell曾告訴我,他有些擔(dān)心,一旦我們達(dá)到了AGI,可能我們都會像過去的貴族一樣,只會享受無憂無慮的奢華生活,沒有任何目標(biāo),也不會思考。
哈薩比斯:我認(rèn)為未來將會非常有趣。但這也涉及到我之前提到的“被低估”的問題,即近期與遠(yuǎn)期的炒作之間的差異。如果你愿意稱之為炒作,那么它確實(shí)在一定程度上被低估了。
我覺得未來的轉(zhuǎn)變將會是巨大的。我相信最終我們能夠治愈很多疾病,甚至所有疾病,解決能源問題、氣候問題。
Q:說到這,我記得你曾經(jīng)說過希望AGI能夠探索宇宙的奧秘,你認(rèn)為是否存在一些我們尚未設(shè)想過的可能性,比如蟲洞這樣的現(xiàn)象?
哈薩比斯:當(dāng)然,我完全相信這種可能性。我真心期望蟲洞能夠成為現(xiàn)實(shí)。在我看來,我們對物理學(xué)和現(xiàn)實(shí)的本質(zhì)還存在許多誤解。
顯然,量子力學(xué)與引力的統(tǒng)一、標(biāo)準(zhǔn)模型的問題、弦理論等等,都隱藏著無數(shù)的未解之謎。我與許多物理學(xué)界的朋友深入交流過,他們都認(rèn)為現(xiàn)有的理論框架中有很多東西無法完美地契合在一起。
我個(gè)人對多元宇宙的解釋并不太感冒,因此我認(rèn)為,如果我們能提出新的理論,并在太空中利用大型設(shè)備進(jìn)行驗(yàn)證,那將是一件非常了不起的事情。
我之所以對普朗克尺度的時(shí)間和空間如此著迷,是因?yàn)樗坪醮砹爽F(xiàn)實(shí)的極限分辨率,就像是一切事物可以被分割到的最小單位。
因此,我認(rèn)為我們應(yīng)該在這個(gè)層次上進(jìn)行深入的實(shí)驗(yàn)探索,特別是在我們擁有AGI和豐富資源的情況下,或許我們能夠設(shè)計(jì)或建造出這樣的實(shí)驗(yàn)設(shè)備。
Q:你曾說過DeepMind是一個(gè)20年的項(xiàng)目,現(xiàn)在我們走了多遠(yuǎn)?你們還在按計(jì)劃推進(jìn)嗎?
哈薩比斯:是的,我們?nèi)栽诎从?jì)劃推進(jìn),這聽起來可能有些不可思議,因?yàn)橥ǔ?0年的項(xiàng)目總是讓人感覺還需要20年才能完成。但我們已經(jīng)取得了很大的進(jìn)展。
我們的目標(biāo)是在2030年完成,所以如果能在未來十年內(nèi)達(dá)成這個(gè)目標(biāo),我也不會感到驚訝。
- 在線可玩!智譜開源圖生視頻模型,網(wǎng)友直呼Amazing!2024-09-19
- 字節(jié)AI版小李子一開口:黃風(fēng)嶺,八百里2024-09-13
- 小心!AI能「看懂」你的唇語,悄悄話不再安全!2024-09-12
- 機(jī)器人也會系鞋帶了!斯坦福團(tuán)隊(duì)賦予機(jī)器人新技能丨已開源2024-09-11