大神Karpathy炮轟復(fù)雜UI應(yīng)用沒有未來,Adobe首當(dāng)其沖,網(wǎng)友:不提供文本交互,就是在阻擋AI浪潮
還劃分了四個(gè)“風(fēng)險(xiǎn)等級(jí)”△ ngmi是not gonna make it的縮寫
克雷西 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
在人與AI高度協(xié)同的時(shí)代,只有大量復(fù)雜UI界面的應(yīng)用將會(huì)被淘汰。
大神Karpathy給出了對(duì)于應(yīng)用程序未來的預(yù)言,并特別點(diǎn)名Adobe、CAD將首當(dāng)其沖。
△?ngmi是not gonna make it的縮寫
這樣說的原因,Karpathy解釋,只有復(fù)雜的UI界面而不提供文本交互,就無法和大模型形成有效的人機(jī)協(xié)同。
換言之,這類軟件沒辦法滿足準(zhǔn)專業(yè)用戶的“氛圍式編程”需求。
按照應(yīng)用當(dāng)中UI和文本含量的不同,Karpathy還給一些常見的應(yīng)用劃分出了四個(gè)“風(fēng)險(xiǎn)等級(jí)”。

其中提到的部分軟件,長(zhǎng)這樣:

Karpathy還補(bǔ)充,雖然AI在UI界面操作上也會(huì)取得進(jìn)步,但開發(fā)者如果守株待兔,照樣不會(huì)有好的發(fā)展。

只有UI界面=沒有未來?
Karpathy的這番犀利言論,一經(jīng)發(fā)出就引發(fā)了廣泛的討論。
支持者Karpathy的人表示,僅僅依賴復(fù)雜的可視化UI,而沒有可腳本化的后端的產(chǎn)品,本質(zhì)上是在筑起高墻,阻擋AI的浪潮。

還有人表示,現(xiàn)在Agent的水平已經(jīng)與人類相當(dāng),所以軟件開發(fā)者要同時(shí)考慮人類和AI,甚至是只考慮AI。

看到有人如此強(qiáng)調(diào)后端接口的地位,有網(wǎng)友直接給出靈魂拷問——
UI界面到底還值不值得做?

有人解釋,使用文本交互不等于消滅UI,但UI應(yīng)當(dāng)構(gòu)建在“文本”之上,能夠在用戶交互操作和文本之間形成一種轉(zhuǎn)換機(jī)制。

反對(duì)Karpathy觀點(diǎn)的人則認(rèn)為,Karpathy提到的幾個(gè)“高風(fēng)險(xiǎn)示例”(Photoshop、CAD等)本身都是面向?qū)I(yè)用戶的,甚至專門有學(xué)校教授這些軟件的使用。
在他看來,這些應(yīng)用與普通的軟件不可同日而語,蘋果同時(shí)保留Logic Pro和Garage Band(都是音樂創(chuàng)作軟件)也是這個(gè)原因。

還有人認(rèn)為,VSCode等(以文本交互形式的)應(yīng)用并非適合所有人,那既然總要有一個(gè)適應(yīng),為什么不能讓AI來適應(yīng)人類的操作方式呢?

但無論支持還是反對(duì),想要讓應(yīng)用程序和AI之間更好協(xié)作,人們可能還需要更加規(guī)范的語言和軟件框架。

“非專業(yè)人士對(duì)編程存在認(rèn)知偏差”
同一天,Karpathy還發(fā)了另一則推文,討論了“驗(yàn)證差距”(verification gap)。
這則推文是在其他博主帖子的基礎(chǔ)之上進(jìn)行補(bǔ)充的,原帖內(nèi)容大概是這么說的:
研究人員必須對(duì)AI生成內(nèi)容的相關(guān)知識(shí)足夠了解,才能判斷是否正確,這就是針對(duì)評(píng)估和幻覺有大量研究的原因,但是“驗(yàn)證是人工智能用戶瓶頸”這一概念,尚未得到充分討論。

他還表示自己非常支持Karpathy提出“氛圍式編程”,但同時(shí)也認(rèn)為AI的純文本輸出非常難以驗(yàn)證。

Karpathy稱這是一篇“非常好的帖子”,然后借用了GAN的工作過程補(bǔ)充說,幾乎所有創(chuàng)造性工作中,生成和判別這兩個(gè)階段都是交替進(jìn)行的。

而判別的過程,的確在不同創(chuàng)作媒介中難度不同,具體來說,Karpathy認(rèn)為圖像最容易,文本更難,最難的則可能是音頻。

進(jìn)一步地,Karpathy批判了現(xiàn)在大模型編程中“重生成輕判別”的模式:
你可以說,在編程中,大模型已經(jīng)幾乎將生成階段壓縮到了即時(shí)的程度,但在“判別階段上幾乎沒有任何改進(jìn)。
人仍然需要盯著結(jié)果,判斷它們是否正確。
這正是我對(duì)LLM編程最大的批評(píng):它們總是隨意輸出大量代碼,復(fù)雜程度不一,仿佛第二階段(驗(yàn)證)根本不存在一樣。
得到這么多代碼并不是好事,反而令人畏懼。

最后,Karpathy又補(bǔ)充,非專業(yè)人士實(shí)際上對(duì)編程工作也存在認(rèn)知偏差。
Karpathy說,非專業(yè)人士以為編程就是寫代碼,但其實(shí)不是,編程的本質(zhì)實(shí)際上是盯著代碼看,類似大模型的判別過程。
如果只是讓“寫”代碼變得更快,卻沒有減少“思考代碼”的負(fù)擔(dān),那整體編程速度顯然不會(huì)有明顯提升。

而Karpathy自己也在研發(fā)一種AI輔助編程工作流,其中一項(xiàng)關(guān)鍵工作就是減少驗(yàn)證負(fù)擔(dān)。

在回復(fù)當(dāng)中,Karpathy認(rèn)同將文本視覺化是一種可行的方式,但像目前Cursor當(dāng)中的視覺形式非常糟糕,他設(shè)想將整個(gè)代碼庫(kù)布局在二維畫布上,讓程序員可以通過各種“鏡頭”來查看代碼。

話說回來,你認(rèn)為未來的應(yīng)用,應(yīng)該是什么樣子的呢?
參考鏈接:
[1]https://x.com/karpathy/status/1930354382106964079
[2]https://x.com/karpathy/status/1930305209747812559