生成式AI進入第二階段 | 紅杉資本
AIGC第二幕:端到端解決人類問題
來源:紅杉資本
翻譯:深思圈(Deep_Think_Circle)
編者按:
本文原作者是紅杉的兩位合伙人Sonya Huang和Pat Grady,以及GPT-4。
文章回顧了過去一年以來生成式AI的發(fā)展態(tài)勢,同時提出了這樣一個觀點:生成式AI正在從“第一幕”走向“第二幕”,“炒作和快速展示正在為真正的價值和完整的產(chǎn)品體驗所取代”。為此,他們更新了生成式AI市場圖。
以下全文翻譯轉(zhuǎn)載自深思圈。
一年前,我們發(fā)布了一個假設,即生成式AI將成為技術(shù)領(lǐng)域一個深遠的平臺轉(zhuǎn)變,然后,風暴來臨。
科學家、歷史學家和經(jīng)濟學家長久以來都在研究創(chuàng)新的寒武紀大爆發(fā)的最佳條件。在生成式AI中,我們已經(jīng)達到了一個現(xiàn)代的奇跡,我們這一代的太空競賽。
這一時刻已經(jīng)醞釀了幾十年,摩爾定律的六十年為我們提供了處理浮點數(shù)據(jù)的計算能力,四十年的互聯(lián)網(wǎng)為我們提供了數(shù)萬億token的訓練數(shù)據(jù),移動和云計算的二十年讓每個人的手掌中都有一臺超級計算機。換句話說,數(shù)十年的技術(shù)進步為生成式AI的起飛創(chuàng)造了必要的條件。
ChatGPT的崛起成為點燃導火線的火花,釋放出我們多年未見的創(chuàng)新密度和熱情——可能自互聯(lián)網(wǎng)初期以來。在“腦力谷”中,人們尤其是激動,AI研究者達到了搖滾明星的地位,每個周末黑客馬拉松的房子都擠滿了新的Agent和陪伴聊天機器人。AI研究者從車庫里的“黑客”變成了指揮數(shù)十億美元計算的特種部隊。arXiv的論文如此多產(chǎn),以至于研究者們開玩笑要求暫停新的出版物,以便他們能趕上。

但很快,AI的興奮變成了近乎歇斯底里。突然,每家公司都成了“AI副駕駛(Copilot)”。我們的收件箱被“AI Salesforce”、“AI Adobe”和“AI Instagram”的無差別宣傳充滿。1億美元的種子輪又回來了。我們發(fā)現(xiàn)自己處于一個不可持續(xù)的融資、人才戰(zhàn)和GPU采購的瘋狂。
果然,裂痕開始顯現(xiàn)。藝術(shù)家、作家和歌手挑戰(zhàn)機器生成的IP的合法性,關(guān)于倫理、監(jiān)管和即將到來的超級智能的辯論充斥了華盛頓。更令人擔憂的是,硅谷開始有傳言稱生成式AI實際上并不有用。產(chǎn)品遠遠低于預期,這可以通過糟糕的用戶留存率來證明。對許多應用的最終用戶需求開始達到高潮,這只是另一個蒸汽泡沫周期嗎?
對AI的不滿之夏使批評者歡欣鼓舞地跳舞,讓人想起互聯(lián)網(wǎng)的初期,那時在1998年,一位著名的經(jīng)濟學家宣稱:“到2005年,將變得清晰,互聯(lián)網(wǎng)對經(jīng)濟的影響不會超過傳真機?!?/p>
毫無疑問——盡管有噪音、歇斯底里和不確定性及不滿的氛圍,生成式AI的起步已經(jīng)比SaaS更加成功,僅從初創(chuàng)公司就獲得了超過10億美元的收入(SaaS市場需要幾年,而不是幾個月,才達到同樣的規(guī)模)。
一些應用已經(jīng)成為家喻戶曉的名字:ChatGPT成為增長最快的應用,尤其在學生和開發(fā)者中有很強的產(chǎn)品市場契合度;Midjourney成為我們的集體創(chuàng)意繆斯,據(jù)報道僅用11個團隊就達到了數(shù)億美元的收入;Character推廣了AI娛樂和伴侶,并創(chuàng)造了我們最渴望的消費者“社交”應用——用戶平均在應用中花費兩個小時。
盡管如此,這些成功的早期跡象并沒有改變一個事實,那就是許多AI公司根本沒有產(chǎn)品市場契合度(PMF)或可持續(xù)的競爭優(yōu)勢,而整個AI生態(tài)系統(tǒng)的繁榮是不可持續(xù)的。
現(xiàn)在塵埃已經(jīng)稍微落定,我們認為現(xiàn)在是一個適當?shù)臅r候來放大和反思生成式AI——我們現(xiàn)在所處的位置,以及我們可能的走向。
面向第二階段
生成式AI的首年——“第一幕”——是從技術(shù)出發(fā)的。我們發(fā)現(xiàn)了一個新的“錘子”——基礎(chǔ)模型,并引發(fā)了一波輕量級的新技術(shù)演示應用。
我們現(xiàn)在認為市場正在進入“第二幕”——這將是從客戶開始的。第二幕將端到端地解決人類問題。這些應用與首批推出的應用在本質(zhì)上有所不同。它們往往將基礎(chǔ)模型作為更全面解決方案的一部分,而不是整個解決方案。它們引入了新的編輯界面,使工作流程更加粘性,輸出效果更好。它們往往是多模態(tài)的。
市場已經(jīng)開始從“第一幕”轉(zhuǎn)向“第二幕”。進入“第二幕”的公司的例子包括Harvey,該公司為頂級律師事務所定制LLM;Glean,該公司正在爬行和索引我們的工作空間,使生成式AI在工作中更加相關(guān);以及Character和Ava,它們正在創(chuàng)建數(shù)字伴侶。
市場格局
我們更新的生成式AI市場圖如下:
與去年的地圖不同,我們選擇按照使用案例而不是模型模態(tài)來組織這張地圖。這反映了市場上兩個重要的推動力:生成式AI從技術(shù)錘子到實際使用案例和價值的演變,以及生成式AI應用日益多模態(tài)的特性。

此外,我們還加入了一個新的LLM開發(fā)者棧,反映了公司在生產(chǎn)中構(gòu)建生成型AI應用時轉(zhuǎn)向的計算和工具供應商。

重新審視我們的觀點
我們?nèi)ツ甑奈恼绿岢隽艘粋€關(guān)于生成式AI市場機會的論題,以及對市場如何發(fā)展的假設。如今一年過去了,來看看我們預測得怎么樣呢?
以下是我們預測錯的:
- 事情發(fā)展得很快。去年,我們預計還需要近十年的時間擁有實習生級別的代碼生成、好萊塢質(zhì)量的視頻或不發(fā)機械聲的人類質(zhì)量語音。但聽一聽Eleven Labs在TikTok上的聲音或Runway的AI電影節(jié)就明白,未來已經(jīng)以光速到來。甚至3D模型、游戲和音樂都快速變得優(yōu)秀。
- 瓶頸在供應端。我們沒有預料到最終用戶的需求會超過GPU的供應。許多公司增長的瓶頸很快就不是客戶需求,而是獲取Nvidia的最新GPU。長時間的等待成為常態(tài),出現(xiàn)了一個簡單的商業(yè)模型:支付訂閱費跳過等待隊列并獲得更好的模型。
- 垂直分離尚未發(fā)生。我們仍然相信“應用層”公司和基礎(chǔ)模型提供商之間會有分離,模型公司專注于規(guī)模和研究,應用層公司專注于產(chǎn)品和UI。實際上,這種分離還沒有干凈利落地發(fā)生。事實上,最初面向用戶的應用中最成功的是垂直整合的。
- 競爭環(huán)境殘酷,現(xiàn)有競爭者的反應迅速。去年,競爭格局中有幾個過于擁擠的類別(尤其是圖像生成和文案寫作),但總體上市場還是一個空白區(qū)域。如今,競爭格局的許多角落比機會還要競爭激烈。從Google的Duet和Bard到Adobe的Firefly,現(xiàn)有競爭者迅速的反應——以及他們最終愿意承擔“風險”的意愿——加劇了競爭的熱度。即使在基礎(chǔ)模型層,我們也看到客戶在不同供應商之間建立自己的基礎(chǔ)設施。
- 壁壘在客戶中,而不是在數(shù)據(jù)中。我們預測,最好的生成式AI公司可以通過數(shù)據(jù)飛輪生成可持續(xù)的競爭優(yōu)勢:更多使用→更多數(shù)據(jù)→更好的模型→更多使用。盡管這在某種程度上仍然是對的,特別是在擁有非常專業(yè)和難以獲得的數(shù)據(jù)的領(lǐng)域,但“數(shù)據(jù)壕溝”正處于不穩(wěn)定的地面:應用公司生成的數(shù)據(jù)并沒有創(chuàng)造一個無法逾越的壕溝,下一代基礎(chǔ)模型很可能會摧毀初創(chuàng)公司生成的任何數(shù)據(jù)壕溝。相反,工作流和用戶網(wǎng)絡似乎正在創(chuàng)造更持久的競爭優(yōu)勢來源。
以下是我們預測對的:
- 生成式AI是一種事物。突然之間,每個開發(fā)者都在研究生成式AI應用,每個企業(yè)買家都在要求它。市場甚至保留了“生成式AI”的名稱。人才涌入市場,風險資本也涌入。生成式AI甚至成為了流行文化現(xiàn)象,如“哈利·波特巴倫西亞加”這樣的病毒視頻,或者由Ghostwriter創(chuàng)作的模仿德雷克的歌曲“Heart on My Sleeve”,這首歌已經(jīng)成為了排行榜上的熱門歌曲。
- 第一個殺手級應用已經(jīng)出現(xiàn)。眾所周知,ChatGPT是最快達到1億MAU的應用程序——并且在短短6周內(nèi)自然而然地做到了這一點。相比之下,Instagram花了2.5年,WhatsApp花了3.5年,YouTube和Facebook花了4年才達到那種用戶需求水平。但ChatGPT并不是一個孤立的現(xiàn)象。Character AI的參與深度(平均每次會話2小時)、Github Copilot的生產(chǎn)力益處(效率提高55%)以及Midjourney的商業(yè)化路徑(數(shù)億美元的收入)都表明,第一批殺手級應用已經(jīng)到來。
- 開發(fā)者是關(guān)鍵。像Stripe或Unity這樣以開發(fā)者為中心的公司的核心洞察是,開發(fā)者創(chuàng)造了你甚至無法想象的使用案例。在過去的幾個季度里,我們接到了從音樂生成社區(qū)到AI紅娘到AI客戶支持代理的各種想法。
- 形態(tài)正在發(fā)展。AI應用的第一版大多是自動完成和初稿,但這些形態(tài)現(xiàn)在正在變得越來越復雜。Midjourney引入的攝像機平移和填充是生成式AI優(yōu)先用戶體驗變得更豐富的一個很好的例子。總的來說,形態(tài)正在從個體到系統(tǒng)級的生產(chǎn)力,從人在循環(huán)中到執(zhí)行導向的代理系統(tǒng)發(fā)展。
- 版權(quán)、倫理和存在的恐懼。這些熱點話題的辯論如火如荼,藝術(shù)家、作家和音樂家意見不一,有些創(chuàng)作者正當?shù)貞嵟谄渌藦难苌髌分蝎@利,有些創(chuàng)作者則接受了新的AI現(xiàn)實(Grimes的利潤分享提議和James Buckhouse對成為創(chuàng)意基因組的一部分的樂觀態(tài)度浮現(xiàn)在腦海中)。沒有初創(chuàng)公司想成為最終的Spotify的Napster或Limewire(感謝Jason Boehmig)。規(guī)則是模糊的:日本已經(jīng)宣布用于培訓AI的內(nèi)容沒有IP權(quán)利,而歐洲已經(jīng)提議下重手進行監(jiān)管。
我們現(xiàn)在所處的位置?生成式AI的價值問題
生成式AI并不缺乏使用案例或客戶需求。用戶渴望AI能使他們的工作變得更容易,他們的工作產(chǎn)品變得更好,這就是為什么他們會以創(chuàng)紀錄的速度涌向各種應用的原因(盡管缺乏自然分布)。

但人們會繼續(xù)使用嗎?不一定。下面的圖表比較了AI優(yōu)先應用與現(xiàn)有公司的首月移動應用留存率。

用戶參與度也不佳。一些最好的消費公司有60-65%的DAU/MAU,WhatsApp的為85%。相比之下,生成式AI應用的中位數(shù)為14%(Character和“AI陪伴”類別是顯著的例外)。這意味著用戶還沒有在生成式AI產(chǎn)品中找到足夠的價值,以至于每天都在使用它們。

簡而言之,生成式AI最大的問題不是尋找使用案例、需求或分發(fā),而是證明價值。正如我們的同事David Cahn所寫:“2000億美元的問題是:你打算使用所有這些基礎(chǔ)設施來做什么?它如何改變?nèi)藗兊纳???strong>建立持久的業(yè)務的路徑將需要解決保留問題,并為客戶生成足夠深入的價值,使他們堅持并成為每日活躍用戶。
但我們不應該絕望。生成式AI仍處于其“尷尬的青春期”。有時會有卓越的跡象,當產(chǎn)品沒有達到預期時,失敗通常是可靠的、可重復的且可修復的。我們的工作擺在面前。
第二階段分析
創(chuàng)始人正在進行prompt工程、微調(diào)和數(shù)據(jù)集策劃的艱苦工作,以使他們的AI產(chǎn)品優(yōu)秀起來。他們正在逐步地建設,將引人注目的Demo演示變成完整的產(chǎn)品體驗。與此同時,基礎(chǔ)模型底層繼續(xù)充滿研究和創(chuàng)新。
隨著公司找到持久價值的路徑,正在發(fā)展一個共享的劇本。我們現(xiàn)在有了共享的技術(shù)來使模型變得有用,以及將塑造生成式AI第二幕的新興UI范式。
模型開發(fā)棧
- 新興的推理技術(shù),如連鎖思考、樹狀思考和反射,正在提高模型執(zhí)行更豐富、更復雜的推理任務的能力,從而縮小了客戶期望與模型能力之間的差距。開發(fā)者使用像Langchain這樣的框架來調(diào)用和調(diào)試更復雜的多鏈序列。
- 遷移學習技術(shù),如RLHF和微調(diào),正變得更加可用,特別是隨著GPT-3.5和Llama-2的微調(diào)的最近可用性,這意味著公司可以將基礎(chǔ)模型適應其特定領(lǐng)域,并從用戶反饋中改進。開發(fā)者從Hugging Face下載開源模型,并微調(diào)它們以實現(xiàn)優(yōu)質(zhì)的性能。
- 檢索增強生成(RAG)正在引入關(guān)于業(yè)務或用戶的上下文,減少幻覺并增加真實性和實用性。像Pinecone這樣的公司的向量數(shù)據(jù)庫已成為RAG的基礎(chǔ)設施支柱。
- 新的開發(fā)者工具和應用框架為公司提供了可重用的構(gòu)建塊,以創(chuàng)建更先進的AI應用,并幫助開發(fā)者評估、改進和監(jiān)控生產(chǎn)中的AI模型的性能,包括像Langsmith和Weights & Biases這樣的LLMOps工具。
- 像Coreweave、Lambda Labs、Foundry、Replicate和Modal這樣的AI-first基礎(chǔ)設施公司正在解除公共云的捆綁,并提供AI公司最需要的東西:大量的GPU以合理的成本、按需可用和高度可擴展,以及一個不錯的PaaS開發(fā)者體驗。
這些技術(shù)應該能夠在基礎(chǔ)模型同時改進的情況下,縮小期望與現(xiàn)實之間的差距。但使模型變得出色只是成功了一半,生成式AI優(yōu)先的用戶體驗也在進化:
新興產(chǎn)品藍圖
- 生成式界面:基于文本的對話用戶體驗是LLM的默認界面。漸漸地,新的形態(tài)進入了武器庫,從Perplexity的生成用戶界面到Inflection AI的語音發(fā)聲等新的模態(tài)。
- 新的編輯體驗:從Copilot到導演模式(Director‘s Mode)。隨著我們從Zero-shot到ask-and-adjust(感謝Zach Lloyd),生成式AI公司正在發(fā)明一套新的旋鈕和開關(guān),它們看起來與傳統(tǒng)的編輯工作流程非常不同。Midjourney的新的平移命令和Runway的導演模式創(chuàng)造了新的相機般的編輯體驗。Eleven Labs使得通過提示(Prompt)操作聲音成為可能。
- 越來越復雜的代理系統(tǒng):生成式AI應用越來越不僅僅是需要人來審查的自動完成或初稿;它們現(xiàn)在有自主權(quán)來解決問題、訪問外部工具并代表我們端到端地解決問題。我們正穩(wěn)步從0級進展到5級自主性。
- 系統(tǒng)范圍內(nèi)的優(yōu)化:有些公司并不是嵌入單個人用戶的工作流程并使該個體更有效,而是直接解決系統(tǒng)范圍內(nèi)的優(yōu)化問題。你能否選擇一部分支持票據(jù)或拉取請求并自主地解決它們,從而使整個系統(tǒng)更加有效?
結(jié)尾的思考
當我們接近前沿悖論,當Transformers和擴散模型的新奇性逐漸消失時,生成式AI市場的性質(zhì)正在發(fā)生變化。炒作和快速展示正在為真正的價值和完整的產(chǎn)品體驗所取代。
在紅杉美國,我們?nèi)匀粓远ǖ叵嘈派墒紸I。這個市場起飛所需的條件在幾十年的時間里已經(jīng)累積起來,市場終于到來了。殺手級應用的出現(xiàn)和終端用戶需求的巨大規(guī)模加深了我們對市場的信心。
然而,Amara的法則——我們傾向于在短期內(nèi)高估一項技術(shù)的效果,在長期內(nèi)低估其效果的現(xiàn)象——正在發(fā)揮作用。我們在投資決策中運用耐心和判斷,密切關(guān)注創(chuàng)始人是如何解決價值問題的。公司使用的共享劇本來推動模型性能和產(chǎn)品體驗的界限,使我們對生成式AI的第二階段感到樂觀。
原文鏈接:https://www.sequoiacap.com/article/generative-ai-act-two/
— 完 —