昆侖萬維CEO方漢:AIGC以低成本達到80分水平,腰部工作者將大概率被淘汰 | 中國AIGC產(chǎn)業(yè)峰會
要么力爭上游,要么老老實實當AIGC操作員
豐色 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
“如果人類的水平達不到80分,就會被AI淘汰。”
在中國AIGC產(chǎn)業(yè)峰會現(xiàn)場,昆侖萬維CEO方漢拋出這樣一個大膽預測。
在他看來,目前AIGC對存量知識的理解與表達已經(jīng)達到80分的水平,行業(yè)從業(yè)者將隨之形成兩極分化的局面:
一部分人成為上游管理員,一部分成為底層AIGC操作員,兩者的工作產(chǎn)量都會極大提升。
剩下的達不到80分的腰部從業(yè)者,大概率被淘汰。

方漢畢業(yè)于中國科學技術(shù)大學近代物理系,擁有29年互聯(lián)網(wǎng)從業(yè)經(jīng)驗,從1994年開始參與和倡導開源運動,是國內(nèi)最早的網(wǎng)絡安全專家,負責研發(fā)了國內(nèi)市場占有率最高的網(wǎng)頁游戲《三國風云》。
2008年3月,他協(xié)助周亞輝先生創(chuàng)立昆侖萬維,后者于2015年A股上市。
在本次大會上,他對昆侖萬維介入到類ChatGPT大模型開發(fā)的契機、AIGC對內(nèi)容從業(yè)者的影響、三種AIGC商業(yè)路徑、以及開源和預訓練大模型在其中的重要性進行了一一分享。
為了完整體現(xiàn)他的思考,在不改變原意的基礎上,量子位對其演講內(nèi)容進行了編輯整理。
演講要點:
- AIGC原本含義比較狹窄,主要指文本、圖像以及視頻還有音樂等人類可以消費的娛樂內(nèi)容的生成。ChatGPT的出現(xiàn)把AIGC的范疇給泛化了。
- 對存量知識的理解與表達,AIGC將以低廉的成本做到80分的水準。
- 由于兩極分化,AIGC領(lǐng)域的腰部工作者要么力爭上游做頭部管理員,要不就老老實實成為AIGC操作員。
- 在AIGC領(lǐng)域,文生圖在同一個賽道出現(xiàn)了三種完全不同的商業(yè)模式,互為補充:
(1)Stability.AI打造的開源生態(tài);
(2)Midjourney打造的SaaS或者Model Service生態(tài);
(3)Adobe Firefly打造的傳統(tǒng)生態(tài)工具,將所有AIGC功能集成到工具里。
- 只有開源模式可以滿足用戶的長尾需求;只有開源模式才可以滿足中小企業(yè)的增長需求。
- 需要注意的是,我們不能只盯著目前AIGC進展,認為預訓練大模型已經(jīng)突破傳統(tǒng)AIGC范疇進入AGI領(lǐng)域。實際上,各種AIGC工具能力仍然受到預訓練大模型限制,尤其GPT-4大模型出現(xiàn)后這個現(xiàn)象更加突出。
以下為方漢演講全文:
ChatGPT的出現(xiàn)把AIGC的范疇給泛化了
AIGC這個名字剛提出來的時候,在美國叫生成式AI。
國內(nèi)UGC、PGC的概念深入人心,所以造了一個詞叫“AIGC”。
AIGC原本含義比較狹窄,主要指文本、圖像以及視頻還有音樂等人類可以消費的娛樂內(nèi)容的生成。
ChatGPT的出現(xiàn)把AIGC的范疇給泛化了,ChatGPT屬于AGI(通用人工智能)范疇。
今天我的分享更多偏向原有含義,即人類娛樂內(nèi)容的生成。
首先,我簡單介紹一下昆侖萬維介入到類ChatGPT大模型開發(fā)的契機。

昆侖萬維2015年A股上市,當時是以網(wǎng)游題材上市的,上市后在海外進行多元化發(fā)展,有瀏覽器、社交產(chǎn)品、游戲業(yè)務。
昆侖萬維是內(nèi)容廠商,對于所有內(nèi)容生成方面的科技進步都非常敏感。
早在2020年6月份GPT-3剛剛出現(xiàn)的時候,管理層和技術(shù)領(lǐng)導者都去進行嘗試。
當時我們判斷這是內(nèi)容生成領(lǐng)域一個里程碑,沒想到兩年后變成通用人工智能突破口。
也是從那時我們就已經(jīng)決定要跟進這件事情,因為我們在內(nèi)容生成領(lǐng)域絕對不允許落后。
具體而言,昆侖萬維開始布局AIGC和大模型領(lǐng)域,與奇點智源合作開始進行大模型訓練工作。
目前為止除了通用大模型訓練之外,昆侖萬維在音樂生成領(lǐng)域也處于國內(nèi)和國際前沿地位。

我們的愿景是推進開源AIGC算法和模型社區(qū)的發(fā)展壯大。
昆侖萬維作為中國領(lǐng)先互聯(lián)網(wǎng)出海企業(yè)、技術(shù)驅(qū)動全球互聯(lián)網(wǎng)公司,致力于前沿技術(shù)追蹤和研發(fā),有相當?shù)募夹g(shù)積累和人才儲備。
我們的技術(shù)團隊持續(xù)進行算法技術(shù)創(chuàng)新,積極推進模型算法開源以及社區(qū)發(fā)展壯大,基于全球每月平均4億活躍用戶以及豐富行業(yè)經(jīng)驗,助力AIGC應用和生態(tài)的快速落地以及成長。
以下分享AIGC在具體商業(yè)模式落地方面的思考。
AIGC從業(yè)者出現(xiàn)兩極分化
我們觀察到一個有趣的現(xiàn)象,對于UGC(用戶生成內(nèi)容)的平臺如小紅書、知乎、抖音、快手等,用戶創(chuàng)造內(nèi)容的門檻每降低一倍,用戶創(chuàng)造內(nèi)容的數(shù)量就會增加十倍。

舉個例子,在手機攝像頭出現(xiàn)之前,人類拍攝視頻一定是靠專業(yè)的攝像機和數(shù)碼相機。
手機出現(xiàn)之后,攝像的門檻變低,視頻內(nèi)容數(shù)量出現(xiàn)了大爆發(fā)。
這促成了快手和抖音的發(fā)展,進而中國UGC領(lǐng)域產(chǎn)生了巨大突破。
C端工具的商業(yè)邏輯其實是社區(qū),B端工具的商業(yè)邏輯是功能完備性。
C端工具用快手、抖音拍視頻,目的絕不是為了做工具,而是讓用戶做出來內(nèi)容通過社區(qū)分發(fā),這是C端工具邏輯。
B端工具的商業(yè)邏輯就像Adobe的PhotoShop全家桶、微軟Office全家桶,以功能完備性來獲得用戶的青睞。
可見,隨著AIGC技術(shù)的進展,它們將對內(nèi)容生產(chǎn)者產(chǎn)生巨大影響。
不得不承認,現(xiàn)在AIGC對存量知識的理解與表達還遠遠沒有到100分水準,但以低廉的成本做到80分沒有任何問題。
如果人類自己的水平也只是80分,我們的工作一定會被AIGC替代,而80分以上的人將去管理AIGC操作員,完成曾經(jīng)需要腰部作者完成的工作。

因此未來,頭部工作者產(chǎn)量極大提升,作為AIGC操作員的底部工作者的生產(chǎn)能力也會得到極大提升。
很不幸,腰部工作者大概率會被淘汰。
那么,我們要么力爭上游做頭部工作者,要么就老老實實當AIGC操作員。
只有開源模式可以滿足用戶的長尾需求
在AIGC領(lǐng)域,文生圖在同一個賽道出現(xiàn)了三種完全不同的商業(yè)模式。
第一種:Stability.AI打造的開源生態(tài);
第二種:Midjourney打造的SaaS或者Model Service生態(tài);
第三種:Adobe Firefly打造的傳統(tǒng)生態(tài)工具,將所有AIGC功能集成到工具里。
這三種商業(yè)路徑,不止是在文生圖,在文生圖像、文生音樂還是小說創(chuàng)作領(lǐng)域都會長期存在,且三種模式互為補充。

最終的C端用戶會傾向于使用Midjourney完成工作,如現(xiàn)在的電商從業(yè)者,大量使用Midjourney來進行電商廣告素材創(chuàng)作。
Adobe Firefly則契合一些傳統(tǒng)的大B企業(yè)的需求,B端用戶會使用Adobe Firefly來作為自己的創(chuàng)作工具。
Stability.AI是一種開源模式,特別適合在這個領(lǐng)域進行創(chuàng)業(yè)的廣大中小企業(yè)。
通過開源模式來進行自己的改裝與改進,來滿足長尾需求,這是另外兩個模式無法提供的功能。
開源大模型是商業(yè)閉源大模型的有力補充和替代。
大家可以把ChatGPT想成早期Windows,Windows的存在是整個電腦商業(yè)軟件的一個基石,也是絕大多數(shù)人的生產(chǎn)工具。
Linux通過30年的努力變成Windows的替代,開源大模型也一定會出現(xiàn)。
因為只有開源模式可以滿足用戶的長尾需求。

還是以Linux為例,全世界所有的云廠商、大型互聯(lián)網(wǎng)企業(yè)都以Linux為自己的服務底座。
要滿足自己的長尾需求,只有一個選擇,就是用Linux進行改裝。
所以,我們也說,只有開源模式才可以滿足中小企業(yè)的增長需求。
做一個具體的分析,Stable Diffusion的出現(xiàn)比OpenAI DALL·E 2晚了整整6個月,在性能、質(zhì)量上都低于DALL·E 2和Midjourney,但依然有眾多用戶。
因為它是開源的,進步速度是難以想象的快。
Stable Diffusion催生ControlNet、T2I-Adapter、Composer,以及LoRA訓練技巧。
在它上面進行二次開發(fā)的人數(shù)眾多,新特性也在不斷地涌現(xiàn)。
ControlNet是目前為止在文生圖領(lǐng)域唯一解決一致性問題的途徑,極大地降低了用戶的創(chuàng)作成本,提高了創(chuàng)作的可玩性。

ControlNet開源僅2周,它的Star數(shù)就超過了1萬。
與此同時,開源社區(qū)也極大地降低了用戶的使用門檻。
例如HuggingFace提供了大量的模型托管以及通用的模型訓練來框架diffusers,stablediffusion-webui開發(fā)了完善的一套Demo平臺,Civitai貢獻了海量風格化LoRA權(quán)重,整個社區(qū)也蓬勃發(fā)展起來了。
預訓練大模型能力決定AIGC能力上限
需要注意的是,我們不能只盯著目前AIGC進展,認為預訓練大模型已經(jīng)突破傳統(tǒng)AIGC范疇進入AGI領(lǐng)域。
實際上,各種AIGC工具能力仍然受到預訓練大模型限制,尤其GPT-4大模型出現(xiàn)后這個現(xiàn)象更加突出。
AIGC領(lǐng)域的企業(yè)對于大模型本身的需求仍然非常大,也是持續(xù)的。
目前,還存在這樣幾個大問題。
首先,AIGC發(fā)展起來之后是否會導致優(yōu)質(zhì)內(nèi)容的稀缺?
因為AI生成的內(nèi)容會大量污染原創(chuàng)的內(nèi)容。
其次,如何解決大模型底座導致的偏見?
比如OpenAI、ChatGPT生成的內(nèi)容就存在偏見,這個問題值得關(guān)注。
最后,版權(quán)、信息偽造問題。
Adobe Firefly提出了一個新的模式,它訓練的所有內(nèi)容與作者達成協(xié)議,通過對model收費給內(nèi)容作者分成。
從監(jiān)管到行業(yè)自律,我們可做的事情非常多,而且迫在眉睫。
關(guān)于未來AIGC的展望(僅指娛樂內(nèi)容AIGC)——
第一,AIGC對整個社會最大的意義是低成本終極解決方案,這一點毋庸置疑,所有人類都有消費內(nèi)容產(chǎn)生多巴胺的權(quán)力;
第二,AIGC將涌現(xiàn)新的范式,徹底改變藝術(shù)創(chuàng)作生產(chǎn)方式;
最后,AIGC導致內(nèi)容生成的極大發(fā)展,會使得VR和元宇宙變得更加可行。
謝謝大家。
- 北大開源最強aiXcoder-7B代碼大模型!聚焦真實開發(fā)場景,專為企業(yè)私有部署設計2024-04-09
- 剛剛,圖靈獎揭曉!史上首位數(shù)學和計算機最高獎“雙料王”出現(xiàn)了2024-04-10
- 8.3K Stars!《多模態(tài)大語言模型綜述》重大升級2024-04-10
- 谷歌最強大模型免費開放了!長音頻理解功能獨一份,100萬上下文敞開用2024-04-10