昆侖萬維CEO方漢:AIGC以低成本達(dá)到80分水平,腰部工作者將大概率被淘汰 | 中國AIGC產(chǎn)業(yè)峰會(huì)
要么力爭上游,要么老老實(shí)實(shí)當(dāng)AIGC操作員
豐色 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
“如果人類的水平達(dá)不到80分,就會(huì)被AI淘汰?!?/p>
在中國AIGC產(chǎn)業(yè)峰會(huì)現(xiàn)場,昆侖萬維CEO方漢拋出這樣一個(gè)大膽預(yù)測。
在他看來,目前AIGC對(duì)存量知識(shí)的理解與表達(dá)已經(jīng)達(dá)到80分的水平,行業(yè)從業(yè)者將隨之形成兩極分化的局面:
一部分人成為上游管理員,一部分成為底層AIGC操作員,兩者的工作產(chǎn)量都會(huì)極大提升。
剩下的達(dá)不到80分的腰部從業(yè)者,大概率被淘汰。

方漢畢業(yè)于中國科學(xué)技術(shù)大學(xué)近代物理系,擁有29年互聯(lián)網(wǎng)從業(yè)經(jīng)驗(yàn),從1994年開始參與和倡導(dǎo)開源運(yùn)動(dòng),是國內(nèi)最早的網(wǎng)絡(luò)安全專家,負(fù)責(zé)研發(fā)了國內(nèi)市場占有率最高的網(wǎng)頁游戲《三國風(fēng)云》。
2008年3月,他協(xié)助周亞輝先生創(chuàng)立昆侖萬維,后者于2015年A股上市。
在本次大會(huì)上,他對(duì)昆侖萬維介入到類ChatGPT大模型開發(fā)的契機(jī)、AIGC對(duì)內(nèi)容從業(yè)者的影響、三種AIGC商業(yè)路徑、以及開源和預(yù)訓(xùn)練大模型在其中的重要性進(jìn)行了一一分享。
為了完整體現(xiàn)他的思考,在不改變原意的基礎(chǔ)上,量子位對(duì)其演講內(nèi)容進(jìn)行了編輯整理。
演講要點(diǎn):
- AIGC原本含義比較狹窄,主要指文本、圖像以及視頻還有音樂等人類可以消費(fèi)的娛樂內(nèi)容的生成。ChatGPT的出現(xiàn)把AIGC的范疇給泛化了。
- 對(duì)存量知識(shí)的理解與表達(dá),AIGC將以低廉的成本做到80分的水準(zhǔn)。
- 由于兩極分化,AIGC領(lǐng)域的腰部工作者要么力爭上游做頭部管理員,要不就老老實(shí)實(shí)成為AIGC操作員。
- 在AIGC領(lǐng)域,文生圖在同一個(gè)賽道出現(xiàn)了三種完全不同的商業(yè)模式,互為補(bǔ)充:
(1)Stability.AI打造的開源生態(tài);
(2)Midjourney打造的SaaS或者M(jìn)odel Service生態(tài);
(3)Adobe Firefly打造的傳統(tǒng)生態(tài)工具,將所有AIGC功能集成到工具里。
- 只有開源模式可以滿足用戶的長尾需求;只有開源模式才可以滿足中小企業(yè)的增長需求。
- 需要注意的是,我們不能只盯著目前AIGC進(jìn)展,認(rèn)為預(yù)訓(xùn)練大模型已經(jīng)突破傳統(tǒng)AIGC范疇進(jìn)入AGI領(lǐng)域。實(shí)際上,各種AIGC工具能力仍然受到預(yù)訓(xùn)練大模型限制,尤其GPT-4大模型出現(xiàn)后這個(gè)現(xiàn)象更加突出。
以下為方漢演講全文:
ChatGPT的出現(xiàn)把AIGC的范疇給泛化了
AIGC這個(gè)名字剛提出來的時(shí)候,在美國叫生成式AI。
國內(nèi)UGC、PGC的概念深入人心,所以造了一個(gè)詞叫“AIGC”。
AIGC原本含義比較狹窄,主要指文本、圖像以及視頻還有音樂等人類可以消費(fèi)的娛樂內(nèi)容的生成。
ChatGPT的出現(xiàn)把AIGC的范疇給泛化了,ChatGPT屬于AGI(通用人工智能)范疇。
今天我的分享更多偏向原有含義,即人類娛樂內(nèi)容的生成。
首先,我簡單介紹一下昆侖萬維介入到類ChatGPT大模型開發(fā)的契機(jī)。

昆侖萬維2015年A股上市,當(dāng)時(shí)是以網(wǎng)游題材上市的,上市后在海外進(jìn)行多元化發(fā)展,有瀏覽器、社交產(chǎn)品、游戲業(yè)務(wù)。
昆侖萬維是內(nèi)容廠商,對(duì)于所有內(nèi)容生成方面的科技進(jìn)步都非常敏感。
早在2020年6月份GPT-3剛剛出現(xiàn)的時(shí)候,管理層和技術(shù)領(lǐng)導(dǎo)者都去進(jìn)行嘗試。
當(dāng)時(shí)我們判斷這是內(nèi)容生成領(lǐng)域一個(gè)里程碑,沒想到兩年后變成通用人工智能突破口。
也是從那時(shí)我們就已經(jīng)決定要跟進(jìn)這件事情,因?yàn)槲覀冊趦?nèi)容生成領(lǐng)域絕對(duì)不允許落后。
具體而言,昆侖萬維開始布局AIGC和大模型領(lǐng)域,與奇點(diǎn)智源合作開始進(jìn)行大模型訓(xùn)練工作。
目前為止除了通用大模型訓(xùn)練之外,昆侖萬維在音樂生成領(lǐng)域也處于國內(nèi)和國際前沿地位。

我們的愿景是推進(jìn)開源AIGC算法和模型社區(qū)的發(fā)展壯大。
昆侖萬維作為中國領(lǐng)先互聯(lián)網(wǎng)出海企業(yè)、技術(shù)驅(qū)動(dòng)全球互聯(lián)網(wǎng)公司,致力于前沿技術(shù)追蹤和研發(fā),有相當(dāng)?shù)募夹g(shù)積累和人才儲(chǔ)備。
我們的技術(shù)團(tuán)隊(duì)持續(xù)進(jìn)行算法技術(shù)創(chuàng)新,積極推進(jìn)模型算法開源以及社區(qū)發(fā)展壯大,基于全球每月平均4億活躍用戶以及豐富行業(yè)經(jīng)驗(yàn),助力AIGC應(yīng)用和生態(tài)的快速落地以及成長。
以下分享AIGC在具體商業(yè)模式落地方面的思考。
AIGC從業(yè)者出現(xiàn)兩極分化
我們觀察到一個(gè)有趣的現(xiàn)象,對(duì)于UGC(用戶生成內(nèi)容)的平臺(tái)如小紅書、知乎、抖音、快手等,用戶創(chuàng)造內(nèi)容的門檻每降低一倍,用戶創(chuàng)造內(nèi)容的數(shù)量就會(huì)增加十倍。

舉個(gè)例子,在手機(jī)攝像頭出現(xiàn)之前,人類拍攝視頻一定是靠專業(yè)的攝像機(jī)和數(shù)碼相機(jī)。
手機(jī)出現(xiàn)之后,攝像的門檻變低,視頻內(nèi)容數(shù)量出現(xiàn)了大爆發(fā)。
這促成了快手和抖音的發(fā)展,進(jìn)而中國UGC領(lǐng)域產(chǎn)生了巨大突破。
C端工具的商業(yè)邏輯其實(shí)是社區(qū),B端工具的商業(yè)邏輯是功能完備性。
C端工具用快手、抖音拍視頻,目的絕不是為了做工具,而是讓用戶做出來內(nèi)容通過社區(qū)分發(fā),這是C端工具邏輯。
B端工具的商業(yè)邏輯就像Adobe的PhotoShop全家桶、微軟Office全家桶,以功能完備性來獲得用戶的青睞。
可見,隨著AIGC技術(shù)的進(jìn)展,它們將對(duì)內(nèi)容生產(chǎn)者產(chǎn)生巨大影響。
不得不承認(rèn),現(xiàn)在AIGC對(duì)存量知識(shí)的理解與表達(dá)還遠(yuǎn)遠(yuǎn)沒有到100分水準(zhǔn),但以低廉的成本做到80分沒有任何問題。
如果人類自己的水平也只是80分,我們的工作一定會(huì)被AIGC替代,而80分以上的人將去管理AIGC操作員,完成曾經(jīng)需要腰部作者完成的工作。

因此未來,頭部工作者產(chǎn)量極大提升,作為AIGC操作員的底部工作者的生產(chǎn)能力也會(huì)得到極大提升。
很不幸,腰部工作者大概率會(huì)被淘汰。
那么,我們要么力爭上游做頭部工作者,要么就老老實(shí)實(shí)當(dāng)AIGC操作員。
只有開源模式可以滿足用戶的長尾需求
在AIGC領(lǐng)域,文生圖在同一個(gè)賽道出現(xiàn)了三種完全不同的商業(yè)模式。
第一種:Stability.AI打造的開源生態(tài);
第二種:Midjourney打造的SaaS或者M(jìn)odel Service生態(tài);
第三種:Adobe Firefly打造的傳統(tǒng)生態(tài)工具,將所有AIGC功能集成到工具里。
這三種商業(yè)路徑,不止是在文生圖,在文生圖像、文生音樂還是小說創(chuàng)作領(lǐng)域都會(huì)長期存在,且三種模式互為補(bǔ)充。

最終的C端用戶會(huì)傾向于使用Midjourney完成工作,如現(xiàn)在的電商從業(yè)者,大量使用Midjourney來進(jìn)行電商廣告素材創(chuàng)作。
Adobe Firefly則契合一些傳統(tǒng)的大B企業(yè)的需求,B端用戶會(huì)使用Adobe Firefly來作為自己的創(chuàng)作工具。
Stability.AI是一種開源模式,特別適合在這個(gè)領(lǐng)域進(jìn)行創(chuàng)業(yè)的廣大中小企業(yè)。
通過開源模式來進(jìn)行自己的改裝與改進(jìn),來滿足長尾需求,這是另外兩個(gè)模式無法提供的功能。
開源大模型是商業(yè)閉源大模型的有力補(bǔ)充和替代。
大家可以把ChatGPT想成早期Windows,Windows的存在是整個(gè)電腦商業(yè)軟件的一個(gè)基石,也是絕大多數(shù)人的生產(chǎn)工具。
Linux通過30年的努力變成Windows的替代,開源大模型也一定會(huì)出現(xiàn)。
因?yàn)橹挥虚_源模式可以滿足用戶的長尾需求。

還是以Linux為例,全世界所有的云廠商、大型互聯(lián)網(wǎng)企業(yè)都以Linux為自己的服務(wù)底座。
要滿足自己的長尾需求,只有一個(gè)選擇,就是用Linux進(jìn)行改裝。
所以,我們也說,只有開源模式才可以滿足中小企業(yè)的增長需求。
做一個(gè)具體的分析,Stable Diffusion的出現(xiàn)比OpenAI DALL·E 2晚了整整6個(gè)月,在性能、質(zhì)量上都低于DALL·E 2和Midjourney,但依然有眾多用戶。
因?yàn)樗情_源的,進(jìn)步速度是難以想象的快。
Stable Diffusion催生ControlNet、T2I-Adapter、Composer,以及LoRA訓(xùn)練技巧。
在它上面進(jìn)行二次開發(fā)的人數(shù)眾多,新特性也在不斷地涌現(xiàn)。
ControlNet是目前為止在文生圖領(lǐng)域唯一解決一致性問題的途徑,極大地降低了用戶的創(chuàng)作成本,提高了創(chuàng)作的可玩性。

ControlNet開源僅2周,它的Star數(shù)就超過了1萬。
與此同時(shí),開源社區(qū)也極大地降低了用戶的使用門檻。
例如HuggingFace提供了大量的模型托管以及通用的模型訓(xùn)練來框架diffusers,stablediffusion-webui開發(fā)了完善的一套Demo平臺(tái),Civitai貢獻(xiàn)了海量風(fēng)格化LoRA權(quán)重,整個(gè)社區(qū)也蓬勃發(fā)展起來了。
預(yù)訓(xùn)練大模型能力決定AIGC能力上限
需要注意的是,我們不能只盯著目前AIGC進(jìn)展,認(rèn)為預(yù)訓(xùn)練大模型已經(jīng)突破傳統(tǒng)AIGC范疇進(jìn)入AGI領(lǐng)域。
實(shí)際上,各種AIGC工具能力仍然受到預(yù)訓(xùn)練大模型限制,尤其GPT-4大模型出現(xiàn)后這個(gè)現(xiàn)象更加突出。
AIGC領(lǐng)域的企業(yè)對(duì)于大模型本身的需求仍然非常大,也是持續(xù)的。
目前,還存在這樣幾個(gè)大問題。
首先,AIGC發(fā)展起來之后是否會(huì)導(dǎo)致優(yōu)質(zhì)內(nèi)容的稀缺?
因?yàn)锳I生成的內(nèi)容會(huì)大量污染原創(chuàng)的內(nèi)容。
其次,如何解決大模型底座導(dǎo)致的偏見?
比如OpenAI、ChatGPT生成的內(nèi)容就存在偏見,這個(gè)問題值得關(guān)注。
最后,版權(quán)、信息偽造問題。
Adobe Firefly提出了一個(gè)新的模式,它訓(xùn)練的所有內(nèi)容與作者達(dá)成協(xié)議,通過對(duì)model收費(fèi)給內(nèi)容作者分成。
從監(jiān)管到行業(yè)自律,我們可做的事情非常多,而且迫在眉睫。
關(guān)于未來AIGC的展望(僅指娛樂內(nèi)容AIGC)——
第一,AIGC對(duì)整個(gè)社會(huì)最大的意義是低成本終極解決方案,這一點(diǎn)毋庸置疑,所有人類都有消費(fèi)內(nèi)容產(chǎn)生多巴胺的權(quán)力;
第二,AIGC將涌現(xiàn)新的范式,徹底改變藝術(shù)創(chuàng)作生產(chǎn)方式;
最后,AIGC導(dǎo)致內(nèi)容生成的極大發(fā)展,會(huì)使得VR和元宇宙變得更加可行。
謝謝大家。