大模型只有免費(fèi)了才能迎來應(yīng)用大爆發(fā)|昆侖萬維方漢@MEET2024
端側(cè)推理才是最終解決方案
編輯部 整理自 MEET2024
量子位 | 公眾號(hào) QbitAI
“只有免費(fèi)模式,才能讓所有用戶享受到服務(wù),才能迎來真正的應(yīng)用大爆發(fā)。”
在MEET 2024智能未來大會(huì)現(xiàn)場(chǎng),昆侖萬維董事長(zhǎng)兼CEO方漢在分享“大模型將如何介入普通人生活”時(shí),作出了如上發(fā)言。
昆侖萬維,一家以網(wǎng)游題材起家在A股上市的互聯(lián)網(wǎng)企業(yè),2020年GPT-3發(fā)布后組建第一支大模型團(tuán)隊(duì),2023年以來,先后發(fā)布了千億級(jí)別天工大模型和AI搜索產(chǎn)品。
并且,昆侖萬維還明確了自己AI 2.0時(shí)代的幾個(gè)側(cè)重點(diǎn):
從用戶需求倒推,推出AI搜索產(chǎn)品;讓用戶用最簡(jiǎn)便方式創(chuàng)造自己的Agents的平臺(tái);用端側(cè)推理實(shí)現(xiàn)AI時(shí)代的免費(fèi)模式……
端側(cè)推理一定會(huì)到來,對(duì)中小企業(yè)來說,建設(shè)自己的推斷能力仍然是非常好的機(jī)會(huì)。
方漢在現(xiàn)場(chǎng)還分享道,“應(yīng)用”是中國(guó)開發(fā)者最擅長(zhǎng)的領(lǐng)域。基于對(duì)產(chǎn)品商業(yè)模式的靈敏嗅覺,這一波AI大潮一定是“落地為王”。

為了完整體現(xiàn)方漢關(guān)于大模型在企業(yè)生產(chǎn)中的應(yīng)用場(chǎng)景的思考,量子位在不改變?cè)獾幕A(chǔ)上,對(duì)他的演講內(nèi)容進(jìn)行了編輯整理。
關(guān)于MEET 智能未來大會(huì):MEET大會(huì)是由量子位主辦的智能科技領(lǐng)域頂級(jí)商業(yè)峰會(huì),致力于探討前沿科技技術(shù)的落地與行業(yè)應(yīng)用。今年共有數(shù)十家主流媒體及直播平臺(tái)報(bào)道直播了MEET2024大會(huì),吸引了超過300萬行業(yè)用戶線上參會(huì),全網(wǎng)總曝光量累計(jì)超過2000萬。
演講要點(diǎn)
- AI搜索縮短搜索時(shí)間、提高信息獲取質(zhì)量,是所有用戶的痛點(diǎn)
- 大模型使用門檻太高,AGI的真正表現(xiàn)形式是Agent
- AI時(shí)代只有免費(fèi)模式才能迎來真正的應(yīng)用大爆發(fā)。
- 端側(cè)推理將為中小企業(yè)帶來機(jī)遇,中國(guó)開發(fā)者在應(yīng)用和商業(yè)模式方面具有優(yōu)勢(shì)
(以下為方漢演講分享全文)
大模型打開內(nèi)容生成領(lǐng)域顛覆性機(jī)會(huì)
今天與大家分享一下昆侖萬維在AGI與AIGC方向的探索之路,以及我們從做大模型開始到現(xiàn)在做AI Agent開發(fā)平臺(tái)的過程,也希望能夠給諸位在座的同仁起到一點(diǎn)參考作用。
首先簡(jiǎn)單介紹一下昆侖萬維,我們是一家在A股上市的互聯(lián)網(wǎng)企業(yè),目前在全球大概有近4億月活用戶,海外收入占比84%,今年前三季度營(yíng)收36.8億。目前我們分成三大業(yè)務(wù)板塊,其中最重要的板塊就是AGI與AIGC業(yè)務(wù)。
作為一家海外互聯(lián)網(wǎng)平臺(tái)型企業(yè),我們?yōu)槭裁磿?huì)介入大模型或者AGI和AIGC技術(shù)方向?
我們是以網(wǎng)游題材上市的,上市之后我們進(jìn)行了轉(zhuǎn)型,在海外大力做平臺(tái)型業(yè)務(wù),經(jīng)我們從頭孵化的大概千萬級(jí)別DAU的互聯(lián)網(wǎng)平臺(tái)有4—5家左右,全部都與內(nèi)容和社交賽道相關(guān)。
所以我們一直對(duì)于內(nèi)容生產(chǎn)領(lǐng)域的革新非常關(guān)注。在2020年GPT-3發(fā)布之后,我們非常敏銳地意識(shí)到了這可能是內(nèi)容生成領(lǐng)域顛覆性機(jī)會(huì)。
于是我們從2020年開始投入建立了一個(gè)團(tuán)隊(duì)做中文預(yù)訓(xùn)練大模型的研發(fā),2021年研發(fā)出了140億參數(shù)的中文預(yù)訓(xùn)練大模型,同時(shí)我們開始了音樂生成的研究。
2022年底我們開源了13B的中文預(yù)訓(xùn)練大模型,今年4月份發(fā)布千億級(jí)別的“天工”大模型;今年8月份推出了我們AI搜索產(chǎn)品。
基本上我們是國(guó)內(nèi)布局AGI和AIGC比較早的企業(yè),因此我們?cè)谶@方面的思索和對(duì)于AI未來終局的判斷,也是已進(jìn)行了將近三年左右。這三年來我們一直在想我們的終局是什么樣?我們?cè)谶@個(gè)終局里處于何種位置?以及我們?cè)趺炊x我們的發(fā)展方向。
AI搜索滿足所有用戶的痛點(diǎn)
我們目前已經(jīng)確定了六大AI業(yè)務(wù)矩陣。

首先,我們最重要的模塊之一是AI大模型,我們?cè)谶@方面不斷地進(jìn)行迭代和研發(fā)。
前面李開復(fù)老師也說了,一家公司有自己的模型建造能力非常重要的,首要原因是為了不受制于人;第二,對(duì)于很多應(yīng)用場(chǎng)景來說,你必須有自己的專有模型,你才能夠更好地去針對(duì)這個(gè)方向來進(jìn)行你的應(yīng)用落地。
天工大模型家族從千億參數(shù)大模型到3B、13B、70B大模型都已經(jīng)準(zhǔn)備好。11月3日我們通過了生成式人工智能服務(wù)暫行辦法備案,可以面向全社會(huì)開放服務(wù)。
第二,我們?cè)趪?guó)內(nèi)只推出了一款面向C端產(chǎn)品,就是AI搜索。
在海外,我們?nèi)匀槐形覀兊睦媳拘小獌?nèi)容和社交領(lǐng)域,在AI游戲、AI音樂、AI動(dòng)漫、AI社交方向都有相應(yīng)的產(chǎn)品,而且這些產(chǎn)品目前已經(jīng)從實(shí)驗(yàn)室走出來了,基本上研發(fā)都在1—2年以上,現(xiàn)在已經(jīng)開始在海外社區(qū)進(jìn)行測(cè)試,我們也相信在明年就會(huì)大爆發(fā)。
我們?yōu)楹我鯝I搜索?邏輯比較簡(jiǎn)單,并不是因?yàn)槲覀冇写竽P筒抛鏊阉鳎覀儚挠脩粜枨蟮雇频摹?/p>
大家知道搜索引擎從30年前出現(xiàn)到現(xiàn)在,搜索模式已經(jīng)很多年沒有變過了,搜索模式是什么?
我們進(jìn)入搜索引擎,輸入搜索詞,搜索引擎會(huì)輸出10個(gè)結(jié)果,用戶從10個(gè)結(jié)果里面挑前兩個(gè)或者前三個(gè)打開網(wǎng)頁進(jìn)行閱讀,閱讀完之后決定哪個(gè)網(wǎng)頁是他要的結(jié)果,把他要的結(jié)果通過大腦總結(jié)之后反饋成自己的答案,來滿足搜索需求。這個(gè)過程一般來說耗時(shí)3-10分鐘,我們認(rèn)為這個(gè)時(shí)間其實(shí)是任何人都很難縮短的。
一直到大模型的出現(xiàn),我們會(huì)發(fā)現(xiàn)如果用大模型來替代用戶進(jìn)行“打開網(wǎng)頁——閱讀網(wǎng)頁”的這個(gè)時(shí)間,就可以把每次搜索的時(shí)間從3—10分鐘壓縮到5—10秒,只需要很短的時(shí)間就能有一個(gè)完整的總結(jié)結(jié)果。
這會(huì)給用戶體驗(yàn)帶來極大的改變,所以AI搜索本質(zhì)上就是為了縮短用戶自行搜索的時(shí)間,并且能夠提高用戶獲取信息的質(zhì)量。
我們認(rèn)為這就是所有用戶的痛點(diǎn),“更快即更好”。我們做AI搜索也是本著這個(gè)目的來給用戶提供服務(wù)。

我們?cè)?strong>AI多模態(tài)場(chǎng)景也有很多探索,比如,我們已經(jīng)有AI游戲、AI音樂和AI漫畫,其中在漫畫領(lǐng)域和音樂領(lǐng)域我們分別投入1—2年以上研發(fā)時(shí)間,目前在海外測(cè)試過程中非常受創(chuàng)作者歡迎,已經(jīng)有創(chuàng)作者利用我們AI音樂可以去線下打榜,在印尼音樂排行榜進(jìn)入前100名,AI漫畫領(lǐng)域有專業(yè)漫畫師使用我們AI漫畫工具創(chuàng)作真正的漫畫。
同時(shí),我們提供了天工開放平臺(tái)給更多用戶,更多企業(yè)用戶和個(gè)人開發(fā)者使用我們大模型,這里邊比較重要的是天工SkyAgents平臺(tái)。
AGI的真正表現(xiàn)形式是Agent
我重點(diǎn)分享一下我們最近為什么推出SkyAgents平臺(tái)。
實(shí)際上大模型本身大家用對(duì)話式大模型特別多,大家忙著跟大模型對(duì)話聊天,為什么說大模型是AGI不是Chatboot,本質(zhì)上因?yàn)榇竽P退膒lanning能力導(dǎo)致了它像AGI。
本質(zhì)上就現(xiàn)在大模型已經(jīng)有了作為大腦的初步能力,作為大腦的初步能力就是規(guī)劃能力,規(guī)劃能力本身其實(shí)是沒有作用的,為什么?因?yàn)榇竽P捅旧碇粫?huì)用文字方式、文本方式輸出,這種輸出是不能起到任何作用的。
怎么樣把文本的規(guī)劃能力轉(zhuǎn)成實(shí)際的工作能力呢?就需要給規(guī)劃能力接上很多外部的API,調(diào)用外部的API,比如說讀取文件,寫入文件,讀取數(shù)據(jù)展現(xiàn)數(shù)據(jù)、作圖,以及調(diào)用系統(tǒng)API完成功能,只有這樣才能夠讓大模型真正的落地。
為了實(shí)現(xiàn)這個(gè)功能,現(xiàn)在大家也知道OpenAI開放了很多大模型API,需要用戶有比較強(qiáng)的編程能力調(diào)用API、調(diào)用大模型規(guī)劃能力,去實(shí)現(xiàn)自己的大模型的落地。
我們認(rèn)為,這個(gè)門檻還是太高了。
在中國(guó)有編程能力的人可能就幾千萬人,剩下的十幾億人怎么辦?
我們認(rèn)為這時(shí)候需要Agents這個(gè)東西,低代碼的、大模型的二次開發(fā)接口,讓所有用戶都能夠通過Agents讓大模型替自己做實(shí)際的工作,以及更好地落地。
我們推出了SkyAgents產(chǎn)品,它有多樣化應(yīng)用場(chǎng)景,讓用戶用最簡(jiǎn)單方式創(chuàng)造自己的Agents就能滿足很多常規(guī)需求。
大家也知道在大模型領(lǐng)域最有商業(yè)前景的一定是金融、能源、教育這些大的場(chǎng)景。但更多的個(gè)人用戶的一些非常小的微場(chǎng)景需求如何滿足?這時(shí)候用Agents多樣化應(yīng)用場(chǎng)景和迭代,用低代碼建設(shè)方式,就能讓用戶完成自己的工作。
我們天工SkyAgents可以用零代碼打造智能體,用非常簡(jiǎn)單的模板幫助用戶應(yīng)用,讓用戶自己上傳EXCEL和數(shù)據(jù)文件,進(jìn)行數(shù)據(jù)導(dǎo)入。
同時(shí),我們對(duì)大模型的規(guī)劃能力也做了一定的加強(qiáng),讓大模型更好執(zhí)行用戶需求,目前我們產(chǎn)品已經(jīng)開放注冊(cè)了。

我們從2020年就開始思考AI大模型最終以什么樣的形式介入到我們生活中間去。
其實(shí)有很多種方法,所有方法和途徑都繞不開一個(gè)問題,現(xiàn)在AI訓(xùn)練成本是天價(jià),其實(shí)大家不知道AI推斷成本也非常高昂,這就導(dǎo)致了即使像微軟OpenAI這樣的企業(yè)仍然通過訂閱制來滿足高端用戶的需求,只有高端用戶才能夠去享受現(xiàn)在最好的AI推理服務(wù)。
我們認(rèn)為這與最早中國(guó)互聯(lián)網(wǎng)或者全球互聯(lián)網(wǎng)初始發(fā)展階段是一樣的模式。我記得非常清楚,我最早用的是中科院的互聯(lián)網(wǎng),在最早用撥號(hào)上網(wǎng)的時(shí)代,我下1.2G的東西,費(fèi)用達(dá)到幾百元。
這在現(xiàn)在大家都是無法想象的,現(xiàn)在1.2G的移動(dòng)流量可能也就幾毛錢都不到,這證明了什么?那個(gè)時(shí)代互聯(lián)網(wǎng)為什么不能普及,就是因?yàn)橘M(fèi)用高昂。
我們認(rèn)為,只有免費(fèi)模式,才能讓所有用戶享受到服務(wù),才能迎來真正的應(yīng)用大爆發(fā)。
端側(cè)推理才是最終解決方案
如何實(shí)現(xiàn)AI時(shí)代的免費(fèi)模式呢?我認(rèn)為有三個(gè)途徑。
第一個(gè)途徑是技術(shù)迭代。我們清楚地看到AI的摩爾定律已經(jīng)出現(xiàn),所有大模型的能力是每年10倍的往上漲,所有大模型的推斷成本以每年10倍的速度往下降。
第二個(gè)途徑,也是中國(guó)人最擅長(zhǎng)的,在產(chǎn)品設(shè)計(jì)上進(jìn)行區(qū)分。我們?cè)诋a(chǎn)品設(shè)計(jì)上如果采用UGC模式,即創(chuàng)作者大規(guī)模使用AI,而普通消費(fèi)者并不使用AI推理,這個(gè)模式也是能成立的。
但只有第三個(gè)途徑——端側(cè)推理才是最終的解決方案。
什么叫端側(cè)推理?在手機(jī)移動(dòng)設(shè)備上可以進(jìn)行的AI推理,目前手機(jī)上已經(jīng)實(shí)現(xiàn)了1.3B和3B模型的推理,我相信1—2年內(nèi)手機(jī)側(cè)一定可以搭載13B的大模型。
而到那個(gè)時(shí)候用戶購(gòu)買手機(jī)的費(fèi)用中就包含了將來要為推理所支付的費(fèi)用。
所有的推理一旦到端側(cè),最終結(jié)果是什么?就會(huì)出現(xiàn)真正的殺手級(jí)的應(yīng)用。因?yàn)樗腔诿赓M(fèi)模式,才能在最大程度地向普通用戶普及,這就是我們對(duì)AI模型如何去進(jìn)行免費(fèi)模式的一個(gè)判斷。
最后,我想和大家說一下,這一波AI的機(jī)會(huì)對(duì)于所有企業(yè)都是非常公正的。
端側(cè)推理一定會(huì)到來,這對(duì)于中小企業(yè)來說建設(shè)自己的推斷能力仍然是非常好的機(jī)會(huì)。
而我們中國(guó)的開發(fā)者最擅長(zhǎng)的是“應(yīng)用為王”,我們對(duì)于產(chǎn)品的商業(yè)模式的嗅覺是最靈敏的。
這一波AI一定是大潮將起、落地為王,謝謝大家。
- 4o-mini華人領(lǐng)隊(duì)也離職了,這次不怪小扎2025-08-19
- 宇樹機(jī)器人“撞人逃逸”火到國(guó)外,王興興回應(yīng):下次不遙控了2025-08-16
- 突破Claude-4編程上限!自進(jìn)化Agent框架拿下新SOTA,已開源2025-08-19
- 讓OpenAI只領(lǐng)先5天,百川發(fā)布推理新模型,掀翻醫(yī)療垂域開源天花板2025-08-11