大模型只有免費了才能迎來應(yīng)用大爆發(fā)|昆侖萬維方漢@MEET2024
端側(cè)推理才是最終解決方案
編輯部 整理自 MEET2024
量子位 | 公眾號 QbitAI
“只有免費模式,才能讓所有用戶享受到服務(wù),才能迎來真正的應(yīng)用大爆發(fā)。”
在MEET 2024智能未來大會現(xiàn)場,昆侖萬維董事長兼CEO方漢在分享“大模型將如何介入普通人生活”時,作出了如上發(fā)言。
昆侖萬維,一家以網(wǎng)游題材起家在A股上市的互聯(lián)網(wǎng)企業(yè),2020年GPT-3發(fā)布后組建第一支大模型團隊,2023年以來,先后發(fā)布了千億級別天工大模型和AI搜索產(chǎn)品。
并且,昆侖萬維還明確了自己AI 2.0時代的幾個側(cè)重點:
從用戶需求倒推,推出AI搜索產(chǎn)品;讓用戶用最簡便方式創(chuàng)造自己的Agents的平臺;用端側(cè)推理實現(xiàn)AI時代的免費模式……
端側(cè)推理一定會到來,對中小企業(yè)來說,建設(shè)自己的推斷能力仍然是非常好的機會。
方漢在現(xiàn)場還分享道,“應(yīng)用”是中國開發(fā)者最擅長的領(lǐng)域。基于對產(chǎn)品商業(yè)模式的靈敏嗅覺,這一波AI大潮一定是“落地為王”。

為了完整體現(xiàn)方漢關(guān)于大模型在企業(yè)生產(chǎn)中的應(yīng)用場景的思考,量子位在不改變原意的基礎(chǔ)上,對他的演講內(nèi)容進行了編輯整理。
關(guān)于MEET 智能未來大會:MEET大會是由量子位主辦的智能科技領(lǐng)域頂級商業(yè)峰會,致力于探討前沿科技技術(shù)的落地與行業(yè)應(yīng)用。今年共有數(shù)十家主流媒體及直播平臺報道直播了MEET2024大會,吸引了超過300萬行業(yè)用戶線上參會,全網(wǎng)總曝光量累計超過2000萬。
演講要點
- AI搜索縮短搜索時間、提高信息獲取質(zhì)量,是所有用戶的痛點
- 大模型使用門檻太高,AGI的真正表現(xiàn)形式是Agent
- AI時代只有免費模式才能迎來真正的應(yīng)用大爆發(fā)。
- 端側(cè)推理將為中小企業(yè)帶來機遇,中國開發(fā)者在應(yīng)用和商業(yè)模式方面具有優(yōu)勢
(以下為方漢演講分享全文)
大模型打開內(nèi)容生成領(lǐng)域顛覆性機會
今天與大家分享一下昆侖萬維在AGI與AIGC方向的探索之路,以及我們從做大模型開始到現(xiàn)在做AI Agent開發(fā)平臺的過程,也希望能夠給諸位在座的同仁起到一點參考作用。
首先簡單介紹一下昆侖萬維,我們是一家在A股上市的互聯(lián)網(wǎng)企業(yè),目前在全球大概有近4億月活用戶,海外收入占比84%,今年前三季度營收36.8億。目前我們分成三大業(yè)務(wù)板塊,其中最重要的板塊就是AGI與AIGC業(yè)務(wù)。
作為一家海外互聯(lián)網(wǎng)平臺型企業(yè),我們?yōu)槭裁磿槿氪竽P突蛘逜GI和AIGC技術(shù)方向?
我們是以網(wǎng)游題材上市的,上市之后我們進行了轉(zhuǎn)型,在海外大力做平臺型業(yè)務(wù),經(jīng)我們從頭孵化的大概千萬級別DAU的互聯(lián)網(wǎng)平臺有4—5家左右,全部都與內(nèi)容和社交賽道相關(guān)。
所以我們一直對于內(nèi)容生產(chǎn)領(lǐng)域的革新非常關(guān)注。在2020年GPT-3發(fā)布之后,我們非常敏銳地意識到了這可能是內(nèi)容生成領(lǐng)域顛覆性機會。
于是我們從2020年開始投入建立了一個團隊做中文預(yù)訓(xùn)練大模型的研發(fā),2021年研發(fā)出了140億參數(shù)的中文預(yù)訓(xùn)練大模型,同時我們開始了音樂生成的研究。
2022年底我們開源了13B的中文預(yù)訓(xùn)練大模型,今年4月份發(fā)布千億級別的“天工”大模型;今年8月份推出了我們AI搜索產(chǎn)品。
基本上我們是國內(nèi)布局AGI和AIGC比較早的企業(yè),因此我們在這方面的思索和對于AI未來終局的判斷,也是已進行了將近三年左右。這三年來我們一直在想我們的終局是什么樣?我們在這個終局里處于何種位置?以及我們怎么定義我們的發(fā)展方向。
AI搜索滿足所有用戶的痛點
我們目前已經(jīng)確定了六大AI業(yè)務(wù)矩陣。

首先,我們最重要的模塊之一是AI大模型,我們在這方面不斷地進行迭代和研發(fā)。
前面李開復(fù)老師也說了,一家公司有自己的模型建造能力非常重要的,首要原因是為了不受制于人;第二,對于很多應(yīng)用場景來說,你必須有自己的專有模型,你才能夠更好地去針對這個方向來進行你的應(yīng)用落地。
天工大模型家族從千億參數(shù)大模型到3B、13B、70B大模型都已經(jīng)準備好。11月3日我們通過了生成式人工智能服務(wù)暫行辦法備案,可以面向全社會開放服務(wù)。
第二,我們在國內(nèi)只推出了一款面向C端產(chǎn)品,就是AI搜索。
在海外,我們?nèi)匀槐形覀兊睦媳拘小獌?nèi)容和社交領(lǐng)域,在AI游戲、AI音樂、AI動漫、AI社交方向都有相應(yīng)的產(chǎn)品,而且這些產(chǎn)品目前已經(jīng)從實驗室走出來了,基本上研發(fā)都在1—2年以上,現(xiàn)在已經(jīng)開始在海外社區(qū)進行測試,我們也相信在明年就會大爆發(fā)。
我們?yōu)楹我鯝I搜索?邏輯比較簡單,并不是因為我們有大模型才做搜索,我們從用戶需求倒推的。
大家知道搜索引擎從30年前出現(xiàn)到現(xiàn)在,搜索模式已經(jīng)很多年沒有變過了,搜索模式是什么?
我們進入搜索引擎,輸入搜索詞,搜索引擎會輸出10個結(jié)果,用戶從10個結(jié)果里面挑前兩個或者前三個打開網(wǎng)頁進行閱讀,閱讀完之后決定哪個網(wǎng)頁是他要的結(jié)果,把他要的結(jié)果通過大腦總結(jié)之后反饋成自己的答案,來滿足搜索需求。這個過程一般來說耗時3-10分鐘,我們認為這個時間其實是任何人都很難縮短的。
一直到大模型的出現(xiàn),我們會發(fā)現(xiàn)如果用大模型來替代用戶進行“打開網(wǎng)頁——閱讀網(wǎng)頁”的這個時間,就可以把每次搜索的時間從3—10分鐘壓縮到5—10秒,只需要很短的時間就能有一個完整的總結(jié)結(jié)果。
這會給用戶體驗帶來極大的改變,所以AI搜索本質(zhì)上就是為了縮短用戶自行搜索的時間,并且能夠提高用戶獲取信息的質(zhì)量。
我們認為這就是所有用戶的痛點,“更快即更好”。我們做AI搜索也是本著這個目的來給用戶提供服務(wù)。

我們在AI多模態(tài)場景也有很多探索,比如,我們已經(jīng)有AI游戲、AI音樂和AI漫畫,其中在漫畫領(lǐng)域和音樂領(lǐng)域我們分別投入1—2年以上研發(fā)時間,目前在海外測試過程中非常受創(chuàng)作者歡迎,已經(jīng)有創(chuàng)作者利用我們AI音樂可以去線下打榜,在印尼音樂排行榜進入前100名,AI漫畫領(lǐng)域有專業(yè)漫畫師使用我們AI漫畫工具創(chuàng)作真正的漫畫。
同時,我們提供了天工開放平臺給更多用戶,更多企業(yè)用戶和個人開發(fā)者使用我們大模型,這里邊比較重要的是天工SkyAgents平臺。
AGI的真正表現(xiàn)形式是Agent
我重點分享一下我們最近為什么推出SkyAgents平臺。
實際上大模型本身大家用對話式大模型特別多,大家忙著跟大模型對話聊天,為什么說大模型是AGI不是Chatboot,本質(zhì)上因為大模型它的planning能力導(dǎo)致了它像AGI。
本質(zhì)上就現(xiàn)在大模型已經(jīng)有了作為大腦的初步能力,作為大腦的初步能力就是規(guī)劃能力,規(guī)劃能力本身其實是沒有作用的,為什么?因為大模型本身只會用文字方式、文本方式輸出,這種輸出是不能起到任何作用的。
怎么樣把文本的規(guī)劃能力轉(zhuǎn)成實際的工作能力呢?就需要給規(guī)劃能力接上很多外部的API,調(diào)用外部的API,比如說讀取文件,寫入文件,讀取數(shù)據(jù)展現(xiàn)數(shù)據(jù)、作圖,以及調(diào)用系統(tǒng)API完成功能,只有這樣才能夠讓大模型真正的落地。
為了實現(xiàn)這個功能,現(xiàn)在大家也知道OpenAI開放了很多大模型API,需要用戶有比較強的編程能力調(diào)用API、調(diào)用大模型規(guī)劃能力,去實現(xiàn)自己的大模型的落地。
我們認為,這個門檻還是太高了。
在中國有編程能力的人可能就幾千萬人,剩下的十幾億人怎么辦?
我們認為這時候需要Agents這個東西,低代碼的、大模型的二次開發(fā)接口,讓所有用戶都能夠通過Agents讓大模型替自己做實際的工作,以及更好地落地。
我們推出了SkyAgents產(chǎn)品,它有多樣化應(yīng)用場景,讓用戶用最簡單方式創(chuàng)造自己的Agents就能滿足很多常規(guī)需求。
大家也知道在大模型領(lǐng)域最有商業(yè)前景的一定是金融、能源、教育這些大的場景。但更多的個人用戶的一些非常小的微場景需求如何滿足?這時候用Agents多樣化應(yīng)用場景和迭代,用低代碼建設(shè)方式,就能讓用戶完成自己的工作。
我們天工SkyAgents可以用零代碼打造智能體,用非常簡單的模板幫助用戶應(yīng)用,讓用戶自己上傳EXCEL和數(shù)據(jù)文件,進行數(shù)據(jù)導(dǎo)入。
同時,我們對大模型的規(guī)劃能力也做了一定的加強,讓大模型更好執(zhí)行用戶需求,目前我們產(chǎn)品已經(jīng)開放注冊了。

我們從2020年就開始思考AI大模型最終以什么樣的形式介入到我們生活中間去。
其實有很多種方法,所有方法和途徑都繞不開一個問題,現(xiàn)在AI訓(xùn)練成本是天價,其實大家不知道AI推斷成本也非常高昂,這就導(dǎo)致了即使像微軟OpenAI這樣的企業(yè)仍然通過訂閱制來滿足高端用戶的需求,只有高端用戶才能夠去享受現(xiàn)在最好的AI推理服務(wù)。
我們認為這與最早中國互聯(lián)網(wǎng)或者全球互聯(lián)網(wǎng)初始發(fā)展階段是一樣的模式。我記得非常清楚,我最早用的是中科院的互聯(lián)網(wǎng),在最早用撥號上網(wǎng)的時代,我下1.2G的東西,費用達到幾百元。
這在現(xiàn)在大家都是無法想象的,現(xiàn)在1.2G的移動流量可能也就幾毛錢都不到,這證明了什么?那個時代互聯(lián)網(wǎng)為什么不能普及,就是因為費用高昂。
我們認為,只有免費模式,才能讓所有用戶享受到服務(wù),才能迎來真正的應(yīng)用大爆發(fā)。
端側(cè)推理才是最終解決方案
如何實現(xiàn)AI時代的免費模式呢?我認為有三個途徑。
第一個途徑是技術(shù)迭代。我們清楚地看到AI的摩爾定律已經(jīng)出現(xiàn),所有大模型的能力是每年10倍的往上漲,所有大模型的推斷成本以每年10倍的速度往下降。
第二個途徑,也是中國人最擅長的,在產(chǎn)品設(shè)計上進行區(qū)分。我們在產(chǎn)品設(shè)計上如果采用UGC模式,即創(chuàng)作者大規(guī)模使用AI,而普通消費者并不使用AI推理,這個模式也是能成立的。
但只有第三個途徑——端側(cè)推理才是最終的解決方案。
什么叫端側(cè)推理?在手機移動設(shè)備上可以進行的AI推理,目前手機上已經(jīng)實現(xiàn)了1.3B和3B模型的推理,我相信1—2年內(nèi)手機側(cè)一定可以搭載13B的大模型。
而到那個時候用戶購買手機的費用中就包含了將來要為推理所支付的費用。
所有的推理一旦到端側(cè),最終結(jié)果是什么?就會出現(xiàn)真正的殺手級的應(yīng)用。因為它是基于免費模式,才能在最大程度地向普通用戶普及,這就是我們對AI模型如何去進行免費模式的一個判斷。
最后,我想和大家說一下,這一波AI的機會對于所有企業(yè)都是非常公正的。
端側(cè)推理一定會到來,這對于中小企業(yè)來說建設(shè)自己的推斷能力仍然是非常好的機會。
而我們中國的開發(fā)者最擅長的是“應(yīng)用為王”,我們對于產(chǎn)品的商業(yè)模式的嗅覺是最靈敏的。
這一波AI一定是大潮將起、落地為王,謝謝大家。
- 4o-mini華人領(lǐng)隊也離職了,這次不怪小扎2025-08-19
- 宇樹機器人“撞人逃逸”火到國外,王興興回應(yīng):下次不遙控了2025-08-16
- 突破Claude-4編程上限!自進化Agent框架拿下新SOTA,已開源2025-08-19
- 讓OpenAI只領(lǐng)先5天,百川發(fā)布推理新模型,掀翻醫(yī)療垂域開源天花板2025-08-11