百度阮瑜:大模型應(yīng)用落地正從簡單高容錯向復(fù)雜低容錯場景延伸|中國AIGC產(chǎn)業(yè)峰會
大模型應(yīng)用邊界在不斷拓展
編輯部 整理自 AIGC現(xiàn)場
量子位 | 公眾號 QbitAI
現(xiàn)在,不論你是去吃火鍋,亦或是去趟醫(yī)院,或許身邊已經(jīng)布滿了AI。
這,就是當(dāng)下大模型應(yīng)用的發(fā)展趨勢——
AI技術(shù)正以驚人的速度從實(shí)驗(yàn)室走向千行百業(yè),深刻改變著各個領(lǐng)域的發(fā)展格局。
近期百度副總裁阮瑜在量子位舉辦的第三屆AIGC產(chǎn)業(yè)峰會上,圍繞著“萬物皆可AI”的主題分享了百度在AIGC以及 AI 應(yīng)用方面的新嘗試和探索。

△百度副總裁阮瑜
為了完整體現(xiàn)阮瑜的思考,在不改變原意的基礎(chǔ)上,量子位對演講內(nèi)容進(jìn)行了編輯整理,希望能給你帶來更多啟發(fā)。
中國AIGC產(chǎn)業(yè)峰會是由量子位主辦的AI領(lǐng)域前沿峰會,20余位產(chǎn)業(yè)代表與會討論。線下參會觀眾超千人,線上直播觀眾320萬+,累計(jì)曝光2000萬+。
話題要點(diǎn)
- AI行業(yè)所呈現(xiàn)出的三大趨勢:技術(shù)開發(fā)輕量化、應(yīng)用場景深化拓展、服務(wù)模式革新
- 視覺智能在大模型時代迎來爆點(diǎn)
- 大模型應(yīng)用輔助決策開始往自主決策方向演進(jìn)
- 從通用賦能到行業(yè)深耕,大模型應(yīng)用邊界不斷拓展
以下為阮瑜演講全文:
AI行業(yè)所呈現(xiàn)出的三大趨勢
非常榮幸能夠參加中國AIGC產(chǎn)業(yè)峰會,今天我跟大家來分享一下百度在AIGC以及AI應(yīng)用有哪些新的嘗試和探索。
首先來看一下關(guān)于AI未來發(fā)展的趨勢,我們能看到這兩年來AI變化風(fēng)起云涌,而且速度也非???。
最近我們能夠洞察到這個行業(yè)有三個非常明顯的趨勢在發(fā)生。

第一個是高性價比和高性能的底層模型開始擁抱開源路徑。很多低代碼的開發(fā)軟件不斷橫空出世,很多開發(fā)者可以用成本極低且快速的方式生成AI應(yīng)用,在這一塊就體現(xiàn)出來了門檻逐步地在降低。
第二個新趨勢是場景不斷地延伸。
所謂場景在延伸,我們發(fā)現(xiàn)大模型應(yīng)用落地場景開始從最開始非常簡單高容錯的場景,逐步深入到復(fù)雜的低容錯場景,這個趨勢也是非常明確的。
第三個趨勢是,隨著 Agent 技術(shù)的出現(xiàn),有非常多企業(yè)開始通過“軟件+服務(wù)”的方式去服務(wù)客戶。
這個領(lǐng)域里面看到原來大家更在乎我們只提供一個工具,現(xiàn)在不完全通過一個工具去解決客戶的問題,而是通過“工具+服務(wù)”,最后為結(jié)果負(fù)責(zé)。
很多企業(yè)從“原來的License購買”開始轉(zhuǎn)向?yàn)樾Ч顿M(fèi),越來越重視ROI,這也能看到從最早的工具的延伸開始往“服務(wù)+工具”方向演進(jìn)。
這塊一旦從傳統(tǒng)的工具市場變成了專業(yè)服務(wù)的市場,整個市場邊界發(fā)生非常大的變化,市場的潛力也會不斷地爆發(fā)出來。

我們能看到在大模型的應(yīng)用趨勢中,Agent出來以后,單一智能體開始變成多智能體,其實(shí)一個智能體可以把任務(wù)拆解成非常簡單的環(huán)節(jié),你可以把一個簡單的任務(wù)通過一個Agent來完成。
但是當(dāng)出現(xiàn)了一個復(fù)雜任務(wù)的時候,其實(shí)需要多智能體之間的協(xié)同,甚至每一個智能體在自己的專業(yè)領(lǐng)域里面有自己的擅長,相互協(xié)同以后會產(chǎn)生非常大的能量。
另外在模態(tài)層面上,我們也看到從傳統(tǒng)的單模態(tài)開始演進(jìn)到多模態(tài),甚至出現(xiàn)了非常多跨模態(tài)的應(yīng)用。
尤其是隨著底層模型跨模態(tài)能力不斷增強(qiáng),跨模態(tài)的數(shù)據(jù)處理能力也日益凸顯。
AI交互從文本對話向多模態(tài)的交互發(fā)展,這個發(fā)展也是在很多產(chǎn)品和應(yīng)用中能夠看到這個趨勢。
我們也看到在大模型應(yīng)用層面,有非常多的新的變化,最早大家做大模型應(yīng)用的時候,都是在做輔助的決策,大模型無法完全自主決策。
但是隨著底層模型不斷地演進(jìn),我們也看到了通過端到端產(chǎn)品的優(yōu)化,已經(jīng)開始有很多自主執(zhí)行和決策的應(yīng)用的出現(xiàn)。
這里面也體現(xiàn)出來了未來的趨勢,大模型應(yīng)用從輔助決策開始往自主決策方向演進(jìn),未來也堅(jiān)信這個趨勢下還會涌現(xiàn)出更多的AI應(yīng)用來解決用戶現(xiàn)場使用過程中很多實(shí)際問題。
百度智能云基于百度自研的 IaaS 層百舸AI異構(gòu)計(jì)算平臺和千帆大模型平臺,進(jìn)行了諸多嘗試,在兩個平臺之上長出了非常多自己面對千行百業(yè)的應(yīng)用。
我們把應(yīng)用分成兩個大類:
一部分是通用應(yīng)用,面對的還是普適性可以標(biāo)準(zhǔn)化的不同行業(yè)里的應(yīng)用。
另外一方面是在行業(yè)應(yīng)用里面,深入到行業(yè)里面以后,行業(yè)里面有非常多Know-How,基于這些行業(yè)Know-How產(chǎn)生出非常多行業(yè)應(yīng)用。
今天我也從兩個方面去講一下,我們在這些趨勢下,以及在這些行業(yè)里面深耕的階段性成果。
視覺智能在大模型時代迎來爆點(diǎn)
剛才也提過了,大模型演進(jìn)里面很大一部分是多模態(tài)的方向,我們很早也在多模態(tài)領(lǐng)域里做了大量的實(shí)踐和深耕。
能看到在小模型時代的時候,這種多模態(tài)的視覺的瑣碎的需求,有95%是沒有被滿足的。
如果做小模型的視覺的產(chǎn)品,會發(fā)現(xiàn)要投大量的工程師在里面做各種算法優(yōu)化,投入很大,周期很長,而且碎片化,泛化能力比較弱。
大模型時代,我們發(fā)現(xiàn)大小模型相結(jié)合,隨著多模態(tài)技術(shù)不斷發(fā)展,模型底層精度不斷提升,泛化能力提升了以后,我們能看到整個AI視覺技能的生產(chǎn)成本,調(diào)優(yōu)成本是顯著降低的,而且碎片化的需求是有非常大的可能性會被標(biāo)準(zhǔn)化的產(chǎn)品來滿足。
尤其是在很多企業(yè)生產(chǎn)過程中的標(biāo)準(zhǔn)化的工序里面的安全合規(guī)視覺稽查是比較有空間能夠做到的。
我們也判斷,長期看,隨著大模型底層模型不斷地優(yōu)化,視覺智能化管理數(shù)字化的爆發(fā),很快會在我們眼前發(fā)生。

百度智能云一見是視覺領(lǐng)域里面的應(yīng)用,也是我們投入了很多年在做的一款產(chǎn)品。
這個產(chǎn)品主要是基于大模型的技術(shù)重構(gòu)了以后,我們幫助客戶去實(shí)現(xiàn)針對多模態(tài)視覺場景里面的自動調(diào)優(yōu),模型的準(zhǔn)確率是可以做到95%的。
而且最大的特點(diǎn)是一句話,人機(jī)對話的一句話可以生成一個AI的視覺的技能,直接用在客戶攝像頭,線上SaaS的方式直接下放到攝像頭里,這個速度是以前私有化的模式非常難以想象的。
而且通過大小模型的結(jié)合,我們能發(fā)現(xiàn),調(diào)優(yōu)的成本,以及生產(chǎn)的成本是大幅降低的,這里面也體現(xiàn)出來了在性價比層面上,在客戶層面是要通過大模型技術(shù)的優(yōu)化去解決客戶場景中的痛點(diǎn)。

一見主要是三個大的場景。
一個是安全生產(chǎn),有很多能源制造的客戶在安全生產(chǎn)過程中有非常多的隱患的擔(dān)憂,我們沉淀了800多個安全的生產(chǎn)模型去幫助客戶降低線上的巡檢、安全事故等。
二是連鎖合規(guī),合規(guī)的需求,服務(wù)場景下面有非常多的服務(wù)的合規(guī),包括后廚里的餐飲安全,這里面也有大量的視覺場景的需求。
三是品質(zhì)管控,在生產(chǎn)的時候,我們有很多SOP標(biāo)準(zhǔn)的流程,每一個流程是不是符合工序流程,這一塊也落地了非常多的頭部企業(yè),也能看到在應(yīng)用了這些大模型的視覺技術(shù)以后,質(zhì)檢的效率提升了5-10倍。
下面看一個視頻,來簡單地理解一見在場景中的應(yīng)用。

視頻地址:
https://mp.weixin.qq.com/s/wts1jGNV9JZw2x_EKczhEg
百度智能云的實(shí)踐案例
我們有非常多成功的案例在客戶這里應(yīng)用,這里舉了兩個例子。
第一個例子是在連鎖合規(guī)場景中,案例的結(jié)果在上面已經(jīng)比較顯著地看到。
我講一個很實(shí)際的例子,我們現(xiàn)實(shí)中跟很多穿戴設(shè)備,尤其是跟一見的多模態(tài)的視覺平臺綁定在一起的一些應(yīng)用。
比如說我們跟一個比較大型的餐飲品牌合作,現(xiàn)在可以做到服務(wù)員的手上有手環(huán),晚上12點(diǎn)的時候如果有客人進(jìn)店,店面比較大了以后很難觀察到客戶。
客戶對攝像頭招一下手,通過一見的識別會通知服務(wù)員可以服務(wù)這位客戶,對應(yīng)的是不是有小孩、老人,有哪些注意事項(xiàng)。
這些現(xiàn)在通過多模態(tài)的識別技術(shù),聯(lián)動云邊端和智能設(shè)備IoT設(shè)備的聯(lián)動,可以把整個餐飲的連鎖打造得越來越智能,對于大型連鎖的餐飲機(jī)構(gòu)和商店的場景下是非常實(shí)用的。

另外一個是風(fēng)電場景下也有一些合作。
有很多大型的集團(tuán)有大量的風(fēng)機(jī)在外面,風(fēng)機(jī)的巡檢,以及人員檢查風(fēng)機(jī)的時候有非常多安全注意事項(xiàng),比如穿戴設(shè)備是否合規(guī),出倉是否符合安全的要求等,整個視覺技術(shù)可以做到及時預(yù)警通報(bào)。
原來是小時級才能通報(bào),現(xiàn)在分鐘級就能通知到,管理過程是要更加注意的,整個巡檢效率也提升了非常多。這一塊是在安全層面上,一見在安全和服務(wù)合規(guī)上做了非常多的嘗試和探索。
大模型應(yīng)用邊界不斷拓展
在通用型的應(yīng)用之后,我們也發(fā)現(xiàn)大模型的應(yīng)用在行業(yè)里面是有非常多的變化,以及很多場景的結(jié)合。
尤其是我們能看到,在醫(yī)療領(lǐng)域里,整個變化是非常大的,從行業(yè)深耕里面可以深耕的非常細(xì)。
我們可以看到醫(yī)療這個行業(yè)里,每次AI技術(shù)來了以后,醫(yī)療都是先行者,滲透了非常多環(huán)節(jié),包括像臨床、管理、科研、制藥、AI手術(shù)機(jī)器人、患者管理等,非常多的場景和領(lǐng)域,現(xiàn)在都能看到已經(jīng)被大模型的技術(shù)開始應(yīng)用且創(chuàng)新產(chǎn)生結(jié)果。
百度本身也是依賴自己的AI技術(shù),以及全棧式的AI布局,我們在自研的靈醫(yī)大模型基礎(chǔ)上,跟很多醫(yī)院嘗試了非常多的合作,今天跟大家講我們做了哪些合作,希望跟大家有些共同的探討。
在過往的時間里,其實(shí)合作了有將近500家的醫(yī)院,包括很多機(jī)構(gòu)。
在大模型的應(yīng)用過程中,我們也可以看出來,整個大模型的應(yīng)用,從醫(yī)療這個領(lǐng)域里,從輔助決策開始往自動執(zhí)行的領(lǐng)域里的演進(jìn)。

我們講一個案例,北大國際醫(yī)院是我們非常緊密的合作伙伴,我們在醫(yī)療這個領(lǐng)域做了非常深度的應(yīng)用,包括智能病歷的輔助生成,智能輔助推薦,包括醫(yī)療知識的簡報(bào)。
整個這些功能上線了以后,我們能看到整個病歷的質(zhì)量提升了60%,而且臨床科室的使用比例從30%提升到了95%,也能看到大模型的應(yīng)用在幫助醫(yī)生更好地做醫(yī)療的輔助工作。
后面看一個視頻,具體看一下這些功能是長什么樣子的,以及具體怎么應(yīng)用的。

視頻地址:
https://mp.weixin.qq.com/s/wts1jGNV9JZw2x_EKczhEg
其實(shí)隨著整個大模型技術(shù)的不斷演進(jìn),我們也看到應(yīng)用在各個行業(yè)里面發(fā)生了非常多的化學(xué)反應(yīng),這些也離不開各界的產(chǎn)業(yè)人士大家一起共同的努力。
我們也期待在未來有更多的機(jī)會去攜手跟大家共同在大模型應(yīng)用落地的領(lǐng)域里有很多新的嘗試,把整個生態(tài)做得更加繁榮。
感謝各位!
- 商湯林達(dá)華萬字長文回答AGI:4層破壁,3大挑戰(zhàn)2025-08-12
- 商湯多模態(tài)大模型賦能鐵路勘察設(shè)計(jì),讓70年經(jīng)驗(yàn)“活”起來2025-08-13
- 以“具身智能基座”為核,睿爾曼攜全產(chǎn)品矩陣及新品亮相2025 WRC2025-08-11
- 哇塞,今天北京被機(jī)器人人人人人塞滿了!2025-08-08