百度阮瑜:大模型應用落地正從簡單高容錯向復雜低容錯場景延伸|中國AIGC產業(yè)峰會
大模型應用邊界在不斷拓展
編輯部 整理自 AIGC現(xiàn)場
量子位 | 公眾號 QbitAI
現(xiàn)在,不論你是去吃火鍋,亦或是去趟醫(yī)院,或許身邊已經布滿了AI。
這,就是當下大模型應用的發(fā)展趨勢——
AI技術正以驚人的速度從實驗室走向千行百業(yè),深刻改變著各個領域的發(fā)展格局。
近期百度副總裁阮瑜在量子位舉辦的第三屆AIGC產業(yè)峰會上,圍繞著“萬物皆可AI”的主題分享了百度在AIGC以及 AI 應用方面的新嘗試和探索。

△百度副總裁阮瑜
為了完整體現(xiàn)阮瑜的思考,在不改變原意的基礎上,量子位對演講內容進行了編輯整理,希望能給你帶來更多啟發(fā)。
中國AIGC產業(yè)峰會是由量子位主辦的AI領域前沿峰會,20余位產業(yè)代表與會討論。線下參會觀眾超千人,線上直播觀眾320萬+,累計曝光2000萬+。
話題要點
- AI行業(yè)所呈現(xiàn)出的三大趨勢:技術開發(fā)輕量化、應用場景深化拓展、服務模式革新
- 視覺智能在大模型時代迎來爆點
- 大模型應用輔助決策開始往自主決策方向演進
- 從通用賦能到行業(yè)深耕,大模型應用邊界不斷拓展
以下為阮瑜演講全文:
AI行業(yè)所呈現(xiàn)出的三大趨勢
非常榮幸能夠參加中國AIGC產業(yè)峰會,今天我跟大家來分享一下百度在AIGC以及AI應用有哪些新的嘗試和探索。
首先來看一下關于AI未來發(fā)展的趨勢,我們能看到這兩年來AI變化風起云涌,而且速度也非???。
最近我們能夠洞察到這個行業(yè)有三個非常明顯的趨勢在發(fā)生。

第一個是高性價比和高性能的底層模型開始擁抱開源路徑。很多低代碼的開發(fā)軟件不斷橫空出世,很多開發(fā)者可以用成本極低且快速的方式生成AI應用,在這一塊就體現(xiàn)出來了門檻逐步地在降低。
第二個新趨勢是場景不斷地延伸。
所謂場景在延伸,我們發(fā)現(xiàn)大模型應用落地場景開始從最開始非常簡單高容錯的場景,逐步深入到復雜的低容錯場景,這個趨勢也是非常明確的。
第三個趨勢是,隨著 Agent 技術的出現(xiàn),有非常多企業(yè)開始通過“軟件+服務”的方式去服務客戶。
這個領域里面看到原來大家更在乎我們只提供一個工具,現(xiàn)在不完全通過一個工具去解決客戶的問題,而是通過“工具+服務”,最后為結果負責。
很多企業(yè)從“原來的License購買”開始轉向為效果付費,越來越重視ROI,這也能看到從最早的工具的延伸開始往“服務+工具”方向演進。
這塊一旦從傳統(tǒng)的工具市場變成了專業(yè)服務的市場,整個市場邊界發(fā)生非常大的變化,市場的潛力也會不斷地爆發(fā)出來。

我們能看到在大模型的應用趨勢中,Agent出來以后,單一智能體開始變成多智能體,其實一個智能體可以把任務拆解成非常簡單的環(huán)節(jié),你可以把一個簡單的任務通過一個Agent來完成。
但是當出現(xiàn)了一個復雜任務的時候,其實需要多智能體之間的協(xié)同,甚至每一個智能體在自己的專業(yè)領域里面有自己的擅長,相互協(xié)同以后會產生非常大的能量。
另外在模態(tài)層面上,我們也看到從傳統(tǒng)的單模態(tài)開始演進到多模態(tài),甚至出現(xiàn)了非常多跨模態(tài)的應用。
尤其是隨著底層模型跨模態(tài)能力不斷增強,跨模態(tài)的數(shù)據(jù)處理能力也日益凸顯。
AI交互從文本對話向多模態(tài)的交互發(fā)展,這個發(fā)展也是在很多產品和應用中能夠看到這個趨勢。
我們也看到在大模型應用層面,有非常多的新的變化,最早大家做大模型應用的時候,都是在做輔助的決策,大模型無法完全自主決策。
但是隨著底層模型不斷地演進,我們也看到了通過端到端產品的優(yōu)化,已經開始有很多自主執(zhí)行和決策的應用的出現(xiàn)。
這里面也體現(xiàn)出來了未來的趨勢,大模型應用從輔助決策開始往自主決策方向演進,未來也堅信這個趨勢下還會涌現(xiàn)出更多的AI應用來解決用戶現(xiàn)場使用過程中很多實際問題。
百度智能云基于百度自研的 IaaS 層百舸AI異構計算平臺和千帆大模型平臺,進行了諸多嘗試,在兩個平臺之上長出了非常多自己面對千行百業(yè)的應用。
我們把應用分成兩個大類:
一部分是通用應用,面對的還是普適性可以標準化的不同行業(yè)里的應用。
另外一方面是在行業(yè)應用里面,深入到行業(yè)里面以后,行業(yè)里面有非常多Know-How,基于這些行業(yè)Know-How產生出非常多行業(yè)應用。
今天我也從兩個方面去講一下,我們在這些趨勢下,以及在這些行業(yè)里面深耕的階段性成果。
視覺智能在大模型時代迎來爆點
剛才也提過了,大模型演進里面很大一部分是多模態(tài)的方向,我們很早也在多模態(tài)領域里做了大量的實踐和深耕。
能看到在小模型時代的時候,這種多模態(tài)的視覺的瑣碎的需求,有95%是沒有被滿足的。
如果做小模型的視覺的產品,會發(fā)現(xiàn)要投大量的工程師在里面做各種算法優(yōu)化,投入很大,周期很長,而且碎片化,泛化能力比較弱。
大模型時代,我們發(fā)現(xiàn)大小模型相結合,隨著多模態(tài)技術不斷發(fā)展,模型底層精度不斷提升,泛化能力提升了以后,我們能看到整個AI視覺技能的生產成本,調優(yōu)成本是顯著降低的,而且碎片化的需求是有非常大的可能性會被標準化的產品來滿足。
尤其是在很多企業(yè)生產過程中的標準化的工序里面的安全合規(guī)視覺稽查是比較有空間能夠做到的。
我們也判斷,長期看,隨著大模型底層模型不斷地優(yōu)化,視覺智能化管理數(shù)字化的爆發(fā),很快會在我們眼前發(fā)生。

百度智能云一見是視覺領域里面的應用,也是我們投入了很多年在做的一款產品。
這個產品主要是基于大模型的技術重構了以后,我們幫助客戶去實現(xiàn)針對多模態(tài)視覺場景里面的自動調優(yōu),模型的準確率是可以做到95%的。
而且最大的特點是一句話,人機對話的一句話可以生成一個AI的視覺的技能,直接用在客戶攝像頭,線上SaaS的方式直接下放到攝像頭里,這個速度是以前私有化的模式非常難以想象的。
而且通過大小模型的結合,我們能發(fā)現(xiàn),調優(yōu)的成本,以及生產的成本是大幅降低的,這里面也體現(xiàn)出來了在性價比層面上,在客戶層面是要通過大模型技術的優(yōu)化去解決客戶場景中的痛點。

一見主要是三個大的場景。
一個是安全生產,有很多能源制造的客戶在安全生產過程中有非常多的隱患的擔憂,我們沉淀了800多個安全的生產模型去幫助客戶降低線上的巡檢、安全事故等。
二是連鎖合規(guī),合規(guī)的需求,服務場景下面有非常多的服務的合規(guī),包括后廚里的餐飲安全,這里面也有大量的視覺場景的需求。
三是品質管控,在生產的時候,我們有很多SOP標準的流程,每一個流程是不是符合工序流程,這一塊也落地了非常多的頭部企業(yè),也能看到在應用了這些大模型的視覺技術以后,質檢的效率提升了5-10倍。
下面看一個視頻,來簡單地理解一見在場景中的應用。

視頻地址:
https://mp.weixin.qq.com/s/wts1jGNV9JZw2x_EKczhEg
百度智能云的實踐案例
我們有非常多成功的案例在客戶這里應用,這里舉了兩個例子。
第一個例子是在連鎖合規(guī)場景中,案例的結果在上面已經比較顯著地看到。
我講一個很實際的例子,我們現(xiàn)實中跟很多穿戴設備,尤其是跟一見的多模態(tài)的視覺平臺綁定在一起的一些應用。
比如說我們跟一個比較大型的餐飲品牌合作,現(xiàn)在可以做到服務員的手上有手環(huán),晚上12點的時候如果有客人進店,店面比較大了以后很難觀察到客戶。
客戶對攝像頭招一下手,通過一見的識別會通知服務員可以服務這位客戶,對應的是不是有小孩、老人,有哪些注意事項。
這些現(xiàn)在通過多模態(tài)的識別技術,聯(lián)動云邊端和智能設備IoT設備的聯(lián)動,可以把整個餐飲的連鎖打造得越來越智能,對于大型連鎖的餐飲機構和商店的場景下是非常實用的。

另外一個是風電場景下也有一些合作。
有很多大型的集團有大量的風機在外面,風機的巡檢,以及人員檢查風機的時候有非常多安全注意事項,比如穿戴設備是否合規(guī),出倉是否符合安全的要求等,整個視覺技術可以做到及時預警通報。
原來是小時級才能通報,現(xiàn)在分鐘級就能通知到,管理過程是要更加注意的,整個巡檢效率也提升了非常多。這一塊是在安全層面上,一見在安全和服務合規(guī)上做了非常多的嘗試和探索。
大模型應用邊界不斷拓展
在通用型的應用之后,我們也發(fā)現(xiàn)大模型的應用在行業(yè)里面是有非常多的變化,以及很多場景的結合。
尤其是我們能看到,在醫(yī)療領域里,整個變化是非常大的,從行業(yè)深耕里面可以深耕的非常細。
我們可以看到醫(yī)療這個行業(yè)里,每次AI技術來了以后,醫(yī)療都是先行者,滲透了非常多環(huán)節(jié),包括像臨床、管理、科研、制藥、AI手術機器人、患者管理等,非常多的場景和領域,現(xiàn)在都能看到已經被大模型的技術開始應用且創(chuàng)新產生結果。
百度本身也是依賴自己的AI技術,以及全棧式的AI布局,我們在自研的靈醫(yī)大模型基礎上,跟很多醫(yī)院嘗試了非常多的合作,今天跟大家講我們做了哪些合作,希望跟大家有些共同的探討。
在過往的時間里,其實合作了有將近500家的醫(yī)院,包括很多機構。
在大模型的應用過程中,我們也可以看出來,整個大模型的應用,從醫(yī)療這個領域里,從輔助決策開始往自動執(zhí)行的領域里的演進。

我們講一個案例,北大國際醫(yī)院是我們非常緊密的合作伙伴,我們在醫(yī)療這個領域做了非常深度的應用,包括智能病歷的輔助生成,智能輔助推薦,包括醫(yī)療知識的簡報。
整個這些功能上線了以后,我們能看到整個病歷的質量提升了60%,而且臨床科室的使用比例從30%提升到了95%,也能看到大模型的應用在幫助醫(yī)生更好地做醫(yī)療的輔助工作。
后面看一個視頻,具體看一下這些功能是長什么樣子的,以及具體怎么應用的。

視頻地址:
https://mp.weixin.qq.com/s/wts1jGNV9JZw2x_EKczhEg
其實隨著整個大模型技術的不斷演進,我們也看到應用在各個行業(yè)里面發(fā)生了非常多的化學反應,這些也離不開各界的產業(yè)人士大家一起共同的努力。
我們也期待在未來有更多的機會去攜手跟大家共同在大模型應用落地的領域里有很多新的嘗試,把整個生態(tài)做得更加繁榮。
感謝各位!
- 商湯林達華萬字長文回答AGI:4層破壁,3大挑戰(zhàn)2025-08-12
- 商湯多模態(tài)大模型賦能鐵路勘察設計,讓70年經驗“活”起來2025-08-13
- 以“具身智能基座”為核,睿爾曼攜全產品矩陣及新品亮相2025 WRC2025-08-11
- 哇塞,今天北京被機器人人人人人塞滿了!2025-08-08