百度AI技術(shù)進(jìn)入收獲期:一個月拿下十多項國際頂賽冠軍
還覆蓋了各種不同的領(lǐng)域
楊凈 發(fā)自 凹非寺
量子位 報道 | 公眾號 QbitAI
中國,已經(jīng)成為AI技術(shù)浪潮中最矚目的參與者和貢獻(xiàn)者。
作為最能洞悉AI前沿技術(shù)方向的國際頂會,它的影響力就不容小覷。
如今,越來越多的中國企業(yè)在國際頂會中“秀肌肉”,以此證明自己真正的技術(shù)實(shí)力。
隨著技術(shù)的不斷深耕,國內(nèi)已經(jīng)出現(xiàn)一些企業(yè),足以跟國外頂尖科技企業(yè)相媲美。
甚至在一些落地領(lǐng)域已經(jīng)處于領(lǐng)軍地位。
比如百度。
最近一個月,百度就在三個國際頂會、12場比賽中獲得冠軍。單就在剛剛落幕的CVPR上,就在10個賽道上奪冠,堪稱CVPR十冠王。
而且更關(guān)鍵的是,還都覆蓋了各種不同的領(lǐng)域,包括自動駕駛、智慧城市、語義分割、人體解析、醫(yī)療放射……
一方面這樣的賽事成績,遠(yuǎn)遠(yuǎn)只是百度AI的冰山一角。
另一方面還看到,除了骨子里的技術(shù)派之外,百度在行動上,也就是落地速度上也處于行業(yè)領(lǐng)先。
能夠如此制霸國際賽場、快速應(yīng)用落地,保持源源不斷的技術(shù)創(chuàng)新與動力,百度AI究竟有何秘籍?
且聽今日慢慢道來。
全棧實(shí)力霸榜國際賽場
如何評價百度的AI實(shí)力?
全棧,最為貼切。
灼識咨詢曾這樣評價百度:“百度是迄今為止,唯一開發(fā)全棧AI能力的中國公司”。
“全?!倍直澈蟮母冻?,可想而知。
作為多年出征AI頂會的老兵,的確所言非虛。
僅此次CV領(lǐng)域中的表現(xiàn),就是例證。
去年在CVPR上獲得八個冠軍的百度,此次就再下兩城。
另外,還有22篇論文入選CVPR,涵蓋圖像語義分割、文本視頻檢索、3D目標(biāo)檢測、風(fēng)格遷移、視頻理解、遷移學(xué)習(xí)等多個研究方向。
CVPR舉辦同期,百度還聯(lián)合悉尼科技大學(xué)和美國北卡羅來大學(xué)舉辦CVPR 2021 NAS workshop,并舉辦首屆輕量級NAS國際競賽。
結(jié)果就吸引了全球有600多支隊伍參加,并匯集在一起百花齊放。
如此影響力,也大抵只有百度這類學(xué)霸才可以做到。
再如百度深耕最久、實(shí)力最強(qiáng)悍的NLP領(lǐng)域。
今年正是百度深耕第11個年頭,2010年,作為NLP領(lǐng)域最負(fù)盛名的國際頂會ACL,第一次迎來中國互聯(lián)網(wǎng)企業(yè)代表。
而那個代表,正是百度。同年,百度NLP部門,正式成立。
因此有人說,百度在NLP深耕十年,也就是中國ACL「破圈」十年。
另外,百度NLP代言人——文心ERNIE,也以屠龍刀一般的技術(shù),霸占各個榜單。
比如,在全球規(guī)模最大的語義評測比賽SemEval 2020中,文心ERNIE就一口氣斬獲5項世界冠軍。
首次驚艷亮相,當(dāng)屬2019年12月登頂GLUE。
GLUE就是自然語言處理領(lǐng)域的權(quán)威排行榜之一,一直以來被視作評估NLP研究進(jìn)展的行業(yè)標(biāo)準(zhǔn)。
那一次,文心ERNIE首次突破90分大關(guān),甚至超越人類3個百分點(diǎn),創(chuàng)下榜單新紀(jì)錄。結(jié)果就在前不久,它再次摘得榜首,登頂GLUE。
僅去年一年,百度就在諸如CVPR、ACL、ECCV、NeurIPS、INTERSPEECH等全球頂級的人工智能學(xué)術(shù)會議和相關(guān)競賽上,百度AI問鼎冠軍30余次。
在AI專利方面,百度在國內(nèi)人工智能領(lǐng)域,也已經(jīng)取得了連續(xù)三年總申請量、授權(quán)量第一的成績。
可以看到的是,僅僅在學(xué)術(shù)方面,百度就已經(jīng)展現(xiàn)了“AI頭雁”的功力。
更別提在昆侖芯片、深度學(xué)習(xí)平臺、自動駕駛,還有各種AI布局和落地,從廣度和深度,都無一不展現(xiàn)著百度的全棧AI能力。
各行業(yè)施展內(nèi)功
學(xué)術(shù)強(qiáng)悍還不夠,還要接地氣、真正深入到各個行業(yè)場景,才是技術(shù)實(shí)現(xiàn)的價值與意義。
不往遠(yuǎn)了說,單就拎這個月的成績單,就足以見到百度往各行業(yè)施展的內(nèi)功。
拿自動駕駛來說。
今年在CVPR十冠里,語義分割、高分辨率人體解析、霧天環(huán)境檢測賽道的三項冠軍,就能直接助力百度的自動駕駛能力。
另外,目標(biāo)檢測作為核心模塊之一,對檢測算法的精度和穩(wěn)定性要求只會越來越高。
在第四屆nuScenes三維目標(biāo)檢測挑戰(zhàn)賽中,百度提出了一種多模態(tài)和多任務(wù)的信息融合框架,并添加了多模型融合、半監(jiān)督學(xué)習(xí)、測試階段數(shù)據(jù)增強(qiáng)等技術(shù)。
最終,他們在三維物體檢測任務(wù)的多項評價指標(biāo)中榮獲第一,并將關(guān)鍵指標(biāo)nuScenes Detection Score (NDS)從上一屆的71.4%提升至74.9%,全類平均正確率從上一屆冠軍的67.1%提升至72.4%。
當(dāng)然你可能會說,百度的自動駕駛本身實(shí)力就很強(qiáng),如此成績自不必說。
那就來說下,醫(yī)學(xué)放射報告領(lǐng)域。
就在今年6月初,百度在MEDIQA 2021醫(yī)學(xué)放射報告摘要國際評測冠軍獲得了冠軍。
這項技術(shù)有何意義呢?
醫(yī)學(xué)放射報告,即放射性檢查后的影像報告,包括基本信息、影像表現(xiàn)和診斷印象三部分。
傳統(tǒng)診療方式中,診療印象需要由放射科醫(yī)生根據(jù)影像表現(xiàn)人工總結(jié)完成。
這種方式耗時耗力,還容易出錯。
而放射報告的自動摘要技術(shù),則可以根據(jù)影像表現(xiàn)并結(jié)合患者的基本信息,自動生成診斷印象。
這樣極大地解放了人力,提升了醫(yī)療智能化水平。
而百度基于在醫(yī)學(xué)語言理解和知識圖譜領(lǐng)域的深耕,在MEDIQA 2021醫(yī)學(xué)放射報告主指標(biāo)ROUGE-2上超出第二名近3個百分點(diǎn),以絕對優(yōu)勢奪冠。
另外,還同時包攬全部9項測試指標(biāo)的第一名。
還有像此次在AI CITY挑戰(zhàn)賽的兩個任務(wù)——車流統(tǒng)計任務(wù)和異常事件檢測賽道奪冠,當(dāng)中的關(guān)鍵技術(shù)就已經(jīng)應(yīng)用到了百度的智能交通、智慧城市的系統(tǒng)當(dāng)中。
要知道這樣一個智慧系統(tǒng),一定是集多重AI技術(shù)于一身。
僅視覺相關(guān),就整合了檢測、跟蹤、3D定位、分割、身份重識別、事件分析在內(nèi)的技術(shù)。
這對一般的技術(shù)公司就挑戰(zhàn)不小。
但百度不僅做到了,還做到了處處落地開花。
還有在SoccerNet-v2挑戰(zhàn)賽拿下雙料冠軍的AI能力,也已經(jīng)基于智能創(chuàng)作平臺進(jìn)行落地。
百度也已經(jīng)有了相應(yīng)的工具,比如自定義足球精彩集錦生成、足球圖文戰(zhàn)報一鍵轉(zhuǎn)換視頻等。
自動駕駛、醫(yī)療診斷、智慧城市、智慧創(chuàng)作……種種應(yīng)用,不勝枚舉。
百度不光學(xué)術(shù)實(shí)力很強(qiáng),還能迅速注入各個領(lǐng)域場景,而背后的秘訣其實(shí)早已公開。
無他,云智一體化。
秘訣已公開
所以,什么是云智一體?
云,云計算、云邊端一體化能力;智,AI能力,兩者之間形成某種耦合關(guān)系,就是云智一體。
對于百度來說,智,即百度大腦。
經(jīng)過十余年積累,百度大腦已經(jīng)進(jìn)化成軟硬件一體的AI大生產(chǎn)平臺,成為行業(yè)智能化背景下賦能各行業(yè)的新型基礎(chǔ)設(shè)施。
這當(dāng)中包括飛槳深度學(xué)習(xí)平臺、百度昆侖芯片以及語音、視覺、知識圖譜、自然語言處理等技術(shù)和平臺。
而云,則是專為AI打造、作為AI輸出載體的云計算架構(gòu),來滿足產(chǎn)業(yè)智能化應(yīng)用的規(guī)模化生產(chǎn),提升企業(yè)的AI開發(fā)效率。
這樣的云智一體,究竟何以成為百度AI領(lǐng)軍全球的戰(zhàn)略核心?
首先,AI和云計算之間的融合,本身就是時代之勢。
各個行業(yè)、各個企業(yè)都在尋求智能化、數(shù)字化轉(zhuǎn)型,這當(dāng)中AI充當(dāng)著核心驅(qū)動引擎,自然擺在了重中之重的位置。
如何快速、高效、低成本的進(jìn)行,就需要云計算的加持。
最懂AI的百度,自然要率先開啟融合之路。
就比如工業(yè)質(zhì)檢,就已經(jīng)看到百度由單點(diǎn)及面,形成自己的工業(yè)版圖。
其中的載體——開物。
從點(diǎn)上看,它可以針對產(chǎn)線的工藝質(zhì)量環(huán)節(jié)進(jìn)行優(yōu)化。
比如,通過AI技術(shù)對機(jī)器進(jìn)行自動調(diào)參,大批量的精準(zhǔn)質(zhì)檢,進(jìn)而實(shí)現(xiàn)降本增效。
而從廣義上,它更作為百度工業(yè)互聯(lián)網(wǎng)品牌,利用自身業(yè)務(wù)優(yōu)勢,面向制造、能源、電力等工業(yè)企業(yè)推出AI+工業(yè)互聯(lián)網(wǎng)整體解決方案。
目前,百度已經(jīng)與重慶、貴陽和濟(jì)南達(dá)成合作,根據(jù)不同城市特點(diǎn)推出相應(yīng)的產(chǎn)業(yè)賦能方案,形成了自己的智造版圖。
還有像智慧城市的建設(shè)中,與北京、福建、廣西、云南等地區(qū)都有多項合作。
- 北京海淀城市大腦、云南麗江城市大腦,就是百度聯(lián)合合作伙伴共同打造;
- 福建福州,有百度的產(chǎn)業(yè)智能化項目落地;
- 百度還跟廣西壯族自治區(qū)簽署戰(zhàn)略合作協(xié)議,圍繞政府智能體、智慧政務(wù)服務(wù)、智慧旅游、智慧交通、智慧邊防、城市智慧基座、數(shù)字產(chǎn)業(yè)園、工業(yè)互聯(lián)網(wǎng)等方向,全方位助力廣西打造新型智慧城市。
一個個智慧城市正在打通,百度在用自己的方式助力數(shù)字中國的建設(shè)。
通過云智一體,百度正在打造AI基建,推動行業(yè)更多的智能化創(chuàng)新。
而從多個產(chǎn)業(yè)落地來看,百度的AI能力已經(jīng)從單點(diǎn)模塊化發(fā)展,拓展到多業(yè)務(wù)場景的技術(shù)開發(fā)和應(yīng)用。
百度AI實(shí)力能否復(fù)制?
百度AI的技術(shù)實(shí)力確實(shí)很強(qiáng),那到底能否“復(fù)制”?
在我看來,亦不能,亦能。
技術(shù)是一個企業(yè)良好發(fā)展的核心引擎,也是企業(yè)的“獨(dú)家秘籍”。
百度AI的技術(shù)實(shí)力并非一日之功,無論是在技術(shù)硬實(shí)力還是應(yīng)用體驗(yàn)上,都奠定了一定的基礎(chǔ)與口碑,是無法復(fù)制的。
正是如此,目前百度大腦的基礎(chǔ)底座——飛槳已經(jīng)凝聚了320萬開發(fā)者,服務(wù)12萬企業(yè),創(chuàng)建36萬個模型,涉足醫(yī)療、金融、娛樂、環(huán)境、能源、工業(yè)制等諸多領(lǐng)域。
再加上前不久Robotaxi商業(yè)化的最后一道難關(guān)也被百度Apollo攻破——單車成本僅48萬。
再一次坐實(shí)了百度技術(shù)實(shí)力,其他企業(yè)想復(fù)制都難。
但這個世界上沒有什么東西是不會被復(fù)制的。任何企業(yè)、任何產(chǎn)品都有可能被復(fù)制,復(fù)制才能產(chǎn)生規(guī)模效應(yīng)。
這種“復(fù)制”其實(shí)并非復(fù)制核心技術(shù),而是復(fù)制其成功路徑以及方法論。
從底層來說,成功的模式一樣的,發(fā)現(xiàn)新需求,解決新需求,從而獲得成功。
但與此同時,過程中企業(yè)積累的資源、經(jīng)驗(yàn)都是存在差異的,這才造就了百度AI的核心技術(shù)實(shí)力的領(lǐng)先性。
正如兵仙韓信的背水之戰(zhàn),一直被模仿從未被超越,只因它不可復(fù)制。
- 英偉達(dá)最新芯片B30A曝光2025-08-20
- AI應(yīng)用如何落地政企?首先不要卷通用大模型2025-08-12
- 本科必學(xué)Dijkstra算法被超越!清華段然團(tuán)隊打破圖靈獎得主證明的普遍最優(yōu)性2025-08-09
- 智能體邁入L4 時代!納米AI多智能體蜂群,可創(chuàng)作最長10分鐘AI視頻2025-08-06