斬獲23項冠軍,日均調用破萬億!百度交出年度AI成績單:語音語言領銜技術突破,國產自研成大趨勢
乾明 雷剛 發(fā)自 凹非寺
量子位 報道 | 公眾號 QbitAI
剛剛,百度一年AI成績單官宣。
作為中國AI頭雁,百度的成績單不止代表巨頭公司業(yè)績,也代表了技術前沿現狀和產業(yè)基本情況。
而且諸多進展,也是全新起跑線上全球AI發(fā)展的側影,比如最明顯的4大趨勢特點:
- 語音語言領銜基礎技術突破,AI突破從感知智能進入認知智能時代。
- 巨頭玩家忙于打造“底座”優(yōu)勢,搭建生態(tài)平臺。
- AI落地進入工業(yè)化大生產時代,價值在基礎業(yè)務中展現,也通過新場景中驗證潛力。
- 自主可控性進一步加強,自研芯片服務器量產,并與國產AI框架、算法產生整合優(yōu)勢。
所以百度這份2019年度成績單,究竟說了啥?又體現了哪些行業(yè)共同趨勢?
我們提綱挈領、抓取歸納其中要點,從點到面一文看懂。
百度AI的2019:技術→平臺→生產力
整份成績單中,技術突破與生態(tài)建設是重中之重,占據了一半篇幅。
剩下的一半中,應用落地與產業(yè)升級占據了很大篇幅。
這也體現出了AI當前發(fā)展階段——技術仍舊占據核心,但落地以及產業(yè)應用正在被放到更加重要的位置。
整體上來看,百度的成績單可以分為三大部分:
- 一是基礎研究。
- 二是技術生產力轉換。
- 三是生態(tài)平臺的建設。
首先看基礎研究,一年包攬了23項國內外競賽冠軍。
集中于百度大腦,語音、視覺、自然語言處理、知識圖譜等方面都有成果出現。
特別是語音語言,在2019年迎來階段性豐收時刻。
語音識別方面,百度提出了流式多級的截斷注意力模型 SMLTA,這是全球范圍內首次實現流式注意力建模,超越整句注意力模型的性能,大幅提升了語音識別準確率和速度(15%-20%),也是國際上首次實現在線語音識別大規(guī)模使用注意力模型。
語音合成方面,針對風格遷移、音色模擬和情感擬人的三大領域內挑戰(zhàn),百度推出語音合成技術 Meitron ,僅需20句話就可以制作一個人的專屬聲音。
此外,作為認知智能的“奧林匹克”,自然語言處理技術(NLP)的進展在今年最為奪目,全球亮點頻出。
代表中國“參賽”的百度,交出了可持續(xù)學習的知識增強語義理解框架ERNIE(艾尼),在16 個中英文任務上超越BERT、XLNET,取得SOTA 。
2019年12月,ERNIE在GLUE上登頂第一,并以9個任務平均得分首次突破90大關,刷新榜單歷史,超越微軟、谷歌提出的一眾國際頂級預訓練模型。
基于語音和語言方面的突破,百度還提出了基于深度注意網絡的多輪響應選擇匹配模型——DAM,口語理解能力被大幅提升。
值得一提的是,雖然全球范圍內視覺為核心的感知智能已經邁步廣泛落地應用期,但在2019年,百度還是秀出了“百尺竿頭更進一步”的基礎研發(fā)實力。
除了形成包括圖像、視頻、AR/VR、重要垂類、軟硬一體化五大方向的特色視覺技術矩陣。
百度還在CVPR 2019豪奪10項冠軍,包括OCR、物體檢測、視頻理解、目標跟蹤等圖像與視頻技術領域。
此次AI復興,除了算法,另一項重要基礎變革在于計算力。
百度也在成績單中詳細分享了突破:
2019年12月,基于百度自主研發(fā)的中國首款云端全功能AI芯片“昆侖”的云服務器正式上線,在150瓦功耗下能帶來260萬億次定數的AI運算,提供512GB/s的內存帶寬。
量產了專為遠場語音交互打造的百度鴻鵠芯片,100mW 左右平均工作功耗,即可支持遠場語音交互核心的陣列信號處理和語音喚醒能力等等。
而且,百度的算力發(fā)展并不僅僅只是單點發(fā)展,也已經與算法、飛槳框架連點成線,并交織成了堅實的基礎層,形成了協同效應。
通過芯片、連接、系統(tǒng)和調度的協同設計和技術創(chuàng)新,對AI計算架構進行升級,可以提供百萬TOPS的強大算力。
正在建造的計算集群,基于百度飛槳研發(fā)的AI控制系統(tǒng),設計年均PUE1.15,基礎設施能耗降低70%,每個可用區(qū)每年節(jié)電超過2億度,相當于10萬戶居民一年的用電量。
下一代計算——量子計算方面也有新突破。
研發(fā)出國際領先、國內第一的云上量子脈沖系統(tǒng)“量脈”,可將量子計算軟件指令(邏輯門)轉換成控制量子硬件的脈沖序列,算法性能較同類工具實現成倍的提升,是實現量子軟硬件連接的關鍵橋梁。
當然,區(qū)別于科研機構,百度作為企業(yè)組織,基礎技術突破自然不會止步于理論本身。
在技術轉化成生產力方面,百度展示了一幅AI落地全景圖。
百度旗下的多款應用與業(yè)務中已經轉換成了AI引擎,而且其也正在開放能力,共享產業(yè)升級紅利。
在小度助手5.0?上,成熟應用了全雙工免喚醒能力,實現了“一次喚醒,多輪交互”免喚醒詞連續(xù)對話,這也是全球領先的技術落地。
援引第三方機構數據,第二季度小度系列智能音箱出貨量位居全球第二、國內第一,同比增長率高達3700%。
而且技術突破和落地,也進一步打破產品舊邊界。作為“音箱”被歸類的AI交互硬件,在小度系狂飆突進下,開始真正展現AI時代交互終端的樣子——AI音箱不再是音箱。
百度輸入法方面,剛才提到的重要基礎突破,流式截斷的多級注意力模型(SMLTA)已經上線,效果立竿見影,在線語音識別相對準確率,比同領域最優(yōu)玩家還有高15%。
好消息是,離線語音識別準確率已經達到在線識別水平,且可以實現高精準中英文混合語音輸入、方言免切換語音輸入,這也是業(yè)內首次。
在機器翻譯方面,繼提出了多任務學習、多智能體聯合訓練等前沿方法,在2019年WMT評測中取得中英翻譯第一,提出了首個具有預測和可控時延的同傳模型,也是首個語義單元驅動的上下文同傳模型,并研發(fā)了語音到語音的同傳系統(tǒng),無需經過語音識別轉錄,同樣是業(yè)內首次。
而視覺為代表的感知智能落地,最具業(yè)內反響的是自動駕駛。
在業(yè)內“華山論劍”頂會CVPR 2019,百度Apollo公開了國內唯一的純視覺L4級自動駕駛解決方案——Apollo Lite,能夠支持對10路攝像頭、200幀/秒數據量的并行處理,單視覺鏈路最高丟幀率能夠控制在5‰以下,實現全方位360°實時環(huán)境感知,前向障礙物的穩(wěn)定檢測視距達到240米。
相比旋轉式激光雷達感知方案,視覺感知方案價格低廉且便于獲得。并以計算機視覺和AR技術研發(fā)了一種增強現實的自動駕駛仿真系統(tǒng)(AADS),使用激光雷達(LiDAR)和相機掃描街景。
合成虛擬形象也是今年最“性感”的落地應用之一,并且達到了量產的水平。
百度與央視合作打造AI虛擬主持人小靈,亮相央視2019五四晚會;與澎湃新聞合作打造了第一個真人形象的虛擬主播早晚新聞欄目;與浦發(fā)銀行合作打造了業(yè)內首個“金融數字人”。
基于知識圖譜的視頻語義理解,則已經在百度視頻搜索、推薦、內容生成等多個產品上線。
通過對視頻的視覺、語音、文本的多模態(tài)知識解析,在多元異構知識圖譜上建立關聯,并通過計算推理,建立對視頻的深度語義理解,大幅度提升視頻理解效果。
而且AI落地在今年也不再陽春白雪,更多接地氣、可以被尋常百姓家感知的科普式方案也引起反響。
比如百度AI開發(fā)者大會上,打造了能說會道的機器臂“茶博士”。
利用3D視覺技術,可以對茶杯的位置進行檢測和追蹤。通過機器人運動規(guī)劃和控制,可以對工作空間進行碰撞檢測,避開障礙物。完成實時規(guī)劃運動后,可自動生成倒茶軌跡。語音語義聯動技術解析,更是讓機器人像“人”一般,聽得懂,說得好,做得準。
最后,有技術、有落地應用之外,百度更宏大的雄心也徐徐展露——基于技術與應用優(yōu)勢,百度希望更進一步:打造平臺,打造生態(tài),成為AI世界的底座。
今年成績單中,開發(fā)生態(tài)方面的數據同樣非常醒目。
從百度當前的業(yè)務布局來看,其已形成了4大底座平臺:
- 百度大腦AI開放平臺
- 飛槳產業(yè)級深度學習開源開放平臺
- Apollo自動駕駛開放平臺
- 小度開放平臺
并且在2019年都實現了爆發(fā)。
百度大腦開放平臺已經在語音、視覺、語言等方面實現全面升級,具備深度學習框架、場景化AI能力、定制化訓練平臺到軟硬一體模組和解決方案等。
自2016年以來,百度已開放228項AI能力,開發(fā)者數量超過150萬,日均調用量突破1萬億次,語音、人臉、NLP、OCR調用量中國第一,是業(yè)內最全面、最領先、服務規(guī)模最大的AI開放平臺。
援引IDC最新報告,百度飛槳與谷歌、Facebook名列前三,領銜中國深度學習平臺市場,也是市場份額前五中唯一的國貨。
Apollo自動駕駛開放平臺已經匯聚了全球156家生態(tài)合作伙伴;在全球,有97個國家超過3.6萬名開發(fā)者使用Apollo開源代碼,開源代碼數量超過65萬,已成為全球最強大、最開放、最活躍的自動駕駛平臺。
而且開放能力進一步打破邊界,在剛召開的首屆Apollo生態(tài)大會上,百度Apollo拓展裂變成三大平臺:自動駕駛開放平臺、車路協同開放平臺,智能車聯開放平臺,成為中國自動駕駛基建國家隊代表。
小度技能開放平臺上,技能開發(fā)者數量已經超過3.7萬人,可提供包括游戲、效率工具、網絡電臺、直播、兒童教育、智能家居等3500多種技能支持。合作伙伴數量已經超過500家,可以控制的IoT智能家居設備已經超過了7000萬。
此外,百度還開源了中國首個邊緣計算框架BAETYL、自研底層區(qū)塊鏈技術,并發(fā)布了多個工業(yè)級的領域數據集,如大規(guī)模自動駕駛數據集、街景圖像數據和文字場景數據集、視頻精彩片段、場景解析、機器閱讀理解、中文句子及相應的開放域信息提取事實數據集等等,來促進算法研究,推動AI發(fā)展。
比如下圖,就是ApolloScape數據集示例:上半截為彩色圖像,下半截是其二位語義標簽:
正如百度董事長兼CEO李彥宏所說:“作為一家平臺級企業(yè),成就他人、造福社會,這是百度創(chuàng)始初心與能力之所在,更是百度在行業(yè)發(fā)展關鍵時刻責無旁貸之所在!”
正是基于如此,百度才能夠通過百度智能云的“云+AI”能力,為各行各業(yè)大規(guī)模輸送百度的AI技術成果與平臺能力,成效也非常顯著。
根據IDC在11月底發(fā)布的中國AI云服務市場報告,百度智能云在AI技術、市場和商業(yè)上處于中國領先地位,超過了阿里云、AWS等一眾廠商。
百度CTO王海峰感慨,百度在2019年提出“人工智能進入工業(yè)大生產階段”,如今他們已經探索了AI進入“工業(yè)大生產”的真實路徑,推動AI邁入自動化、標準化和模塊化的新階段,并與百度業(yè)務以及各行各業(yè)的生產實踐深入結合,加速產業(yè)智能化進程。
在互聯網、金融、智能城市、工業(yè)制造等行業(yè)已經擁有標桿性落地案例。
比如,與中國聯通打造的智能客服已經在中國聯通三省一基地上線;與央視網共建人工智能研發(fā)中心,打造媒體行業(yè)的AI軟硬件產品;與精研科技打造智能質檢車間,提升制造業(yè)質檢效率,降低用工成本等等。
但百度的技術,并不僅僅希望體現在商業(yè)價值上,還希望通過社會價值,展現AI福祉。
成績單中披露,2019年“百度 AI 尋人”平臺,用戶發(fā)起照片比對超過了36萬次,9000多個走失者與家庭重新團聚。
百度還發(fā)布了聽障兒童無障礙閱讀計劃,推出了全球首款聽障兒童AI手語翻譯小程序,能將繪本文字翻譯為手語,幫助聽障兒童實現無障礙閱讀。
此外還將AI應用在了臺風路徑查詢、瀕危土家語保護、改造盲人按摩院等方面,進一步發(fā)掘AI價值。
所以百度AI如何回答2019?上述種種業(yè)績就是關鍵要素。
而且巨頭玩家年度交卷,自然也是整個AI產業(yè)的共性、趨勢反映。
正所謂窺一斑見全豹,百度的成績單又反映出怎樣的AI 2019?
百度成績單背后的全球AI六大趨勢
或許你會疑惑,百度上述新突破、新進展,為何發(fā)生在2019?
背后有百度的技術積累開花結果,但也是AI發(fā)展進程使然。
這也是為什么百度的2019更值得被復盤解讀,其中展示全球AI領域發(fā)展的六大趨勢。
趨勢一:CV之后,NLP領域成為下一個突破頻出的領域
在百度交出的AI成績單中,更多的AI突破與生產力轉換都集中在語音語言理解方面。
比如語音識別、語音合成、虛擬主播、機器翻譯、人機對話、知識圖譜等等,并落地到了小度助手、百度地圖、百度視頻等等產品與應用之中。
這也體現出了整個人工智能當前的技術突破集中點:自然語言處理方向。
計算機視覺是人工智能產業(yè)中最為成熟的方向,人臉識別已經進入了尋常百姓家,整個方向徹底進入落地期。
早年圍繞這一技術發(fā)展起來的第一波AI獨角獸,也已經在想辦法向更多的方向拓展。曠視發(fā)力IoT供應鏈,依圖做起了芯片,而商湯在教育、AR、自動駕駛方向頻頻發(fā)力等等。
與此形成對應的是,NLP方向突破頻頻。谷歌的BERT直接催生出了更多的變體,機器在自然語言處理與語義理解上更為突出,GPT-2的問世也進一步彰顯出了整個方向的創(chuàng)造力與活力。
眾所周知,AI可以被劃分為“感知智能”和“認知智能”兩大版塊。
但2012年ImageNet石破天驚開始,感知智能的進展要遙遙領先于認知領域,直觀類比來說,感知就像一個人類能考到95分的試卷,而認知領域,夠到及格還挑戰(zhàn)連連。
于是2019年,全新氣象和里程碑進展頻頻,以語言語音為代表的認知,進入突破期。
趨勢二:落地為王,價值重估,AI發(fā)展回歸理性
2019年,整個人工智能產業(yè)變得更加務實。
絢麗的Demo少了,關于將AI應用到產品、落地到場景中呼聲更多了。
這是對前些年人工智能領域“大躍進”的最直接回應,AI發(fā)展理性回歸,從資本方到企業(yè),整個行業(yè)的參與者都在要求AI展示“降本增效”,來轉化成真實的生產力。
2019年的百度,在落地與AI生產力轉換方面再明顯不過。
最典型如自動駕駛領域有L4級視覺感知解決方案Apollo Lite和增強現實的自動駕駛仿真系統(tǒng),對于自動駕駛落地,全球都在要求進入“平民”時代,依靠堆高精尖傳感器的“貴族”玩法,市場空間越來越小。
這也是全球自動駕駛經受重估的一年。
國際上,Waymo模式遭遇質疑和重估,摩根大通將其估值調低40%,而在貨運領域自動駕駛落地則熱火朝天,兩種不同形態(tài)一對比,才知道“看不見的手”想要的不再是遙遠的迷人圖景,它想要的是——少廢話,證明價值吧。
趨勢三:人工智能進入工業(yè)大生產階段,需要標準化、自動化和模塊化
在談到人工智能的時候,很多人都會將其提為“新一輪的科技革命”,并將其比作蒸汽、電力等等。
但現實給出的種種反饋都頗為直接地展現出,在給出這一結論的時候,要用將來時態(tài)。從現在到將來缺了什么?
王海峰在2019年提出觀點稱,前三次工業(yè)革命的核心技術都具有很強的通用性,呈現出標準化、自動化和模塊化的工業(yè)大生產特征。
而人工智能想要如此,自然也需要具備這些特征。這也是人工智能產業(yè)向前發(fā)展的根本所在。
前些年的人工智能落地,都體現在一個case接一個case的模式,現在進入工業(yè)大生產階段,則要求人工智能體現出更加通用特征,一個產品能夠處理多個case,人工智能的能力要標準化、自動化和模塊化。
百度的成績單中,百度大腦、飛槳、小度助手、Apollo等平臺,都是百度對這一趨勢給出的回應。
飛槳、Apollo等開放平臺被國際知名第三方機構波士頓咨詢,作為中國AI發(fā)展的代表,并在全球范圍內與谷歌相提并論,認為開放平臺正是巨頭優(yōu)勢和推動智能化變革的關鍵。
由此第四大趨勢也愈加風勁。
趨勢四:大公司大平臺爭奪“底座”愈加激烈
毫無疑問,將人工智能轉化為生產力需要生產工具。誰提供的生產工具使用的越多,誰就能在生產力轉化中占據上風,畢竟這是人工智能驅動的世界底座。
伴隨著2019年人工智能落地提速,大公司大平臺爭奪“底座”愈加激烈。TensorFlow和PyTorch展開“廝殺”。前者推出2.0版本,后者將目光也進一步強化端側部署,各不相讓。
畢竟以深度學習框架為核心的深度學習平臺,下接芯片,上承各種應用,是“智能時代的操作系統(tǒng)”。
百度飛槳也在2019年迎來多次進化,推出多端多平臺部署的高性能推理引擎Paddle Lite、發(fā)布超大規(guī)模深度學習模型訓練技術等等動作,也為其更好地展開競爭提供了支撐。
國內競爭中,華為加入戰(zhàn)局、阿里從底層芯片和架構出發(fā),騰訊也加大開源力度……
所以爭奪的AI時代“底座”,也是新時代的“鐵王座”。
趨勢五:AI向善、倫理問題更受關注
在人工智能技術產生商業(yè)價值的同時,如何更好地利用人工智能技術也成為世界范圍內被廣泛討論的話題。
在學界,有今年3月斯坦福大學正式成立以人為本AI研究院,李飛飛擔任聯合主任,推動人工智能研究、教育、政策和實踐,以改善人類狀況。在業(yè)界,Facebook、谷歌等科技巨頭在AI應用方面的做法也屢遭抗議與審查。
國內也不例外,關于AI倫理的探討、探索也在展開。在百度的成績單中,AI倫理、安全以及社會責任都被著重強調,并給出了探索成果。
一方面是打造了完整的AI安全體系,另一方面在AI向善方面落地:“百度 AI 尋人”平臺幫助超過9000個走失者與家庭重新團聚。
AI在臺風路徑查詢、瀕危土家語保護、A改造盲人按摩院等方面也都發(fā)揮著重要作用。
此外,另一巨頭騰訊,也在AI時代變革思考后,把“科技向善”正式寫入公司使命和愿景,體現了對新時代倫理的重視。
全球范圍內,谷歌的AI軍用代表事件則內外廣受爭議,Facebook年初開始的數據泄露事件則被批判至今……AI時代面臨的新倫理、隱私邊界,并非說說而已。
趨勢六:自主可控正在成為中國AI熱詞
最后,全球局勢帶來作用力,中國呈現反作用力。
2019年的斷供危機以及“實體清單”威脅,讓自主可控成為新的關鍵詞。
在百度成績單中,完全自主研發(fā)的“百度昆侖云服務器”,讓中國AI跑在自主可控的AI芯片上,與飛槳、ERNIE等國產算法形成了軟硬件一體的核心競爭力。
而且,百度的努力也不僅僅體現在自身體系之中,飛槳還與華為麒麟、寒武紀等國產芯片深度合作,打通深度學習框架與芯片AI算力,提升中國的AI競爭力。
而且更進一步,所有中國AI公司、科技公司,經此一役,已經明白“原創(chuàng)”、“自主”和“脫鉤方案”的必要性和重要性。
AI造芯浪潮復興,依圖等算法公司深入AI芯片腹地,聯想等公司也推出自主可控防斷供方案,國家層面則在底層技術和基礎科研方面,前所未有重視。
雖然短期內對所有技術公司形成了挑戰(zhàn),但長遠來看,或許也是歷史性機遇:
自強則萬強。
中國AI人才培養(yǎng)基地,專利申請重鎮(zhèn)
對基礎和底層重視,最直接體現就是對人才、專利方面的重視。
這一次百度成績單中,也有重點展示。
今年是百度創(chuàng)立20年,過去20年中,從人才角度而言,國內以技術著稱的百度,直接和間接培養(yǎng)了大批人才,成為名副其實的技術領域的“黃埔軍?!?。
而更令人欣喜的是,百度在AI發(fā)展中主動展現出的人才培養(yǎng)心態(tài)。
根據百度成績單,百度AI已經形成了囊括師資培訓、學生賽事、課程共建以及教材出版等多個維度產學融合生態(tài)。
推出了“全國高校深度學習師資培訓班”、“飛槳博士會”、“AI快車道”、“黃埔學院”、“在線深度學習集訓營”等項目,一共培養(yǎng)1000名專業(yè)教師,助力200+高校開設深度學習課程,為近1000家企業(yè)提供技術和應用培訓。
而硬件方面,百度上線AI Studio 教育版,這背后是價值超過千萬人民幣的上千張GPU卡,作為師資培訓配套“教具”,免費提供給高校使用等等。
雖然百度人才培養(yǎng)模式,更多出于“底座”雄心,但客觀而言,一定會加快中國AI技術進一步普及,以及更多人才帶來星火效應。
從整個產業(yè)發(fā)展而言,樂見其成,也希望巨頭投入更大資源。
人才之外,還有專利。
重視基礎科研,自然會體現在知識產權能力上。國家工業(yè)信息安全發(fā)展研究中心12月發(fā)布的《人工智能技術專利深度分析報告》中給出例證,百度專利申請數量在國內排名第一,達到5712件,超過第二名近1600件。
在中國專利申請數量超越美國方面,可以說是當為頭功。也算是作為國產AI第一大廠的實力和擔當。
One more thing…
回顧2019年,正如王海峰所總結的那樣,百度AI打造了扎實的底座;推動了真實的改變;創(chuàng)造了值得信賴的未來。
當然,AI突破還在繼續(xù)、AI落地也還在繼續(xù),從這份百度成績單中我們也能窺見到中國AI領域的一個縮影,讓更多人了解AI,也能給大小公司的AI之路提供參考,知曉智能時代變革如今身處何處、未來又走向何方。
不過,每個人都有每個人的AI見證時刻。
所以也想小小互動一下:
2019年里,你印象最深刻的AI事件是哪一個?
- 滴滴副總裁葉杰平離職,他是出行巨頭的AI掌門人,戰(zhàn)勝Uber中國的關鍵科學家2020-09-07
- 董明珠的格力空調賣不動了:上半年營收同比腰斬,24年來首次被美的反超2020-09-01
- 手機配件市場上的“隱形巨頭”:80后長沙夫妻創(chuàng)辦,IPO首日市值逼近600億2020-08-31
- 寒武紀半年報:每天虧百萬,銷售力度提升營收反降11%,上市高峰市值跌去40%2020-08-30