IDC最新報告:阿里語音AI登頂中國No.1
阿里巴巴,同樣正在用自己的行動踐行使命:讓天下沒有難得到的技術(shù)。
乾明 發(fā)自 凹非寺
量子位 報道 | 公眾號 QbitAI
沒錯,阿里并非先發(fā)的語音AI,現(xiàn)在中國市場份額第一。
7月14日(周二),IDC發(fā)布《中國AI云服務(wù)市場半年度研究報告》顯示,阿里語音AI以44%的市場份額,超過百度云、騰訊云、華為云、AWS、微軟Azure等云服務(wù)廠商,成為第一。
從IDC報告的具體內(nèi)容來看,阿里語音AI這個No.1,得益于其在智能語音、對話式AI、機(jī)器學(xué)習(xí)三大領(lǐng)域的實力:
智能語音領(lǐng)域產(chǎn)品數(shù)量、市場份額、API調(diào)用量三項第一;對話式AI領(lǐng)域市場份額、API調(diào)用量兩項第一;機(jī)器學(xué)習(xí)領(lǐng)域獲得市場份額第一。
這還只是現(xiàn)狀。
IDC還預(yù)測,2020年中國人工智能市場規(guī)模將會接近20億美元,巨大的市場規(guī)模,作為市場領(lǐng)導(dǎo)者,阿里將會有更多的表現(xiàn)空間。
然而,對于這樣的一份成績單,阿里巴巴達(dá)摩院語音實驗室負(fù)責(zé)人鄢志杰,并不“感冒”。
在他看來,IDC報告中的數(shù)字并不重要,更值得關(guān)注的是背后的趨勢:語音AI技術(shù)的商業(yè)價值,已經(jīng)在市場上得到了初步體現(xiàn)。
他說,阿里巴巴之所以有這樣的成績,不僅僅有過去5、6年時間的技術(shù)積累為基礎(chǔ),還在于AI上云的過程中,找到了“落地”秘訣。
中國No.1的語音AI,如何后發(fā)先至?
相比90時代就搞語音的玩家,阿里的語音AI之路,不算早。
阿里開始大力度、嚴(yán)肅地研發(fā)語音AI技術(shù),起于2014年底,標(biāo)志性事件是“神秘部門”iDST(數(shù)據(jù)科學(xué)與技術(shù)研究院)成立。
在此之前,相關(guān)的研究只是零散地分布在各個業(yè)務(wù)線之中。
2015年,鄢志杰在微軟亞洲研究院工作7年后,加入阿里iDST,負(fù)責(zé)語音技術(shù)的研發(fā)工作。
當(dāng)時,語音AI技術(shù)主要用于阿里內(nèi)部業(yè)務(wù),比如淘寶、天貓的等電商體系客服中心的需求。
因為之前沒有研究積累,鄢志杰需要帶隊從0到1,為阿里打造一個能用、好用的語音AI系統(tǒng)。
雖然困難,但也好在沒有“歷史包袱”,他可以放開手去做。
在阿里豐富的應(yīng)用場景下,阿里語音AI的后發(fā)優(yōu)勢顯現(xiàn)出來。
比如2016年開始備受關(guān)注的latency-controlled BLSTM(LC-BLSTM) 模型,從學(xué)界到阿里率先實現(xiàn)落地,只用了幾個月的時間。
而且不僅僅只有單純的落地,還有面向應(yīng)用的優(yōu)化。
在阿里版本的LC-BLSTM模型中,不僅降低了傳統(tǒng)BLSTM模型延遲嚴(yán)重的問題,精度同樣不差。
相關(guān)論文也得到了學(xué)術(shù)界的認(rèn)可,在2017年經(jīng)過同行評審,發(fā)表在了IEEE旗下ICASSP(聲學(xué)語音和信號處理國際會議)上。
之后,阿里語音AI進(jìn)一步發(fā)展,不斷涌現(xiàn)出新的研究成果,被ICASSP、DSP等語音領(lǐng)域國際頂尖會議收錄。
2019年2月28日,MIT將阿里巴巴語音AI技術(shù)評為2019年“全球十大突破性技術(shù)”。
MIT認(rèn)為,阿里巴巴已擁有比谷歌更好的AI語音技術(shù),可以完成復(fù)雜的人類對話功能,甚至可讀懂人類的潛在意圖。
阿里巴巴也是唯一上榜的中國科技公司,其他的突破技術(shù)分別是“腸道顯微膠囊”、“定制癌癥疫苗”、“人造肉漢堡”、“可穿戴心電儀”、“無下水道衛(wèi)生間”等等。
突破仍在繼續(xù)。2019年7月,阿里發(fā)布新一代語音合成技術(shù)KAN-TTS,首次將該數(shù)字提高到97%以上。
阿里達(dá)摩院介紹,KAN-TTS已經(jīng)實現(xiàn)主流場景風(fēng)格聲音的全覆蓋,可針對通用場景、客服場景、童聲場景、英文場景和方言場景,提供41種高品質(zhì)的聲音,例如溫柔、甜蜜、嚴(yán)厲等風(fēng)格。
而且還具備多方言、重口音語音識別,全雙工語音交互,智能語音流式響應(yīng)等技術(shù)能力。
鄢志杰說,它已經(jīng)能夠?qū)崿F(xiàn)擬人程度更高的交互效果,整個過程幾乎聽不出是AI在跟人交互。
想要推動技術(shù)落地,技術(shù)強(qiáng)是根本,但找到商業(yè)價值和模式更加重要。
在鄢志杰看來,這是阿里語音AI技術(shù)發(fā)展到現(xiàn)在最難的一個點,也是其能夠得到市場認(rèn)可的關(guān)鍵。
自學(xué)習(xí),阿里語音AI的落地秘訣
2017年初,阿里開始推動AI技術(shù)上云對外輸出,語音AI作為阿里內(nèi)部廣泛應(yīng)用且成熟的技術(shù),成為“先鋒”。
語音AI上云后,阿里對外輸出的第一個項目,是為浙江高院提供庭審速記能力。
拿下行業(yè)頭部用戶,是推動AI技術(shù)落地時最常用的一種手段。
其不僅能夠產(chǎn)生“標(biāo)桿效應(yīng)”,吸引更多的人采用技術(shù),而且還能在這個過程中,快速汲取行業(yè)Know—How,來完善技術(shù)方案,更好地復(fù)制到其他相似場景中。
目前,阿里智能庭審語音識別覆蓋超過全國20個省的8000間線下法院,覆蓋率近50%?;ヂ?lián)網(wǎng)庭審覆蓋15000余間線上法庭,覆蓋率超過90%。
IDC報告也給出了分析稱,通過前期的行業(yè)布局,阿里云在法院、呼叫中心、電信運營商領(lǐng)域的客戶認(rèn)知度也處于第一位,領(lǐng)先其它云服務(wù)廠商。
不過,這樣的AI落地模式也存在弊端——依賴項目推進(jìn),不僅需要大量的人力資源,效率并不高。
如何找到一種更高效的落地方式,是整個行業(yè)都面臨的挑戰(zhàn)。
同樣是在2017年,阿里語音AI團(tuán)隊在與客戶共創(chuàng)的時候受到啟發(fā),基于“定制AI”打造出了語音自學(xué)習(xí)平臺,面向沒有技術(shù)研發(fā)實力的客戶提供語音原子能力、行業(yè)模型等服務(wù)。
鄢志杰將其形容為“傻瓜相機(jī)”式的產(chǎn)品。
阿里提供針對聲學(xué)模型和語言學(xué)模型的定制訓(xùn)練流程,用戶在安全環(huán)境中灌注行業(yè)數(shù)據(jù),可以在完全不了解語音語言算法的情況下,快速、便捷地定制自己的語音模型。
在落地過程中,也展現(xiàn)出了效力。比如疫情期間,湖北的智能疫情機(jī)器人使用阿里語音AI自學(xué)習(xí)平臺,湖北口音語音識別率從62.5%提升至94.4%。
IDC在報告中總結(jié)稱,語音語義領(lǐng)域,用戶重視的是服務(wù),能不能滿足客戶的個性化需求十分重要。
阿里語音AI能夠?qū)崿F(xiàn)大面積落地,在法院、呼叫中心、電信運營商領(lǐng)域的客戶認(rèn)知度處于第一位,擁有教育、金融、互聯(lián)網(wǎng)、交通、餐飲、通信、醫(yī)療等各行各業(yè)5萬家客戶,秘訣正在于此。
現(xiàn)在,鄢志杰正在致力于將語音AI技術(shù)拓展到更多的場景中,供給無處不在的智能語音。
在他看來,整個語音AI的價值才剛剛開始呈現(xiàn),市場還處于早期發(fā)展階段,未來將會有更大的發(fā)揮空間和價值。
比如,如果在強(qiáng)噪音、多人交互的情況下,實現(xiàn)更高準(zhǔn)確率的識別,比如語音和NLP技術(shù)的結(jié)合,實現(xiàn)語音翻譯、語音摘要技術(shù)等等。
而且隨著新基建機(jī)遇到來,語音AI與云結(jié)合,還會有更大的前景。
被集成,阿里的“基建式”打法
2020年4月20日,阿里云宣布未來3年規(guī)劃:再投2000億,用于云操作系統(tǒng)、服務(wù)器、芯片、網(wǎng)絡(luò)等重大核心技術(shù)研發(fā)攻堅和面向未來的數(shù)據(jù)中心建設(shè)。
阿里到底如何做?具體做什么?想要達(dá)到什么樣的效果?阿里語音AI無疑給出了直觀體現(xiàn)。
一方面基于阿里達(dá)摩院,從未來商業(yè)價值出發(fā),提升技術(shù)層面上的能力,進(jìn)行前瞻性研發(fā)布局。
另一方面在于阿里云平臺的能力建設(shè),供應(yīng)更強(qiáng)的算力,為技術(shù)對外輸出提供堅實支撐。
再往底層芯片上面,平頭哥也在積極布局,前不久已經(jīng)實現(xiàn)含光800商用,通過阿里云對外輸出。
……
一系列動作背后,也不難發(fā)現(xiàn)阿里的目標(biāo)所向——打造基礎(chǔ)設(shè)施,供應(yīng)給有需求的客戶,甘愿被集成,幫助他們來打造成落地的應(yīng)用,服務(wù)更多人。
鄢志杰說,阿里內(nèi)部有一個口號是“達(dá)摩院技術(shù)零時差上云”。阿里語音AI技術(shù),就是其交出的答卷之一。
1999年,阿里巴巴在杭州成立之時,定下了公司的使命:讓天下沒有難做的生意。
這也成為了阿里孵化出淘寶、支付寶、天貓、菜鳥等等一系列產(chǎn)品的出發(fā)點,打造出了輻射數(shù)億人的阿里經(jīng)濟(jì)體。
現(xiàn)在,經(jīng)濟(jì)發(fā)展的驅(qū)動力逐步發(fā)生改變,AI、大數(shù)據(jù)為核心的新興技術(shù),在“生意”中變得越來越關(guān)鍵。
阿里巴巴,同樣正在用自己的行動踐行使命:讓天下沒有難得到的技術(shù)。