1024,點(diǎn)亮人間煙火
科大訊飛開放平臺10周年的答案
楊凈 曉查 發(fā)自 凹非寺
量子位 報(bào)道 | 公眾號 QbitAI
20年前,安徽合肥一群來自中科大的探路者押注AI,成立科大訊飛。現(xiàn)在合肥被稱為中國“最敢賭”、最牛的風(fēng)險(xiǎn)投資機(jī)構(gòu)。
10年前,科大訊飛人工智能開放平臺發(fā)布。
現(xiàn)在這個平臺上的開發(fā)者,從十幾個團(tuán)隊(duì),成長到超過150萬家;應(yīng)用終端數(shù)從不到10萬,增長到超過20億;而這個平臺能提供的能力,從當(dāng)年的語音合成和識別兩個,大幅提升到如今的334種復(fù)雜AI技能。
在訊飛之上已經(jīng)成長出一套成熟的生態(tài)系統(tǒng)。今天,已經(jīng)創(chuàng)下史上最佳業(yè)績的科大訊飛,要向著新十年重新出發(fā)。
人工智能紅利三大標(biāo)準(zhǔn)
十年過去,時代變了。
如何看待如今的天下大勢,科大訊飛董事長劉慶峰總結(jié)了一套“3-4-3-4”的邏輯框架,為AI開發(fā)者和訊飛自己指出了方向。
首先是三大變化。
我們正處在新舊紅利的交替期。
第一個變化是:移動互聯(lián)紅利到期,而萬物互聯(lián)紅利開啟。越來越多的智能設(shè)備,將推動人機(jī)交互等業(yè)態(tài)的繁榮。
第二個變化是人口紅利到期,工程師紅利開啟。勞動生產(chǎn)效率將隨之大幅提升。
第三個變化是從為產(chǎn)品賦能,到為企業(yè)轉(zhuǎn)型升級賦能。劉慶峰指出,過去一年50萬創(chuàng)業(yè)者關(guān)注的重點(diǎn),不僅是利用訊飛的技術(shù)創(chuàng)造各種產(chǎn)品,而且還將技術(shù)用于提升自己的生產(chǎn)效率、提高市場營銷能力等方面。
變化之下,蘊(yùn)藏著哪些機(jī)遇?
訊飛的回答是四個:場景驅(qū)動、數(shù)據(jù)支撐、技術(shù)驅(qū)動、資本助推。簡單來說,就是有需求、有數(shù)據(jù)、有技術(shù)、有資本,而且這四個機(jī)遇的影響力還在不斷加大,并且將會為人工智能帶來前所未有的發(fā)展。
有變化、有機(jī)遇,還要有所為、有所不為,才能真正抓住新的人工智能紅利。什么是應(yīng)該干的?判斷標(biāo)準(zhǔn)有三個。
首先,要有看得見、摸得著的應(yīng)用場景。其次,要有能夠規(guī)?;茝V的產(chǎn)品。再次,要能產(chǎn)生比較優(yōu)勢的價值。總而言之,還是要抓大放小,提升效率。
其實(shí),對于這三大標(biāo)準(zhǔn),在去年發(fā)布會上已經(jīng)強(qiáng)調(diào)過了。為何一再強(qiáng)調(diào),自然也有科大訊飛自身的底氣在。
就在上一年,科大訊飛就創(chuàng)造了最佳歷史最佳業(yè)績,營收達(dá)到100.79億,首次破百億;凈利潤同比增長51.12%,達(dá)到8.19億,日均盈利224萬元。
所以,按照這樣的標(biāo)準(zhǔn),科大訊飛賺錢了,還賺了不少。
而到今年,訊飛給開發(fā)者提供的AI能力從去年的200項(xiàng)提升到了今年的334項(xiàng),開發(fā)者數(shù)量增加了50萬,開發(fā)了近93萬個應(yīng)用。
對于未來,科大訊飛又要怎么做呢?
劉慶峰給出了四個重點(diǎn)方向。
第一,持續(xù)優(yōu)化深度神經(jīng)網(wǎng)絡(luò)算法。用更少的數(shù)據(jù),得到更好的結(jié)果。
第二,讓機(jī)器學(xué)習(xí)能夠?qū)崿F(xiàn)半監(jiān)督和無監(jiān)督的學(xué)習(xí)。
第三,探索人工智能應(yīng)用的個性化。
第四,進(jìn)一步賦能數(shù)字生存時代。
訊飛的AI科技樹
「核心技術(shù)才能推動行業(yè)的發(fā)展。」這個整個大會上一直所強(qiáng)調(diào)的。
科大訊飛如今成立21周年,訊飛開放平臺成立了10周年,無疑不在證明著「核心技術(shù)」的驅(qū)動力。
就像今年科大訊飛AI研究院常務(wù)副院長劉聰在「新技術(shù)發(fā)布會」上構(gòu)筑的AI科技樹。
技術(shù)頂天,項(xiàng)目落地。
2019年,是人工智能規(guī)模化價值落地、行業(yè)全面AI化的一年。去年一年,訊飛就取得了不少成果。
AI+會議方面,聽見云會議為1000余家企業(yè)單位服務(wù)了近1000000次遠(yuǎn)程視頻會議,依托于科大訊飛的語音技術(shù)率最高達(dá)97.5%。
再比如在醫(yī)療領(lǐng)域,訊飛智醫(yī)助理機(jī)器人是全球第一個通過了國家執(zhí)業(yè)醫(yī)師資格考試的機(jī)器人,并超過了96.3%的人類考生。
過去,智醫(yī)助理已經(jīng)看了6000多萬病人了,開了8000萬的病例,把基層醫(yī)生的合理診斷度從70分提到了90多分。
那么以這三大標(biāo)準(zhǔn)為目標(biāo),站在AI核心技術(shù)的角度,又該如何思考和演進(jìn)呢?
通過幾個代表性方向技術(shù)最新進(jìn)展,劉聰給展現(xiàn)了科大訊飛科技樹的全景。
首先來看語音識別。
今年5月,訊飛繼續(xù)參加號稱史上最難語音識別任務(wù)的CHiME6比賽,獲得了三連冠,將最優(yōu)的錯誤率從上一屆的46%降低到這一屆的30.5%,進(jìn)一步接近了使用水平。
訊飛將自己的能力做成相關(guān)工具和平臺,提供給開發(fā)者,讓他們可以方便地進(jìn)行模型方案的更新。
在這個平臺上,針對某些產(chǎn)品,開發(fā)者可以在端側(cè)直接實(shí)現(xiàn)用戶無感知的個性化訓(xùn)練。以語音喚醒為例,基于一個通用的喚醒模型,針對特定喚醒詞,在10分鐘之內(nèi)即可實(shí)現(xiàn)一個模型自動優(yōu)化,使之達(dá)到使用門檻。
另外,此次發(fā)布會上,訊飛還給出了「全場景音頻解析」的解決方案,在復(fù)雜環(huán)境中的識別效果從60%提高到了85%。
接下來看一下語音合成。
對應(yīng)于剛才語音識別的全場景音頻解析,我們認(rèn)為語音合成也需要實(shí)現(xiàn)從語音到聲音的全場景音頻合成。
應(yīng)該來說除了在交互場景,我們將相關(guān)的方案在小說合成、在配音合成等場景也大有可為。另外一塊我們知道情感的表達(dá)和合成和預(yù)測也是我們語音合成當(dāng)中的一個重要的方向,也是業(yè)界的研究熱點(diǎn)。
近年來其實(shí)伴隨著深度學(xué)習(xí)的加持,科大訊飛也提出了基于聽感量化的多人混合訓(xùn)練等合成框架。并進(jìn)一步在向合成更有表現(xiàn)力對話場景演進(jìn)。
科大訊飛AI研究院常務(wù)副院長劉聰表示,他們已經(jīng)做到了接近4.5分的水平,也就是介于普通人標(biāo)準(zhǔn)發(fā)音和滿分播音員之間的水準(zhǔn)。
今年,訊飛又進(jìn)一步拓展了語音合成平臺能力。開發(fā)者可以基于自然語言理解技術(shù),從文本當(dāng)中分析到合適的情感焦點(diǎn),以及角色相關(guān)的信息,并通過語音呈現(xiàn)出來。
另一方面,通過對內(nèi)容的理解,開發(fā)者還能實(shí)現(xiàn)一人分飾多角和情感的變化。
接著,多模態(tài)生成。
訊飛早已不是一家單純的語音技術(shù)公司,為了讓聲音更富表現(xiàn)力,需要用多模態(tài)的方式呈現(xiàn)。除了讓語音更具情感外,也讓語音有了形象。
去年訊飛發(fā)布了全球首個多語種虛擬主播小晴,今年繼續(xù)發(fā)布了更多的虛擬主播,并已在多家媒體使用。
一方面為小晴研發(fā)了豐富的表情和動作生成能力,結(jié)合生活化場景的設(shè)計(jì)和終端性能的優(yōu)化,推出了更適合交互場景的虛擬形象;另一方面進(jìn)一步配合靜態(tài)和動態(tài)內(nèi)容的嵌入設(shè)計(jì),可以在更多場景應(yīng)用推廣。
例如利用虛擬形象技術(shù)、結(jié)合語音評測等相關(guān)技術(shù)開發(fā)的英文教學(xué)互動主播,可以讓英語學(xué)習(xí)更加生動有趣。
接下來,科大訊飛將開放60個語種的語音合成系統(tǒng),69個語種的語音識別系統(tǒng),平均識別率80%以上,重點(diǎn)語種90%以上。
還會開放56個語種的圖文識別系統(tǒng),針對通用文檔的平均準(zhǔn)確率在85分以上,168個語種的機(jī)器翻譯,其中35個常用語種和中文翻譯在口語場景下人工忠實(shí)度達(dá)到3.8分。
最后來看一下行業(yè)認(rèn)知。
認(rèn)知智能相對于以上語音圖像等感知智能其實(shí)難度更大。
過去幾年,訊飛在向教育、醫(yī)療、政法等行業(yè)的認(rèn)知智能取得了不錯的進(jìn)展。醫(yī)療認(rèn)知為例,2017年11月,訊飛醫(yī)考機(jī)器人以456的高分通過了國家職業(yè)醫(yī)師資格考試。
今年,訊飛在難度更大的多步推理機(jī)器閱讀理解HotpotQA上取得突破。
8月27號,訊飛哈工大聯(lián)合實(shí)驗(yàn)室用自主研發(fā)的MacALBERT模型,在這個任務(wù)上取得了綜合第一,代表了訊飛在認(rèn)知智能的通用技術(shù)上,持續(xù)保持業(yè)界一流的水平。
訊飛也基于這樣的技術(shù),針對中文領(lǐng)域,訓(xùn)練了業(yè)界效果領(lǐng)先的中文模型,并開放給業(yè)界,給研究人員提供相關(guān)的服務(wù),目前也是最受歡迎的中文預(yù)訓(xùn)練的模型之一。
在這次新技術(shù)發(fā)布會上,科大訊飛正式發(fā)布了認(rèn)知中臺,以自己的開放能力,向合作伙伴共享行業(yè)經(jīng)驗(yàn)。
最后,這些AI科技樹上的「果子」也都將服務(wù)百萬開發(fā)者。
共贏的平臺
今年對訊飛開放平臺有點(diǎn)特別——正好推出10周年。
從2010年10月28日發(fā)布到現(xiàn)在,訊飛的人工智能開放平臺上,已經(jīng)累積了334項(xiàng)的能力和方案,覆蓋230萬開發(fā)者和生態(tài)合作伙伴。
至今為止,這個平臺已經(jīng)面向14個行業(yè)發(fā)布了優(yōu)化專題。例如AI中臺、數(shù)據(jù)中臺等,也被不斷的整合進(jìn)來。去年發(fā)布的云端一體化交互方案,迄今已有超過有3000萬的裝機(jī)量,每天的交互的次數(shù)已經(jīng)超過了1億次。
那么今年的突發(fā)事件,對平臺影響幾何?
“疫情穩(wěn)定之后,我們發(fā)現(xiàn)基于訊飛開放平臺上的開發(fā)者進(jìn)入了一個更加快的增長節(jié)奏。連續(xù)三個季度的復(fù)合增長率已經(jīng)超過了53%,這是一個繼2016年以來的又一次的快速增長,”科大訊飛集團(tuán)副總裁于繼棟透露。
那么現(xiàn)在開發(fā)者都在利用訊飛平臺的AI技術(shù),做些什么事呢?
有一家輪胎生產(chǎn)企業(yè),利用AI視頻技術(shù)來監(jiān)控輪胎的澆注過程,用這個方法來高效解決雜質(zhì)介入的情況,提升輪胎質(zhì)量。而在建筑工地,視頻AI技術(shù)也被用來檢查安全帽的佩戴情況,提升了準(zhǔn)確率與安全性。
所有這些,都是企業(yè)的AI化、數(shù)字化升級的一部分。
對于這件事,科大訊飛認(rèn)為企業(yè)的最終的形態(tài),是一個智慧體。也就是通過AI的幫助,能夠更有針對性的提高生產(chǎn)率,找到企業(yè)發(fā)展的瓶頸并加以解決。
在訊飛的開放平臺上,AI服務(wù)市場就是專門用來解決定制化AI場景需求的服務(wù)。經(jīng)過兩年半的發(fā)展,已經(jīng)有超過500家服務(wù)商入駐。
這些服務(wù)商,目的就是幫助上游的企業(yè)客戶,解決他們在特定場景中面臨的定制化需求,借助AI技術(shù)完成企業(yè)的升級改造。除此以外,訊飛也對外開放了云平臺,進(jìn)一步助力AI技術(shù)的部署和實(shí)施。
“整個的數(shù)字化升級是一個非常巨大、非常深遠(yuǎn)的過程,”于繼棟說僅靠訊飛一家提供的服務(wù)遠(yuǎn)遠(yuǎn)不夠。合作共贏,正是訊飛開放平臺的意義所在。
1024開發(fā)者節(jié)
今年,雖然有疫情限制,活動形式采取線下與云端同步,但開發(fā)者、合作伙伴仍然熱情高漲。
有9118支團(tuán)隊(duì)來參加比賽,線上參加產(chǎn)品直播的企業(yè)數(shù)達(dá)到了491家,比去年同期增長50%。
今年科大訊飛開發(fā)者數(shù)量,從去年108萬人,到如今已經(jīng)有157萬開發(fā)者加入進(jìn)來。且開發(fā)應(yīng)用數(shù)量,從去年的70萬個到今年的93萬個。
訊飛給開發(fā)者提供的AI能力從去年的200項(xiàng)提升到了今年的334項(xiàng),AI應(yīng)用場景也達(dá)到了上百個。
此次開發(fā)者大會,訊飛還強(qiáng)調(diào)了為行業(yè)賦能。目前,訊飛已經(jīng)跟近百家龍頭企業(yè)形成合作,賦能行業(yè)企業(yè),包括海爾、海信、中國郵政、中電光谷等。
為什么會取得這樣的成績?劉慶峰表示,
我相信,是因?yàn)榇蠹铱吹搅巳斯ぶ悄軐ξ磥淼闹卮髴?zhàn)略意義。尤其是在疫情之后,企業(yè)更看到了人工智能在解決社會剛需上面的迫切需求。
而在今年,訊飛的開放力度更大。
在1024開發(fā)者節(jié)現(xiàn)場,科大訊飛高級副總裁、消費(fèi)者事業(yè)群總裁胡國平推出的《1024計(jì)劃4.0》,在先導(dǎo)計(jì)劃、城市計(jì)劃、公益計(jì)劃三個方面全新升級。
比如,在先導(dǎo)計(jì)劃中,就推出了面向行業(yè)的AI人才成長體系,上線提供了包括語音、圖像、自然語言理解以及核心底層的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等多層面體系課程,還特邀了AI的技術(shù)和應(yīng)用的專家錄制專業(yè)課程。
正如劉慶峰所說,AI生態(tài)已經(jīng)面臨著「人口紅利到期、工程師紅利開啟」的變化。
所以就在這一關(guān)鍵時候,訊飛給企業(yè)開發(fā)者提供了練手的好機(jī)會。
在城市計(jì)劃中,訊飛也彰顯出了自己的社會責(zé)任。他們分別從城市賦能、本地化服務(wù)和高校賦能上來展開。
目前,訊飛已經(jīng)在蘇州、長春、天津、青島等10個城市建立來人工智能產(chǎn)業(yè)加速中心。
而在高校賦能中,AI大學(xué)、AI競賽、AI社團(tuán)、AI實(shí)訓(xùn)營……讓更多的大學(xué)生來近距離的學(xué)習(xí)和實(shí)踐人工智能。
據(jù)說此次開發(fā)者大會上,訊飛還搭建了一個路演平臺,將有各個高校的10多個團(tuán)隊(duì)進(jìn)行創(chuàng)新創(chuàng)業(yè)項(xiàng)目展示。
再比如,公益計(jì)劃。
作為科大訊飛一直以來的主打項(xiàng)目,目前開放平臺已經(jīng)創(chuàng)建了22,459個無障礙應(yīng)用。這些應(yīng)用每天為我們的視聽障人群提供了超過5000萬次的AI服務(wù),累計(jì)服務(wù)障礙人群超過1087萬。
最關(guān)鍵的是,也就是在今天,訊飛開放平臺第一個無障礙版正式發(fā)布!專門為視障開發(fā)者打造的AI能力窗口。
可以說,因?yàn)橛辛碎_發(fā)者,「自己干不動」的訊飛,變得更強(qiáng)大了。
訊飛也因此,再以更開放、成熟的生態(tài)平臺來擁抱開發(fā)者。
就像劉慶峰在最開始所說,
創(chuàng)業(yè)的過程就像是登山,我們只有胸懷登頂?shù)膲粝?,一步一個腳印,踏踏實(shí)實(shí)的積累高度,最后才能登頂。
我們從來沒有看到過能夠獨(dú)行的登山者能夠登上喜馬拉雅山。
對于AI成功的秘訣,訊飛有自己的答案:唯有生態(tài),才能生生不息。
- 英偉達(dá)最新芯片B30A曝光2025-08-20
- AI應(yīng)用如何落地政企?首先不要卷通用大模型2025-08-12
- 本科必學(xué)Dijkstra算法被超越!清華段然團(tuán)隊(duì)打破圖靈獎得主證明的普遍最優(yōu)性2025-08-09
- 智能體邁入L4 時代!納米AI多智能體蜂群,可創(chuàng)作最長10分鐘AI視頻2025-08-06