網(wǎng)易 AI Lab 榮獲INTERSPEECH 2020 雙料冠軍
網(wǎng)易 AI Lab 從眾多國際頂級隊伍中脫穎而出,獲文本相關聲紋識別賽道 綜合排名第一、單模型第一的雙料冠軍。彰顯了網(wǎng)易 AI Lab 在語音聲紋識別技 術領域的領先地位。
近日,全球最大的語音會議 INTERSPEECH 2020公布了 SdSV 聲紋識別比賽 成績,網(wǎng)易 AI Lab 從眾多國際頂級隊伍中脫穎而出,獲文本相關聲紋識別賽道 綜合排名第一、單模型第一的雙料冠軍。彰顯了網(wǎng)易 AI Lab 在語音聲紋識別技 術領域的領先地位。
INTERSPEECH會議是全球最大的綜合性語音信號處理領域的科技盛會,業(yè)內享有極高的聲譽,對參與企業(yè)有著嚴苛的準入門檻要求。本次國際聲紋識別比賽的參賽隊伍來自國際多家知名高校與企業(yè),包括近兩年全球各項聲紋識別比賽中的“常勝將軍”:布爾諾工業(yè)大學、新加坡通信研究院、約翰霍普金斯大學等。
比賽采用 MinDCF(最小檢測代價)和 EER(等錯誤率)作為評測指標。網(wǎng)易 AI Lab 的單模型在兩個指標均為最佳,其中 EER 達到了 1.67%,相比第二名降低了 11.6%,并遠低于比賽 X-Vector 基線系統(tǒng)(EER=9.05%)。
除了在綜合指標上的領先外,網(wǎng)易 AI Lab 基于常見的 X-Vector 和 PLDA 算法,創(chuàng)新地提出了一種 ASR-free 的文本相關聲紋識別算法。相比傳統(tǒng)的 Deep Speaker Embedding 方法,該算法不需要依賴語音識別, 就能夠在多語言環(huán)境下,同時完成說話人和文本內容的驗證。
聲紋識別技術以往多應用于安防等場景中,而網(wǎng)易 AI Lab 則創(chuàng)新性的將聲紋識別技術與游戲場景結合,除了進行游戲身份驗證,還能夠針對音色對用戶進行分類、豐富玩家畫像,從而更加精準地為玩家推薦志趣相投的好友、匹配實力相當?shù)膶κ?,為玩家?guī)砀玫挠螒蝮w驗。
積極探索人工智能技術與應用場景的結合,是網(wǎng)易布局人工智能的重要方向之一。近日,網(wǎng)易CEO丁磊也在2020世界人工智能大會上表示,人工智能不是技術問題,是應用場景問題。
近幾年,網(wǎng)易結合自身業(yè)務,在計算機視覺和智能語音語言方面做了多項應用場景的落地。比如,去年《一夢江湖》與網(wǎng)易互娛AIlab合作推出全新功能——AI智能捏臉。該功能通過人臉特征的映射采用“人臉屬性識別”和“自適應參數(shù)映射”技術,將人臉視覺特征與捏臉參數(shù)相匯通。AI捏臉不僅會保留照片原有的五官、形狀、布局,還會保留照片上例如微笑、悲傷等細節(jié)神態(tài),使臉型傳神又真實。用戶只需上傳一張真人照片,就可以獲得便捷、智能、多元化的捏臉體驗,該玩法一經(jīng)推出,便受到許多用戶歡迎。
- 超詳細!2025科技創(chuàng)變者大會最新議程公布!2025-08-21
- 中科慧遠發(fā)布CASIVIBOT,以九年積累開啟AOI與機器人協(xié)同的品質檢測新時代2025-08-20
- 嚯!剛剛,張麻子陪我玩黑猴了2025-08-19
- 機器人全產業(yè)鏈接會 FAIR plus 2026媒體見面會在京召開2025-08-16