清華大學(xué)成立聽覺智能研究中心,要解決可解釋和魯棒性問題
融合產(chǎn)業(yè)和多學(xué)科的新機(jī)構(gòu)
郭一璞 發(fā)自 清華
量子位 報(bào)道 | 公眾號(hào) QbitAI
今天,清華大學(xué)人工智能研究院聽覺智能研究中心成立了。
聽覺和語音一直是AI領(lǐng)域研究和應(yīng)用的重點(diǎn),中國科學(xué)院院士、清華大學(xué)人工智能研究院院長張鈸認(rèn)為,在后深度學(xué)習(xí)時(shí)代,聽覺智能應(yīng)該成為AI領(lǐng)域重要的分支。
聽覺智能中心研究什么?
清華大學(xué)鄭方教授擔(dān)任研究中心主任,他在現(xiàn)場(chǎng)介紹,聽覺智能研究中心集中于三個(gè)目標(biāo):
1、揭示人類聽覺的感知和認(rèn)知機(jī)制;
2、建立聽覺智能的計(jì)算理論與方法;
3、提出計(jì)算機(jī)感知與聲音理解的技術(shù)和算法。
聚焦于可解釋性 、魯棒性、安全+智能三個(gè)問題,研究中心的研發(fā)方向包括:
1、聲學(xué)場(chǎng)景的感知與理解;
2、語音中內(nèi)容、聲紋、情感等多元屬性信息的識(shí)別與理解,不僅要識(shí)別說了什么,還要根據(jù)聲紋識(shí)別出聲音的主人,說話者的情緒;
3、聽覺計(jì)算的魯棒性,保證相關(guān)應(yīng)用穩(wěn)定;
4、人機(jī)語音智能交互,和機(jī)器說人話,智能音箱就是這方面離我們最近的應(yīng)用。
研究中心將以核心技術(shù)為基礎(chǔ),產(chǎn)出產(chǎn)品和服務(wù)、形成知識(shí)產(chǎn)權(quán)、參與標(biāo)準(zhǔn)制定。
另外,研究中心還會(huì)進(jìn)行多學(xué)科的交叉,與包括劍橋大學(xué)、佐治亞理工學(xué)院、中國人民大學(xué)、天津大學(xué)、新疆大學(xué)等在內(nèi)的國內(nèi)外多所高校進(jìn)行合作;與微軟、得意音通、聯(lián)動(dòng)優(yōu)勢(shì)、浦發(fā)銀行、廣電運(yùn)通金融等企業(yè)進(jìn)行校企合作。
張鈸:為什么需要聽覺智能研究中心?
中國科學(xué)院院士、清華大學(xué)人工智能研究院院長張鈸介紹,聽覺本來不是AI獨(dú)立的領(lǐng)域,在AI興起之前就有很長的歷史,在人機(jī)交互、感知、語言處理等方面和AI有很大的交集。
進(jìn)入深度學(xué)習(xí)時(shí)代后,深度學(xué)習(xí)完全改變了聽覺處理的現(xiàn)狀,使其真正走向?qū)嵱?,有了商業(yè)產(chǎn)品,這歸功于統(tǒng)計(jì)學(xué)習(xí)、深度學(xué)習(xí)。
現(xiàn)在,我們進(jìn)入后深度學(xué)習(xí)時(shí)代,語音處理與AI其他領(lǐng)域一樣面臨同樣的問題:用深度學(xué)習(xí)建造的AI系統(tǒng)包括聽覺系統(tǒng)都非常脆弱,容易受攻擊,容易出錯(cuò)。在語音識(shí)別方面表現(xiàn)得很明顯,即在安靜的條件下可以達(dá)到很高識(shí)別率,在有干擾的情況下就遇到了很大問題。
清華大學(xué)解決了聲紋處理的魯棒性問題,但是隨著攻擊方式的變化,如果繼續(xù)只采用概率統(tǒng)計(jì)的方法,恐怕漏洞依然存在。
因此,在后深度學(xué)習(xí)時(shí)代,聽覺智能應(yīng)該成為AI領(lǐng)域重要的分支。
聽覺智能研究中心需要以可解釋和魯棒的AI理論與方法為核心,與產(chǎn)業(yè)融合,與其他學(xué)科融合,才能突破AI發(fā)展中存在的很多問題。
另外,在AI教育方面,張鈸院士認(rèn)為,AI本科培養(yǎng)主要還是靠計(jì)算機(jī)專業(yè),AI是計(jì)算機(jī)科學(xué)技術(shù)的分支。需要重點(diǎn)加強(qiáng)的是研究生、高端人才的培養(yǎng)。另外,中低端AI人才也需要培養(yǎng),但清華大學(xué)主要培養(yǎng)高端的AI發(fā)展骨干,希望聽覺智能研究中心的成立能讓AI人才培養(yǎng)推進(jìn)一步。