智能音箱終于秀得起音質(zhì)了……
蘋果都放棄的高端智能音箱,國產(chǎn)廠商能玩出什么花?
夢晨 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
記得前幾年智能音箱剛火的時候,挺想買一個嘗嘗鮮,不太貴的那種。
智能方面我還算會挑,音質(zhì)方面可就不太懂了。
于是去找玩音響的朋友問問有什么推薦,哪款音質(zhì)好一些?結(jié)果他的回答讓我挺無語的:
音質(zhì)上沒什么可挑的,都是聽個響,你就看哪家智能做得好吧。
如今幾年過去,情況在變化。
在蘋果放棄價格賊貴的HomePod之后,國產(chǎn)智能音箱卻開始拼音質(zhì)了。
華為聯(lián)合音響品牌帝瓦雷推出高端產(chǎn)品Sound系列,音箱部分極致堆料,智能部分主推搭載鴻蒙,其中最高端型號Sound X價位來到2000+。
小米也聯(lián)手哈曼卡頓推出主打音質(zhì)的小體積產(chǎn)品Xiaomi Sound,延續(xù)性價比傳統(tǒng)定價499,被網(wǎng)友戲稱為“年輕人的第一臺高端智能音箱”。
這么熱鬧,自然也少不了另一大玩家天貓精靈,最近其在高端產(chǎn)品上的布局終于浮出水面——
- 與頂級聲學(xué)機(jī)構(gòu)波士頓聲學(xué)深度合作,聯(lián)合打造的高端智能聲學(xué)新品Sound系列已于6月1日上市。
- 其中,Sound Pro到手價為1299元,配備了5.25英寸的60W低頻發(fā)聲單元,實(shí)現(xiàn)了罕見的35Hz低頻下潛,可以說已經(jīng)能挑戰(zhàn)同品類天花板了。
智能聲學(xué),便是天貓精靈新品身上最醒目的標(biāo)簽,這里可以先來分享一波Pro版的提前試用體驗(yàn)。
首先,這款產(chǎn)品外觀就給人很大沖擊力。一反之前型號小巧纖細(xì)的“網(wǎng)紅感”,設(shè)計上也更接近經(jīng)典造型。
主觀感受上,大箱體發(fā)出的聲音確實(shí)比之前的小體積型號更飽滿,特別是低音表現(xiàn),有很嗨的感覺了。
接下來是主打新功能之一智能EQ調(diào)音。
內(nèi)置算法可以自動選擇最佳音效,無需手動調(diào)整復(fù)雜參數(shù)。據(jù)說這次還特別為電子核、情緒搖滾等小眾音樂類型有專門調(diào)音。
主打新功能之二獨(dú)家“貓耳算法”,解決了大音量聽歌時音箱聽不見你說話的問題。
實(shí)際體驗(yàn)下來, 即使是80%超大音量播放新晉的跳操神曲《本草綱目》,也可以用正常說話的音量和音箱交互。
極限場景下,跑到廚房里打開抽油煙機(jī)再關(guān)上門,都能成功喚醒客廳里大聲播放音樂的天貓精靈。
下面就來扒一扒這些新功能背后,都有哪些新技術(shù)在支撐。
搭載了什么新技術(shù)?
先來說說這個貓耳算法,根據(jù)貓耳朵能獨(dú)立旋轉(zhuǎn)180度并通過內(nèi)部褶皺準(zhǔn)確定位聲音來源而得名。
要想用算法實(shí)現(xiàn)這一特性,要做到三個部分。
第一個是回聲消除,也就是麥克風(fēng)收音時需要消除掉音箱自己發(fā)出來的聲音。
回聲一般分為線性和非線形兩部分。對于線性回聲主要通過線性濾波器的傳統(tǒng)算法來解決,對于非線性回聲天貓精靈增加了深度學(xué)習(xí)算法來解決。
第二個是聲源定位,增加使用了喚醒詞的信息,包括喚醒詞上每個頻點(diǎn)人聲的比例,綜合利用聲學(xué)信息和語音特征增加準(zhǔn)確率。
第三個是降噪,也是傳統(tǒng)算法與深度學(xué)習(xí)結(jié)合,先用噪聲識別模型區(qū)分出人聲與非人聲,再分別用不同的算法去處理。
接下來是智能EQ,也被天貓精靈團(tuán)隊(duì)稱為不包漿均衡器。
總體思路是通過軟件算法與低失真功放芯片協(xié)同工作,在為不同音樂帶來匹配的音效同時不過度渲染,盡量還原音樂本身想表達(dá)的感覺。
具體細(xì)節(jié)上共有1040段智能參數(shù),除了4種預(yù)制模版(HiFi、古典、人聲、勁爆)外,默認(rèn)還可以選擇智能模式根據(jù)音樂類型動態(tài)匹配。
硬件上的創(chuàng)新之處還有智能一體腔。
通過改進(jìn)結(jié)構(gòu)堆疊設(shè)計,將音腔容積增加了29%,無源輻射器和揚(yáng)聲器因此可以輻射出更多的低頻效果。低頻到位了,聽起來就更帶感。
通過優(yōu)化結(jié)構(gòu)堆疊及裝配,改善了腔體的振音,震動以及內(nèi)部駐波, 使mic收音更純凈,提高智能語音交互的效果。
除了音質(zhì)方面外,智能音箱本身也是內(nèi)容的提供者,需要在不連接PC或手機(jī)的情況下獨(dú)立工作。
天貓精靈與眾多平臺進(jìn)行內(nèi)容授權(quán)合作,把多平臺內(nèi)容聚合在一起。
也就是說,智能音箱反倒沒有手機(jī)上聽歌要切換不同App的煩惱~
除了音樂以外,有聲讀物、播客資源也能一網(wǎng)打盡。
有了內(nèi)容,接下來還要考慮分發(fā)和推薦。
考慮到音箱的家庭使用情景,天貓精靈開發(fā)了智能身份識別系統(tǒng),可通過聲紋來識別不同使用者的角色。
就像指紋一樣,每個人的聲音也有獨(dú)特的聲紋特征。就像給手機(jī)錄入指紋一樣,采集了3個不同距離下的聲紋后就可以準(zhǔn)確識別。
不同角色的聲紋采集好之后,可以選擇興趣標(biāo)簽,讓智能音箱的內(nèi)容推薦有“更懂你”的感覺。
再結(jié)合上長時間使用后學(xué)習(xí)到的使用場景,可以在需要時及時送上需要的內(nèi)容。
當(dāng)然,整個過程都是符合信息安全認(rèn)證國際標(biāo)準(zhǔn)的,包括基礎(chǔ)的ISO 27001、擴(kuò)展的ISO 27018、以及最新的ISO 29151。
在天貓精靈這次的新品上諸多智能聲學(xué)技術(shù)都是第一次亮相,但其實(shí)早在4年前就已布局。
下面再來揭秘一下,背后這只獨(dú)特的研發(fā)團(tuán)隊(duì)——
天貓精靈聲學(xué)實(shí)驗(yàn)室
據(jù)介紹,實(shí)驗(yàn)室聲學(xué)成員平均有13年聲學(xué)設(shè)計經(jīng)驗(yàn),來自哈曼、樓氏、AAC、飛利浦等全球知名公司。
其中負(fù)責(zé)人汪濤更是哈曼“金耳朵”全球認(rèn)證測試中0錯題達(dá)到level 14難度的滿分選手。
實(shí)驗(yàn)室有20多間聲學(xué)試驗(yàn)場地,成立4年來已積累了數(shù)十項(xiàng)相關(guān)專利,形成了獨(dú)特的智能聲學(xué)發(fā)展路線。
成果除了前面介紹過的以外,還有虛擬多聲道搭建、千人千面音質(zhì)設(shè)計方案、聲場自適應(yīng)校準(zhǔn)等專利技術(shù)。
天貓精靈為什么要花大力氣自建聲學(xué)實(shí)驗(yàn)室呢?
從目的上,是要通過跨領(lǐng)域技術(shù)融合創(chuàng)新解決音箱產(chǎn)業(yè)長期以來有智能與音質(zhì)難以兼容的難題。
工作方式上,也是提供了讓聲學(xué)團(tuán)隊(duì)與電子、算法和設(shè)計等內(nèi)部團(tuán)隊(duì)通過AliGenie一體化研發(fā)平臺高效協(xié)作的模式。
除了內(nèi)部的協(xié)作,聲學(xué)實(shí)驗(yàn)室也是天貓精靈這家公司與外部聲學(xué)行業(yè)合作的一個連接點(diǎn)。
有了既懂聲學(xué)又懂智能的實(shí)驗(yàn)室團(tuán)隊(duì),天貓精靈與音響品牌波士頓聲學(xué)的合作可以更加深入。
這一次雙方的合作不僅限于表面的品牌背書,也不是單純的購買發(fā)聲單元等器件,而是在聲學(xué)架構(gòu)上進(jìn)行了深度協(xié)同研發(fā),包括算法、硬件、調(diào)音之間的協(xié)同。
前面介紹過的智能EQ調(diào)音,和智能一體腔效果,也加入了波士頓聲學(xué)專家的參數(shù)建議。
像這樣把傳統(tǒng)音箱聲學(xué)、AI算法、智能物聯(lián)等多學(xué)科跨領(lǐng)域技術(shù)進(jìn)行創(chuàng)新融合的模式,不僅產(chǎn)出應(yīng)用在音箱產(chǎn)品上能給用戶帶來更好的體驗(yàn),還產(chǎn)生了1+1>2的效果。
在量子位與天貓精靈人工智能部總經(jīng)理姜飛俊的交流中,他表達(dá)了這樣的觀點(diǎn)。
智能音箱最重要的地方,是帶來不同于動手操作的全新交互方式,技術(shù)上稱為“遠(yuǎn)場語音交互”。
從這個視角看,通過智能聲學(xué)沉淀出的相關(guān)技術(shù)還可以遷移到更多適合搭載語音交互的智能物聯(lián)網(wǎng)產(chǎn)品,如時下爆火的掃地機(jī)器人、智能跑步機(jī)等運(yùn)動器材。
進(jìn)一步看,技術(shù)成果應(yīng)用到多樣場景,反過來也能推動技術(shù)本身迭代進(jìn)化。
例如,音箱擺放在室內(nèi)固定位置,面對的環(huán)境噪聲也相對固定。而掃地機(jī)器人自身就在移動,也會產(chǎn)生變化性更大的噪聲,對語音識別定位和降噪能力提出新的要求。
再例如,深度學(xué)習(xí)算法應(yīng)用到掃讀筆等更小型、計算能力有限的設(shè)備時,又會推動算法本身朝輕量化、易部署方向演進(jìn)。
- 字節(jié)突然開源Seed-OSS,512K上下文主流4倍長度,推理能力刷紀(jì)錄2025-08-21
- “現(xiàn)在讀AI博士已經(jīng)太晚了”2025-08-19
- 谷歌AI攻克亞洲語言難題,2300種語言數(shù)字化計劃正在推進(jìn)2025-08-18
- AMD蘇姿豐公開懟扎克伯格!反對1億年薪挖人,使命感比鈔票更重要2025-08-18