索尼推出全能音樂(lè)AI工具:作曲混音編曲都OK!留給人類發(fā)揮的空間不多了
索尼喊來(lái)一群AI幫音樂(lè)人寫(xiě)歌
博雯 發(fā)自 凹非寺
量子位 報(bào)道 | 公眾號(hào) QbitAI
在AI們還在某個(gè)特定領(lǐng)域?qū)W畫(huà)畫(huà)、學(xué)寫(xiě)歌的時(shí)候,索尼已經(jīng)喊了一群AI來(lái)給音樂(lè)人做全能助手了!
包含從鼓點(diǎn)、貝斯、鋼琴伴奏的生成,到多音軌的混合,再到母帶制作等多項(xiàng)功能的那種。
可以說(shuō),創(chuàng)作音樂(lè)的全程都有AI的參與。
而這些AI們單拎出來(lái)也都是優(yōu)秀的“唱作人”,自己也可以創(chuàng)作新的旋律、節(jié)奏或和聲樣本。
用索尼的話來(lái)說(shuō),這種AI合成的音樂(lè)樣本其實(shí)是提供了一種“創(chuàng)意原型”,能夠讓音樂(lè)家仿佛在與多名制作人一起頭腦風(fēng)暴,探討新的音樂(lè)創(chuàng)意。
而這全套音樂(lè)輔助工具,總共包含了六大創(chuàng)造性AI,和四大專業(yè)的音頻制作工具。
這時(shí)候,就不得不再喊出那句話:
AI輔助音樂(lè)創(chuàng)作
首先是創(chuàng)造性的AI工具,這些工具某種程度上是將“音樂(lè)創(chuàng)新”這件事流水線化了。
其中,DrumNet通過(guò)無(wú)監(jiān)督學(xué)習(xí)的方式從音樂(lè)數(shù)據(jù)集之間生成一種音樂(lè)與鼓點(diǎn)之間的期望關(guān)系,進(jìn)而形成一種可以直接基于現(xiàn)有的音樂(lè)旋律生成鼓點(diǎn)節(jié)奏的AI。
BassNet則是基于現(xiàn)有音樂(lè)旋律生成低音的AI,并且在音樂(lè)播放時(shí)可以隨時(shí)調(diào)整和控制產(chǎn)生音符的密度、清晰度和音色。
Flow Machines可以生成一段包含和弦、低音和完整旋律的音軌樣式。
在把實(shí)際演奏的鋼琴旋律進(jìn)行數(shù)字化處理時(shí),常常會(huì)遇到一些音符的缺失,這時(shí)就可以用PIA進(jìn)行“修復(fù)”,甚至還可以直接去“續(xù)寫(xiě)”或者從頭創(chuàng)建一段新的旋律。
這就相當(dāng)于讓用戶扮演了藝術(shù)總監(jiān)的角色,只需要驗(yàn)證或否決AI創(chuàng)造出來(lái)的作品是否足夠讓人滿意。
剩下的兩個(gè)AI中,NOTONO可以直接用復(fù)制粘貼來(lái)添加不同的音色,是一個(gè)將聲音可視化的合成器。
而DrumGAN則是我們熟悉的GAN,用于生成各種各樣的鼓聲。
接下來(lái)是專業(yè)性的工具。
Profile EQ類似擁有“自動(dòng)對(duì)比”功能的圖形編輯器,是一個(gè)能將音頻直觀對(duì)比的自適應(yīng)均衡器。
Resonance EQ則擁有類似“調(diào)節(jié)圖像飽和度”的功能,能對(duì)音頻也進(jìn)行類似的調(diào)節(jié):比如平滑音頻,去掉雜音,或放大共鳴,強(qiáng)調(diào)諧波豐富旋律。
Multiband Phase是一個(gè)可以自動(dòng)識(shí)別和修復(fù)相位相關(guān)問(wèn)題的工具,XSpecMatch則是一個(gè)實(shí)時(shí)的音頻匹配均衡器。
AI無(wú)法代替藝術(shù)創(chuàng)造
其實(shí),這種AI與藝術(shù)創(chuàng)作的碰撞在最近幾年愈發(fā)頻繁。
比如在去年年初,科研機(jī)構(gòu)Space150模仿說(shuō)唱歌手Travis Scott的人聲和音樂(lè)風(fēng)格,基于AI技術(shù)做出了一個(gè)說(shuō)唱機(jī)器人Travis Bott。
而這位Travis Bott真的創(chuàng)作了一首名為《Jack Park Canny Dope Man》的歌,歌詞和旋律均由自己完成。
雖然有不少網(wǎng)友看著MV表示“比真人還好”,“非常有趣,這僅僅是個(gè)開(kāi)始”,表示如果這位歌手開(kāi)演唱會(huì)自己一定會(huì)買票去看。
但也有人產(chǎn)生了這樣的擔(dān)憂:
仿佛在看《黑鏡》中的一集。
事實(shí)上,每當(dāng)AI在藝術(shù)創(chuàng)造領(lǐng)域有了新的應(yīng)用時(shí),都能引發(fā)無(wú)數(shù)的思考和爭(zhēng)論。
人們?cè)隗@嘆AI創(chuàng)作力與日俱增,甚至于人類無(wú)異的同時(shí),也在擔(dān)心AI是否會(huì)進(jìn)一步蠶食掉創(chuàng)作領(lǐng)域中的藝術(shù)家們的工作。
對(duì)于這種問(wèn)題,開(kāi)發(fā)了上述全套AI輔助工具的Sony CSL實(shí)驗(yàn)室是這樣說(shuō)的:
藝術(shù)家不是深度學(xué)習(xí)的專家,因此,我們要將技術(shù)嵌入到藝術(shù)家的工作流,讓人工智能更好地輔助他們進(jìn)行創(chuàng)作。
秉持著這一目標(biāo),該實(shí)驗(yàn)室在巴黎的分部Sony CSL Paris已經(jīng)在理解和創(chuàng)造音樂(lè)、語(yǔ)言等多個(gè)具有藝術(shù)創(chuàng)造力的領(lǐng)域,通過(guò)AI和數(shù)據(jù)科學(xué)發(fā)表了多篇論文,開(kāi)發(fā)了不少應(yīng)用。
而一些音樂(lè)人也表示,AI在藝術(shù)創(chuàng)作領(lǐng)域的高速發(fā)展或許會(huì)使一些創(chuàng)作者受到挑戰(zhàn),比如在音樂(lè)圈從事重復(fù)勞動(dòng)工作,創(chuàng)作口水歌、套路化背景樂(lè)的音樂(lè)人。
但是,AI永遠(yuǎn)不會(huì)替代核心創(chuàng)作者,還會(huì)把從業(yè)者像更核心、更創(chuàng)意化個(gè)性化、更具有藝術(shù)價(jià)值的方向推動(dòng)。
參考鏈接:
https://cslmusicteam.sony.fr/prototypes/