AI合成: 合成器的未來(lái)是什么樣的?



在這篇關(guān)于人工智能合成的特別文章中,我們將試著回答這樣一個(gè)問(wèn)題:未來(lái),人工智能驅(qū)動(dòng)的軟件合成器,能夠模仿羅蘭Jupiter-8嗎?
如今,人工智能無(wú)處不在,它可以為你寫新聞,幫你混音。但由AI驅(qū)動(dòng)的合成器卻少之又少。這一切即將改變。下面我們一起來(lái)看,這些變化是如何發(fā)生的。
AI合成
如果說(shuō),上面這句話是由AI生成的,你會(huì)感到驚訝嗎?至少我會(huì)。好在這些文字還不是AI說(shuō)的。但這種情況,正好說(shuō)明了人工智能在日常生活中爆紅,可能是真的。像ChatGPT這樣由人工智能撰寫新聞,正在成為尋常情況。AI也在滲透到音樂(lè)中——算法編寫的歌曲和計(jì)算機(jī)聲音“偽裝”成著名歌手。這是一個(gè)嶄新的聲音世界。
對(duì)于我們這些想用人工智能制作歌曲的音樂(lè)制作人來(lái)說(shuō),有很多選擇。從iZotope和Sonible的混音和母帶幫助工具到Myxt(一個(gè)協(xié)同音樂(lè)制作工具),有很多方式可以利用人工智能。
不過(guò),這其中還有一個(gè)尚未完全上線的領(lǐng)域,是AI合成器,也就是用人工智能產(chǎn)生真的聲音。雖然這方面仍處于新生階段,但它正在發(fā)生。讓我們來(lái)看看這項(xiàng)技術(shù)現(xiàn)在的情況,以及它可能的發(fā)展方向。需要注意的是,下面的內(nèi)容并不是一個(gè)詳盡的清單,而只是目前可用技術(shù)的概況。
帶有AI合成能力的硬件合成器
由于AI技術(shù)非常新,需要更大的硬件處理能力,具有人工智能合成功能的硬件合成器很少,這并不奇怪。這其中可以看到的產(chǎn)品是Hartmann Neuron,它是21世紀(jì)初發(fā)行的數(shù)字復(fù)音合成器。據(jù)報(bào)道,通過(guò)基于神經(jīng)網(wǎng)絡(luò)的技術(shù),這款產(chǎn)品中的“神經(jīng)元”可以讓用戶重新合成、處理已經(jīng)轉(zhuǎn)化為數(shù)字計(jì)算機(jī)模型的采樣。

Hartmann Neuron
更為新潮,但仍處于原型階段的是Neurorack,開發(fā)商Acids稱之為 "有史以來(lái)第一個(gè)基于人工智能的實(shí)時(shí)合成器"。Eurorack合成器依賴于Nvidia Jetson Nano,這是一臺(tái)擁有128核GPU和四個(gè)CPU的納米計(jì)算機(jī)。Neurorack能夠產(chǎn)生非??梢缘穆曇?,并能用其他模塊的CV進(jìn)行控制。這款產(chǎn)品的后續(xù)發(fā)展還有待觀察。

Acids Neurorack
在合成方面以外,合成器的其他功能也有AI應(yīng)用。Roland最近的一些硬件合成器,如Jupiter-X和Juno-X有一個(gè)名為“I-Arpeggio”的琶音器,這是一個(gè)與明治學(xué)院大學(xué)合作的AI驅(qū)動(dòng)琶音器。

Roland Jupiter-X
帶有AI合成的軟件合成器
在軟件方面,這種變化也在發(fā)生。NSynth(神經(jīng)網(wǎng)絡(luò)音頻合成)是一個(gè)基于神經(jīng)網(wǎng)絡(luò)的應(yīng)用程序,用開發(fā)者M(jìn)agenta的話說(shuō),它可以讓你 "在成對(duì)的樂(lè)器之間插值,創(chuàng)造新的聲音"(谷歌的創(chuàng)意實(shí)驗(yàn)室也參與其中)。NSynth可以作為一個(gè)MaxForLive設(shè)備,還有一個(gè)名為NPlayer的Web端樂(lè)器。在硬件上,又一款叫做NSynth Super,是NSynth的DIY硬件設(shè)備。

Magenta NSynth
guk.AI的Sistema是一個(gè)AI驅(qū)動(dòng)的插件,可以在DAW中使用。作為一個(gè)聲音生成程序,這款軟件可以根據(jù)類型和特征選擇起點(diǎn),由AI為你生成一個(gè)新的聲音。生成后,可以用一些宏控制來(lái)進(jìn)一步調(diào)整。該插件可購(gòu)買,也能夠訂閱使用,也有一個(gè)免費(fèi)版本。

Guk.ai Sistema
Emergent Drums不是合成器,而是一臺(tái)鼓機(jī),但合成的方法是相似的。這款插件來(lái)自Audiolab,使用了打擊樂(lè)聲音進(jìn)行訓(xùn)練AI,可以生成新的、獨(dú)特的鼓聲采樣??梢杂靡恍﹨?shù)改變聲音,如音高、包絡(luò)和濾波器,以滿足需要。

Audiolab的Emergent Drums
AI合成的未來(lái)
暢想未來(lái)非常令人興奮,但不禁感到更多的事情可能會(huì)發(fā)生。如果人工智能可以像Weekend、Liam Gallagher那樣“唱歌”,它的聲音是不是也能像Jupiter-8或CS-80那樣?為了得到一些答案,筆者求助了兩位專家——音樂(lè)插件開發(fā)商Martinic的Martin Broerse,和AudioShake的首席執(zhí)行官兼聯(lián)合創(chuàng)始人Jessica Powell,該公司生產(chǎn)人工智能驅(qū)動(dòng)的音干隔離(stem isolation)軟件。
你可能知道Martinic曾經(jīng)的產(chǎn)品,利用軟件對(duì)Akai AX73進(jìn)行了詳細(xì)模擬。該團(tuán)隊(duì)還幫助YouTuber Doctor Mix制作了使用ChatGPT生成的插件Doctor Mix AI Synth。我問(wèn)Martin,現(xiàn)在AI對(duì)編寫合成器軟件有多大作用。他說(shuō):"目前,AI在代碼方面還十分幼稚,"他說(shuō)。"以Doctor Mix AI Synth為例,軟件有著巨大的音量差異和靜態(tài)的ADSR。 但正如你看到的,仍然可以用它做出非??岬囊魳?lè)。"

Martinic的AX73使用了傳統(tǒng)的數(shù)字建模技術(shù)
來(lái)自AudioShake的Jessica,在被問(wèn)到同樣的問(wèn)題時(shí),給出了一個(gè)有趣的答案: "如果我們談?wù)摰氖峭暾幕煲羯桑话銇?lái)說(shuō),現(xiàn)在最好聽的‘人工智能音樂(lè)’不是生成式人工智能。相反,它是利用作曲家提供的授權(quán)音源或由AudioShake代表這些作曲家創(chuàng)建的音源,利用經(jīng)典音樂(lè)理論和一些人工智能的服務(wù),以新的方式組合這些音源,并從中生成新的音樂(lè)。但完全由AI生成的音樂(lè)正變得越來(lái)越好。而且你已經(jīng)可以聽到好聽、生成的樂(lè)器。"

AudioShake
人工智能合成可以Jupiter-8嗎?
接下來(lái)是一個(gè)難以回答的問(wèn)題。你能預(yù)見有一天,AI可以復(fù)制經(jīng)典合成器音色嗎?就像我們今天可以訓(xùn)練人工智能像Drake 以及Oasis樂(lè)隊(duì)的Liam Gallagher那樣唱歌嗎?
"我認(rèn)為,人工智能可以復(fù)制經(jīng)典合成器,"Martinic回答說(shuō),"但我估計(jì),VST/AU/CLAP/AAX插件不會(huì)這樣。這種功能,應(yīng)該出現(xiàn)在無(wú)需使用DAW就能創(chuàng)建完整歌曲的網(wǎng)站上。這是因?yàn)橛?jì)算時(shí)間和人工智能模型非常大,如果(試圖)在本地實(shí)現(xiàn)它,會(huì)在目前的硬件上出現(xiàn)音頻故障。我認(rèn)為,今天已經(jīng)可以用TensorFlow模型來(lái)創(chuàng)建這種功能了。"
Jessica有著類似的答案。"最終,當(dāng)然。你已經(jīng)可以通過(guò)把圍繞特定風(fēng)格的關(guān)鍵詞放到Riffusion等服務(wù)中,來(lái)獲得這種感覺(jué)。這很有趣,可以玩一玩。"
AI合成的主要問(wèn)題是計(jì)算能力
正如Martinic提到的,目前,AI的主要障礙是計(jì)算能力。然而,他看到了一條前進(jìn)的道路。
他說(shuō):"我認(rèn)為,如果工作室和家里的計(jì)算機(jī)變得更加強(qiáng)大,事情就會(huì)發(fā)生變化。"目前,我們?nèi)匀槐仨毦帉懜叨葍?yōu)化的C++代碼,不使用太多的內(nèi)存和CPU功率,以使仿真工作不出現(xiàn)問(wèn)題。目前,在目前的硬件上,用AI Synth是不可能的。在未來(lái),例如在這個(gè)時(shí)候:網(wǎng)站加密有望在幾個(gè)小時(shí)內(nèi)被......超級(jí)計(jì)算機(jī)破解。
因?yàn)槿绻_(dá)到這種性能......目前的加密就不可能實(shí)現(xiàn)。估計(jì)當(dāng)這種情況發(fā)生時(shí),為了運(yùn)行銀行軟件,本地計(jì)算機(jī)將需要更高性能——例如100倍所取代,以滿足新的銀行安全加密標(biāo)準(zhǔn)。所以可以說(shuō),黑客......在未來(lái)將有可能創(chuàng)建基于AI模型的仿真VST/AU/CLAP/AAX插件,這些插件將與我們目前的樂(lè)器建模方式一樣好。"
“AI模型將和目前的建模插件一樣好?!边@令人非常期待。
本文譯自Gearnews
