2022 年人工智能音樂發(fā)展現(xiàn)狀:初創(chuàng)公司、音樂人及挑戰(zhàn)
“Beautiful The World”是一首使用經(jīng)過音樂數(shù)據(jù)庫訓(xùn)練的人工智能創(chuàng)建的曲目,以及動物的音頻樣本。 是的,你沒有猜錯,它來自澳大利亞。這是2020年人工智能歌曲大賽的獲獎作品,這是一場面向音樂家、科學(xué)家和開發(fā)者的目前性比賽——本質(zhì)上是人工智能音樂的歐洲歌唱大賽。 這是2020年創(chuàng)造性人工智能技術(shù)能力的寫照,但計算機(jī)音樂在理論或?qū)嵺`上都不是全新的事物。 早在1950年代初期,一臺名為 CSIRAC的計算機(jī)就被用來播放數(shù)字音樂"Colonel Bogey",盡管它不能創(chuàng)作音樂。
從1950年代開始,世界各地的研究人員一直在探索使用計算機(jī)的算法作曲。 而在后來的幾十年里,這與鼓機(jī)和合成器等電子樂器的發(fā)展不謀而合,這進(jìn)一步模糊了人類制作音樂和機(jī)器制作音樂之間的界限。實際上,這些模糊的界限是一個重要的原則:多數(shù)時候我們并不是在談?wù)撏耆孔约褐谱饕魳返臋C(jī)器(或現(xiàn)在的人工智能)。更多是關(guān)于人類如何使用機(jī)器或人工智能來制作音樂。人和機(jī)器雙方都有不同程度的參與。

人工智能音樂的早期商業(yè)化
雖然本文的重點是較新的人工智能音樂,歷史回顧也是必不可少的。2014年12月,當(dāng)時一家名為 Jukedeck的英國音樂科技公司在巴黎舉行的Le Web大型科技會議上獲得了初創(chuàng)企業(yè)推介獎。該公司建立了一個人工智能系統(tǒng)來生成免版稅的音樂曲目,可供視頻博主、游戲開發(fā)商和企業(yè)使用。它的宣傳口號小心翼翼地強(qiáng)調(diào)它并沒有試圖讓音樂家失業(yè)。 “作曲家是音樂世界的基石(我們自己就是作曲家?。?。 但不是每個人都能雇用專門的作曲家,而這正是我們的用武之地”。一年后,即2015年12月,Jukedeck正式推出其服務(wù),讓人們每月免費創(chuàng)作五首歌曲,之后的每首歌曲則收取7美元。完整擁有其版權(quán)需要150美元。
2017年2月,一家名為Amper Music的美國公司成為Techstars Music加速器的一批初創(chuàng)公司之一。與Jukedeck非常相似,它的創(chuàng)始人也是作曲家。與Jukedeck一樣,Amper將自己定位為音樂庫的替代品,其人工智能系統(tǒng)能夠根據(jù)客戶設(shè)定的心情、風(fēng)格和長度生成曲目。它使用訂閱模式,包括提供免版稅的目前使用許可。該公司也不愿被視為作曲家的敵人。“這是一種幫助提高創(chuàng)意工作的工具,無論他們是否是音樂人。這是一個合作伙伴;一個提供幫助的技術(shù)而不是取代工作的技術(shù),”其首席執(zhí)行官說。
這兩家開創(chuàng)性企業(yè)都已被收購。Jukedeck于2019年被字節(jié)跳動收購,而Amper Music則于2020年被圖片視頻音樂庫Shutterstock收購。這表明大公司對人工智能音樂和初創(chuàng)公司表現(xiàn)出興趣,我們稍后將更深入地探討。

人工智能的用途:成品音樂
現(xiàn)來談?wù)勅斯ぶ悄芤魳返囊恍┚唧w用途了。我們將從Jukedeck和 Amper Music正在做的成品音樂開始。他們的系統(tǒng)正在按需求生成音樂??蛻魰嬖V計算機(jī)他們想要多長時間的曲目以及其風(fēng)格和情緒的其他信息,然后人工智能會吐出客戶愿意接受的曲目,或者客戶選擇拒絕并拿到新的一首曲目。
另一商業(yè)模式開創(chuàng)自來自初創(chuàng)企業(yè)Amadeus Code,該公司最初開發(fā)的是人工智能作曲輔助工具?。在2019年,它推出了一個名為?Evoke Music的免版稅音樂庫,人工智能生成的曲目由其人類團(tuán)隊精心挑選。這樣的轉(zhuǎn)型在人工智能音樂圈并不罕見,因為初創(chuàng)公司要持續(xù)尋找與他們技術(shù)相匹配的商業(yè)模式。
另一個例子是柏林的初創(chuàng)公司Loudly,它最初的產(chǎn)品是人工智能remix。 當(dāng)遭遇版權(quán)方不愿提供授權(quán)的困難后,該公司改變了策略并建立了一個名為Loudly AI Music Studio的工具。AI Music Studio同Jukedeck 和 Amper Music最初的目標(biāo)基本一致,即為視頻博主、游戲開發(fā)商和其他企業(yè)提供免版稅音樂創(chuàng)作。
另一家一直在探索人工智能音樂公對公業(yè)務(wù)前景的歐洲初創(chuàng)公司AIVA被定位為“能創(chuàng)作有情感的配樂的人工智能”。它的目標(biāo)客戶同樣包括游戲開發(fā)商、視頻博主和企業(yè)。AIVA現(xiàn)有企業(yè)客戶包括英偉達(dá)、沃達(dá)豐和TED。盡管AIVA保留其音樂的版權(quán),非商業(yè)用途的話免費的。商業(yè)用途的使用需要其他更高的產(chǎn)品級別,其中AIVA可以保留版權(quán),或者客戶完全擁有版權(quán)。AIVA還是一家其人工智能系統(tǒng)被一個作曲家協(xié)會(法國的Sacem)正式認(rèn)可為作者的人工智能音樂公司。人工智能作作曲家身份是一個有爭議的話題,我們稍后再討論。
人工智能制作音樂領(lǐng)域的一些初創(chuàng)公司已經(jīng)將目光投向了特定應(yīng)用領(lǐng)域,Infinite Album就是其中之一。 它專注于為游戲直播提供生成音樂:人們在Twitch等平臺上直播,如果他們在直播中使用商業(yè)音樂,他們的直播內(nèi)容就有可能因版權(quán)問題而下架。Infinite Album不僅為游戲播主提供原創(chuàng)音樂供他們使用。它的系統(tǒng)可以實時調(diào)整音樂以適應(yīng)正在玩的游戲,而觀眾也可以通過打賞來影響音樂的流派、情感和樂器,這反過來又為播主創(chuàng)收。Infinite Album適用于許多熱門游戲,包括堡壘之夜Fortnite、Apex Legends、無畏契約Valorant和英雄聯(lián)盟。測試版已于2022年3月推出。
DAACI同樣專注于游戲音樂。2022年6月公開亮相,DAACI正在籌劃500萬美元的融資。 DAACI建立的個人工智能可以“創(chuàng)作、編排、配器和制作”原創(chuàng)音樂,其用途包括動態(tài)樂譜和游戲配樂。
Beatoven是一家來自印度初創(chuàng)公司,致力于將其音樂人工智能提供給視頻和播客創(chuàng)作者。用戶將內(nèi)容上傳后,需要為錄音的不同部分標(biāo)記編輯點,然后從16種情緒和5種音樂流派中進(jìn)行選擇。之后Beatoven的人工智能便會根據(jù)這些要求創(chuàng)作音樂。它在2022年初籌集了100萬美元,以便繼續(xù)構(gòu)建其技術(shù)和服務(wù)。

另一個新入場的公司Soundful于2022年4月從包括環(huán)球音樂集團(tuán)和 Beatport的高管在內(nèi)的投資者那里籌集了380萬美元的種子資金。它是一種使用人工智能創(chuàng)造“想法、洗腦旋律和伴奏”的工具。其目標(biāo)客戶包括網(wǎng)紅,目的是讓他們可以創(chuàng)作自己的音樂而不會導(dǎo)致他們的視頻因侵權(quán)而下架。
Venturesonic分拆自英國的AI Music。它與一家名為Made Music Studio的聲音品牌公司合作推出了一項服務(wù),為大公司的商業(yè)品牌創(chuàng)建定制曲目。其早期客戶包括陽獅傳媒Publicis Media、維珍超級高鐵Virgin Hyperloop和北極星工業(yè)Polaris Industries。隨著AI Music被蘋果收購,Venturesonic目前的狀況尚不清楚。
人工智能系統(tǒng)在制作音樂的另一個方面是創(chuàng)建loop循環(huán)段、采樣和音頻效果。 對于Splice和Tracklib等公司來說,這是一項非常成功的業(yè)務(wù),它們擁有由人類音樂家創(chuàng)建的大型音頻數(shù)據(jù)庫。Tapes.ai試圖用人工智能生成的聲音來挑戰(zhàn)他們。2021年它推出的服務(wù)聲稱是“采樣包的未來”。它的人工智能創(chuàng)造了所有的聲音,然后經(jīng)由人類團(tuán)隊整理成超過5000個循環(huán)的一個個采樣包。Splice也在試驗人工智能。提供“聲音推薦”的采樣合成器CoSo在聆聽音頻源后能從其采樣庫中自動尋找合適的聲音。 這并不是人工智能本身創(chuàng)造音樂,而是更多地參與人類音樂制作過程中的聲音管理。

AI音樂的用途:功能音樂
現(xiàn)在讓我們談?wù)勈褂萌斯ぶ悄苌晒δ芤魳?。這意味著用于特定目的的音樂:比如幫助你放松;工作或?qū)W習(xí);或者幫助睡眠。
Endel是一家美國初創(chuàng)公司,其技術(shù)承諾“幫助您集中注意力、放松和睡眠的個性化音樂環(huán)境”。Endel現(xiàn)有手機(jī)和電腦軟件以及亞馬遜智能音箱 Alexa。該應(yīng)用程序的工作原理是讓人們告訴它他們在做什么,然后生成適合的背景音樂。其中一些音樂來自Endel的人工智能和人類藝術(shù)家之間的合作。2020年,它與Grimes合作“人工智能搖籃曲”,并通過Endel的應(yīng)用程序分發(fā)。 Grimes將原始音樂和人聲創(chuàng)作為子總線stems,然后 Endel的人工智能將其重新混合成背景音樂。2021年,它與電子音樂藝術(shù)家Richie Hawtin(又名Plastikman)重復(fù)了這一合作模式。音樂家為Endel提供了一系列音樂素材,人工智能將它們變成了旨在幫助人們集中注意力的音樂。Music Ally就該項目采訪了Hawtin和Endel。 Endel 的首席執(zhí)行官將這個過程描述為“以子總線stems的形式提取他的基因,并將其送入算法”。Hawtin則稱其“為人工智能提供了較好的構(gòu)建模塊”,這樣它就可以創(chuàng)造出“具有我的音樂語言特征”的音樂。
Endel正在尋找其他方法來讓人們聽到他們的功能音樂。2019年,它推出了一個專門用于“睡眠音樂”的 全天候Twitch直播頻道。2021年,它與梅賽德斯-奔馳合作,為駕駛員生成自適應(yīng)配樂,以保持他們的高度專注并緩解壓力。 Endel的人工智能使用包括汽車速度、駕駛風(fēng)格、天氣和道路類型在內(nèi)的信號來塑造音樂。Endel還將其人工智能創(chuàng)作的一些音樂變成了傳統(tǒng)專輯,并在流媒體平臺上發(fā)布。在2019年與華納音樂集團(tuán)達(dá)成分銷協(xié)議后,它發(fā)行了更多專輯。
人工智能的音樂如何人類音樂家競爭?當(dāng)我們在2022年2月查看時,Endel在Spotify上的每月聽眾剛剛超過3.7萬人。在撰寫本文的5個月后,由于最近與James Blake的合作,它現(xiàn)在擁有超過8萬每月聽眾。Endel的音樂已經(jīng)進(jìn)入了Spotify的一些氛圍音樂播放列表(Submerged、Ambiente和The Quiet Club),因此該流媒體平臺的一些策劃人看到了它的價值。投資者也是如此:該公司在2022年4月籌集了1500萬美元。
其他初創(chuàng)公司也致力于情緒音樂。Aimi就是其中之一。它在2020年推出了一款應(yīng)用程序,能將人類藝術(shù)家的音樂改編成電子音樂,就像Endel對 Grimes和Plastikman的音樂所做的那樣。該應(yīng)用程序可以免費試用,每天使用超過30分鐘的人需要按月訂閱。2021年11月,Aimi籌集了2000萬美元的資金,并暗示計劃使用區(qū)塊鏈技術(shù)向其創(chuàng)作者支付版稅。
另一家初創(chuàng)公司Mubert,最初產(chǎn)品也是能提供人工智能生成的音樂的一款應(yīng)用程序。它可以幫助人們睡眠、集中注意力和冥想,涵蓋各種音樂風(fēng)格。然而,自2018年初次推出以來,Mubert已經(jīng)拓展到其他領(lǐng)域:例如一款名Mubert Render的視頻創(chuàng)作者的配樂制作工具;以及為希望在創(chuàng)作過程中使用人工智能的音樂人提供的名為Mubert Studio的軟件。這是公司轉(zhuǎn)型的另一個案例。一家初創(chuàng)公司在構(gòu)建具有特定商業(yè)模式或用戶場景的創(chuàng)意人工智能時,隨著時間的推移會意識到其他更適合的其他用途,或者至少更好的機(jī)會來建立完善的商業(yè)模式。

另一家有特定用途的人工智能音樂初創(chuàng)公司是LifeScore。它于2019年由英國作曲家Philip Shepherd和Tom Gruber共同創(chuàng)立,后者是 Siri的聯(lián)合創(chuàng)始人——蘋果買下了Siri并成為其同名語音助手。LifeScore的技術(shù)并不是使用人工智能從頭開始創(chuàng)作音樂。相反,該公司錄制了人類古典音樂家,然后將音樂分割成更小的片段。LifeScore的人工智能之后將這些片段拼接成自適應(yīng)音樂。最初的演示產(chǎn)品是一個移動應(yīng)用程序,當(dāng)你四處走動時,音樂會隨著你的步伐或轉(zhuǎn)向而改變。該公司還為Twitch總部創(chuàng)建了一個反應(yīng)式音樂顯示器,并與賓利合作為駕駛員創(chuàng)作自適應(yīng)音樂——這與Endel與梅賽德斯-奔馳的合作類似。2022年3月,LifeScore籌集了1100萬英鎊的融資,而華納音樂集團(tuán)是投資者之一。該公司正計劃與藝術(shù)家合作,作為其發(fā)展的一部分。

人工智能音樂的用途:創(chuàng)意工具
現(xiàn)在是時候談?wù)剬I(yè)音樂人如何使用創(chuàng)意人工智能作為他們歌曲創(chuàng)作和錄音過程的一部分。
我們之前談到了Amadeus Code。它最初的產(chǎn)品被定位為“人工智能歌曲創(chuàng)作助手”:一款移動應(yīng)用程序,根據(jù)從出色歌曲中學(xué)習(xí)到的數(shù)百個和弦進(jìn)行生成旋律。然后這些旋律可以作為音頻和MIDI文件導(dǎo)出到數(shù)字音頻工作站,供音樂家在他們的項目中使用。因此Amadeus Code并沒有取代音樂家,而是被設(shè)計為一種創(chuàng)造性的工具:促使詞曲作者走出他們的舒適區(qū),或者幫助他們避免創(chuàng)意卡住。
Algoriffix是另一家探索這一想法的瑞典初創(chuàng)公司。它于2021年9月推出的應(yīng)用程序向人類音樂家宣傳它是“人工智能合作伙伴”。人們可以上傳無伴奏的獨奏音頻或子母線stem,以便其算法識別音符并推薦較佳的節(jié)拍和和聲。該公司希望同時吸引職業(yè)音樂家和音樂學(xué)生作為在創(chuàng)作新歌時的工具。
英國初創(chuàng)公司Vochlea?? 是人工智能被用來增強(qiáng)人類音樂家創(chuàng)造力而不是試圖取代人類的另一個例子。該公司的一個產(chǎn)品是硬件(麥克風(fēng))和軟件的組合,該軟件可以獲取音樂家的聲音并使用它們來控制樂器。你可以對著麥克風(fēng)beatbox,軟件就根據(jù)這些聲音創(chuàng)建鼓的midi軌道,或者直接哼唱來創(chuàng)建低音旋律。Vochlea的技術(shù)旨在幫助人類將聲音從他們的腦海中釋放出來,并放到他們的數(shù)字音頻工作站上。 2021年9月,Vochlea推出了其第二代產(chǎn)品,這是一款純軟件產(chǎn)品,不再需要專門的麥克風(fēng)。

藝術(shù)家打造的創(chuàng)意人工智能
一些最有趣的輔助人工智能是由音樂家構(gòu)建的,或者至少是有音樂家的密切參與。
Holly Herndon是現(xiàn)代人工智能音樂的重要人物。在她2019年的專輯“Spawn”中,她和她的團(tuán)隊構(gòu)建了一個名為Spawn的人工智能,在她和其他歌手的聲音樣本上對進(jìn)行訓(xùn)練,然后在專輯中將輸出結(jié)果用作歌手。在2021年,Herndon推出了名為Holly+的產(chǎn)品,與一家名為Never Before Heard Sounds的初創(chuàng)公司合作。她將Holly+描述為自己的“數(shù)字雙胞胎”。人們可以上傳和弦音頻,并下載數(shù)字Holly的演唱版本。Herndon還以DAO的形式建立了一個社區(qū)和商業(yè)模式——一個去中心化的自治組織,是當(dāng)前web3運動與NFT和區(qū)塊鏈技術(shù)一起的大趨勢之一——通過 Holly+創(chuàng)作的音樂將創(chuàng)造一個流動版權(quán),可用于技術(shù)開發(fā)投入。
美國組合Yacht在2019年為他們的“Chain Tripping”專輯構(gòu)建了一個人工智能系統(tǒng),在他們整個音樂庫上訓(xùn)練,以便它可以創(chuàng)建新的原創(chuàng)音樂和歌詞。然后樂隊將其塑造成專輯的10首曲目。Yacht決定他們不會在人工智能制作的音樂或歌詞中添加任何東西,拿來直接用。人工智能并沒有取代人類音樂家的創(chuàng)造力。在制作“Chain Tripping”專輯的過程中人工智能發(fā)揮了關(guān)鍵作用,但人類仍然是最終驅(qū)動力——無論是通過他們過去的音樂數(shù)據(jù)訓(xùn)練人工智能,以及對如何使用人工智能輸出做出的決定。
如果你對人工智能音頻感興趣,那么Dadabots的工作值得關(guān)注。這是一個由音樂家和開發(fā)人員組成的團(tuán)體,近年來創(chuàng)建了一系列有趣且具有啟發(fā)性的項目。“我們開發(fā)的神經(jīng)網(wǎng)絡(luò)輸出原始音頻,可以模仿樂隊?!边@些項目包括Relentless Doppelganger,一個“神經(jīng)技術(shù)死亡金屬”的YouTube直播,還有與之匹配的視覺效果。Dadabots也參與了Outerhelios,另一個全天候生成音樂直播,這次是自由爵士。通過與美國宇航局的合作,Outerhelios從航海者3號太空探測器上廣播。Dadabots還創(chuàng)造了受食人尸樂隊Cannibal Corpse啟發(fā)的永無止境的音樂;貝爾實驗室紀(jì)錄片的神經(jīng)beatbox視頻;還有一個有趣的 deepfake項目,使用人工智能模擬Nirvana翻唱Gorillaz。哦,他們參加了 2022 年的人工智能歌曲比賽,而且是與Nuns in a Moshpit樂隊合作!Dadabots是一項實驗性藝術(shù)和技術(shù)研究,而不是一家商業(yè)初創(chuàng)公司,但其的工作與我們一直在分析的公司一樣,正在幫助推動人工智能音樂的藝術(shù)和科學(xué)向前發(fā)展。

人工智能音樂的用途:幫助業(yè)余用戶制作音樂
我們已經(jīng)討論過使用創(chuàng)意人工智能的專業(yè)音樂人,但對于業(yè)余玩家使用這項技術(shù)來制作音樂還有很大想象空間。
澳大利亞初創(chuàng)公司Splash是這兩個領(lǐng)域之間的橋梁。2017年,Splash當(dāng)時(原名Popgun)它推出了一個名為Alice的人工智能,可以與人類一起彈鋼琴,用自己的旋律回應(yīng)他們演奏的內(nèi)容。這個人工智能很快就被用于其他用途:一個名為Splash Pro的產(chǎn)品,音樂家可以使用它來獲得由人工智能生成的鋼琴、貝斯、鼓和人聲作品,以導(dǎo)出到他們的數(shù)字音頻工作站并在他們的項目中使用。
通過一款名為Splash的程序,Popgun將其人工智能產(chǎn)品轉(zhuǎn)化為普通消費者使用。它最初是一個移動端音樂制作應(yīng)用,人們可以通過點擊代表節(jié)拍、循環(huán)和音效的網(wǎng)格來創(chuàng)作歌曲。這些聲音是在主題包中下載的,不同的是,所有這些聲音都來自Popgun的人工智能。Splash為沒有受過音樂訓(xùn)練或樂器技能的人提供了一種開始制作音樂的方式。在2020年5月,當(dāng)Popgun將Splash帶到游戲平臺Roblox時,它提升了幾個檔次,人們可以使用該工具制作較短的DJ列表,在其他玩家跳舞和聊天的同時創(chuàng)作音樂。在最初的20天里,有超過100萬人玩了這款游戲。到2020年11月,這一數(shù)字已經(jīng)增長到2100萬人。從那時起,Splash的Roblox游戲通過新的地點和活動不斷擴(kuò)展,而Popgun在籌集了2000萬美元后,于2021年11月更名為Splash。Splash已經(jīng)幫助數(shù)百萬人使用人工智能創(chuàng)建的元素創(chuàng)作音樂,其中許多是孩子。就消費者范圍而言,它是迄今為止較大的人工智能音樂項目。

創(chuàng)造性人工智能技術(shù)還被融合進(jìn)了一些現(xiàn)有音樂創(chuàng)作應(yīng)用。?BandLab有超過5000萬人使用它的應(yīng)用程序來錄制和分享音樂。2022年3月,它添加了一個名為“SongStarter”的功能,可以根據(jù)用戶的需求生成節(jié)拍、旋律及和弦,甚至可以用歌詞甚至表情符號來輸入需求!該公司表示,這只是其向輔助人工智能工具擴(kuò)張的“開始”。
另一個面向音樂家的人工智能音樂工具Starmony于2021年7月在瑞典推出。它與Vochlea同屬一個賽道,承諾讓藝術(shù)家或制作人“只需要你的聲音就能創(chuàng)作一整首歌”,然后分享你的歌曲。當(dāng)年該公司籌集了340萬美元的資金,它表示希望吸引下一代藝術(shù)家,“那些在TikTok有創(chuàng)意并在現(xiàn)成伴奏下唱歌的人”。它的聯(lián)合創(chuàng)始人曾是X5 Music的老板,一家流媒體編輯公司,于2016年被華納音樂集團(tuán)收購。
另一家專注于非專業(yè)人群的人工智能音樂初創(chuàng)公司是美國的Boomy。它于?2019年推出,根據(jù)設(shè)置的流派和風(fēng)格等參數(shù)獲取由其系統(tǒng)生成的一段音樂。如果你不喜歡這首音樂,你可以簡單地按下一個按鈕來獲取另一個,直到你找到適合的音樂。你還可以編輯音軌,例如移動、添加和刪除小節(jié)。這與幾年前Jukedeck和Amper Music的做法非常相似。然而Boomy的重點有所不同:它希望人們通過將他們使用其系統(tǒng)制作的曲目編成專輯來商業(yè)發(fā)行,而不是制作廉價的背景音樂。Boomy將音樂分發(fā)給40多個流媒體平臺,包括Spotify、YouTube和TikTok,然后與制作歌曲的用戶分享每首曲目的版稅。用戶獲得80的版稅,而Boomy擁有版權(quán),創(chuàng)作者也可以將曲目用于大多數(shù)個人和商業(yè)用途,例如在他們自己的視頻和播客中。作者在2019年嘗試了Boomy,發(fā)行了兩張人工智能創(chuàng)建的專輯。專業(yè)音樂人不用擔(dān)心,因為從那時起的總收入還不到五美元!Boomy用戶自推出以來已創(chuàng)作了超過750萬首曲目。這家初創(chuàng)公司估計,這占到目前錄制音樂的7.7以上。
人工智能音樂的用途:虛擬藝術(shù)家
創(chuàng)意人工智能最有趣的用途之一是為虛擬偶像創(chuàng)作音樂,一個虛擬角色也可以像人類藝術(shù)家一樣發(fā)布音樂。當(dāng)然,這并不新鮮,但在過去,虛擬偶像的音樂仍然是由人類創(chuàng)作的。例如在Gorillaz背后,有Damon Albarn和不斷輪換的客座音樂人團(tuán)隊。英雄聯(lián)盟游戲已經(jīng)產(chǎn)生了幾個虛擬組合,但音樂還是由人類制作的。如果將人工智能生成的音樂與虛擬角色混合會發(fā)生什么?一些公司正在嘗試這種可能性。

Authentic Artists出現(xiàn)于2021年4月,投資方有媒體高管James Murdoch和林肯公園主唱Mike Shinoda,后來還獲得了華納音樂的投資。Authentic Artists正在構(gòu)建虛擬藝術(shù)家和創(chuàng)意人工智能需要的音樂。它的角色包括一條龍、半機(jī)械人和一只兔子,音樂由人工智能制作。在2022年,該公司參與進(jìn)行非同質(zhì)化代幣發(fā)行。
Auxuman是一家由音樂家Ash Koosha在英國共同創(chuàng)立的初創(chuàng)公司。它創(chuàng)建了一個名為Yona的虛擬藝人,并建立了一個人工智能系統(tǒng)來為她創(chuàng)作音樂,然后在2019年建立了一個更大的虛擬藝人團(tuán)隊。Auxuman后來轉(zhuǎn)向開發(fā)auxWorld,一個將于2022年晚些時候推出的“元宇宙體驗平臺”。
人工智能音樂、虛擬偶像和元宇宙的融合也可以從虛擬現(xiàn)實初創(chuàng)公司 Sensorium的做法中看出。它正在構(gòu)建一個名為Sensorium Galaxy?的虛擬世界,音樂將成為其中的重要組成部分。其中一些音樂將來自人類DJ,合作者包括David Guetta、Carl Cox、Steve Aoki和Charlotte de Witte等人。Sensorium也在打造自己的虛擬DJ形象。Kara Mar,一個虛擬的techno DJ,將在Sensorium Galaxy中表演,并通過文字聊天和視頻通話與粉絲互動。但重要的是,她演奏的音樂將由人工智能生成——特別是來自Mubert,我們之前談到的初創(chuàng)公司之一。
人工智能音樂的用途:老歌手的新歌曲
我們將在段討論的人工智能音樂的最終用途是為老一輩,甚至是已經(jīng)過世的歌手創(chuàng)作新的作品新歌。在藝術(shù)家的作品庫上訓(xùn)練人工智能,然后看看它想出了什么新音樂。
這種方法是2016年初次獲得廣泛關(guān)注的人工智能音樂公開演示之一,當(dāng)時索尼計算機(jī)科學(xué)實驗室發(fā)布了一首名為“Daddys Car”的歌曲。它是由一個名為Flow Machines的系統(tǒng)創(chuàng)建的,索尼計算機(jī)科學(xué)實驗室在披頭士樂隊的歌曲庫上進(jìn)行了訓(xùn)練,看它是否可以創(chuàng)作出有足夠披頭士樂隊風(fēng)味的歌曲。
需要注意的是這不僅僅是人工智能的產(chǎn)物:Flow Machines的輸出隨后由人類音樂家Benoit Carré編曲制作。Benoit Carré是當(dāng)代人工智能音樂的另一個重要人物。2019年,Carré還發(fā)行了一張名為“American Folk Songs”的EP,它收錄了美國傳奇民謠歌手Pete and Peggy Seeger以及Horton Barker的無伴奏合唱錄音,并使用人工智能為其創(chuàng)作編曲。
另一個登上頭條的項目是2021年的“Lost Tapes of the 27 Club”。 在這里,人工智能系統(tǒng)接受了Nirvana、Amy Winehouse、Jim Morrison和Jimi Hendrix的歌曲數(shù)據(jù)訓(xùn)練,然后根據(jù)這些歌曲創(chuàng)作“新”音樂。人類再次在整理人工智能的輸出以及決定哪些音樂片段可以組合成新歌曲方面發(fā)揮了重要作用。一位致敬樂隊的歌手演唱了Nirvana的新曲目“Drowned In The Sun”。該項目的名稱來自所有藝人都于27歲時去世的事實,希望借此提高人們對音樂行業(yè)心理健康問題的認(rèn)識。
當(dāng)然,不是加入27歲俱樂部才有資格參與其中。2020年的Travisbott項目來自于一家名為Space150的數(shù)字機(jī)構(gòu),該機(jī)構(gòu)在美國說唱歌手Travis Scott的音樂和歌詞上訓(xùn)練了一個人工智能。最后的作品是一首名為“Jack Park Canny Dope Man”的歌曲,并附有一段怪異的deepfake音樂視頻。這不是一個商業(yè)項目,也不是Travis Scott本人的營銷噱頭。它更多的是對技術(shù)能力的探索。
互聯(lián)網(wǎng)科技巨頭與人工智能音樂
到目前為止,我們已經(jīng)討論了很多關(guān)于涉及人工智能音樂的初創(chuàng)公司和藝術(shù)家。一些較大的互聯(lián)網(wǎng)公司也涉足這一領(lǐng)域。
我們之前談到的來自Benoit Carré的美國民歌重構(gòu)項目就是使用 Spotify內(nèi)部實驗室開發(fā)的工具完成的。2017年,Spotify聘請了Fran?ois Pachet來領(lǐng)導(dǎo)一個實驗室。 Fran?ois Pachet之前是巴黎索尼實驗室的總監(jiān),Daddys Car”歌曲背后的團(tuán)隊的核心,也是世界上最杰出的人工智能音樂專家之一。當(dāng)時的一些報道認(rèn)為Fran?ois Pachet將幫Spotify打造一個情緒音樂生成音樂庫,但該公司一直堅持這項雇傭是為音樂家構(gòu)建工具。福布斯雜志最近對此的跟進(jìn)表明這些工具也可能可供音樂愛好者使用?!耙粋€可以讓你調(diào)整歌曲的節(jié)奏或旋律的工具。你可以將賈斯汀比伯或Drake的流行和聲與舒伯特或巴赫賦格的旋律節(jié)奏結(jié)合起來?!?/p>
蘋果在這方面也值得密切關(guān)注。2022年2月,蘋果公司收購了前面談到的英國初創(chuàng)公司AI Music。AI Music的最初使命是構(gòu)建一個能夠適應(yīng)提供的音樂的人工智能——或者按照公司的描述,“改變現(xiàn)有音樂”。它希望能夠?qū)⒏枨木幊刹煌娘L(fēng)格和流派以滿足聽眾的需求。例如,將一首歌變成健身房的deep house單曲,或適合放松的深夜爵士曲目。蘋果經(jīng)常收購初創(chuàng)公司,而且?guī)缀鯊牟徽務(wù)撝蟮挠媱澃才?。它可能被用在蘋果音樂或蘋果鍛煉+服務(wù)中。它也可以使用該技術(shù)為庫樂隊GarageBand添加新的輔助工具,或?qū)⑵洳渴鹪趇Movie或Final Cut Pro產(chǎn)品中,以幫助人們將音樂適配于視頻內(nèi)容。我們沒有確切答案,但蘋果收購人工智能音樂專家團(tuán)隊肯定是很有趣的舉動。
一家有名的人工智能音樂初創(chuàng)公司Jukedeck在2019年被TikTok的母公司字節(jié)跳動收購。Jukedeck的首席執(zhí)行官成為TikTok內(nèi)部人工智能實驗室的產(chǎn)品總監(jiān),盡管此后他輾轉(zhuǎn)其他工作崗位。TikTok的增長受到商業(yè)音樂的推動,并且隨著與唱片公司和發(fā)行商的授權(quán)關(guān)系增加,商用授權(quán)已成為唱片公司的重要收入來源而不僅僅是宣傳渠道。人工智能生成的音樂顯然也有可能在TikTok中發(fā)揮作用。想象一下,你可以在制作視頻時按下一個按鈕來創(chuàng)建即時的、原創(chuàng)的、生成的配樂……

谷歌是另一家探索人工智能音樂方向的互聯(lián)網(wǎng)科技巨頭,盡管感覺上它的興趣主要是實驗性的。它在這方面沒有具體業(yè)務(wù),但確實將音樂視為測試其更通用人工智能平臺能力的途徑。2016年,谷歌宣布了Magenta,這是一個探索機(jī)器學(xué)習(xí)技術(shù)(人工智能的子集之一)用于創(chuàng)作引人入勝的藝術(shù)和音樂的項目。Magenta旗下的成果包括2017年的AI Duet,它是一個人工智能鋼琴演奏者,可以響應(yīng)你作為人類演奏的內(nèi)容,以及Nsynth,一個人工智能驅(qū)動的基于軟件合成器,能夠創(chuàng)造全新的聲音。2019年,谷歌在其搜索主頁上將資歷深厚的谷歌涂鴉用于人工智能音樂展示。用戶在網(wǎng)頁上創(chuàng)作旋律,然后使用人工智能將其編配為約翰·塞巴斯蒂安·巴赫(Johann Sebastian Bach)的標(biāo)志性四部和聲。2020年的Lo-Fi Player是由人工智能生成的低保真嘻哈音樂,這種音樂風(fēng)格在YouTube上非常受歡迎。人們還可以通過點擊屏幕上的不同對象可以與音樂互動。同年,谷歌還推出了Blob Opera,這是一組可愛的水滴形歌劇歌手,由受過人類歌手訓(xùn)練的人工智能驅(qū)動。所有這些都是有趣、創(chuàng)新的演示,但Magenta更大的價值在于它可以被任何構(gòu)建自己的人工智能音樂系統(tǒng)的人使用,無論他們是開發(fā)人員還是音樂家。谷歌已經(jīng)為整個世界的人工智能音樂可能性構(gòu)建了底層技術(shù)支撐。

還有兩家大型科技公司需要介紹。首先是OpenAI,一家由特斯拉創(chuàng)始人埃隆馬斯克支持的非營利性人工智能公司。它靠文本生成的GPT-3深度學(xué)習(xí)模型而聞名。該公司也致力于人工智能音樂研究。2019年,它發(fā)布了MuseNet,這是一個可以用10種不同的樂器生成四分鐘的作品的神經(jīng)網(wǎng)絡(luò)。MuseNet聲稱可以“結(jié)合從鄉(xiāng)村音樂到莫扎特到披頭士的任意風(fēng)格”。在2020年,它發(fā)布了Jukebox,這是另一個可以生成音樂和人聲的神經(jīng)網(wǎng)絡(luò)。該公司表示可以創(chuàng)作原創(chuàng)音樂;重寫現(xiàn)有曲目;截取一段12秒的音樂片段并將其完成為一首完整的歌曲,并按照貓王、弗蘭克·辛納屈、凱蒂·佩里和其他歌手的風(fēng)格創(chuàng)作deepfake翻唱版本。與谷歌一樣,OpenAI與其說是在人工智能音樂上建立業(yè)務(wù),不如說是創(chuàng)建其他開發(fā)人員和藝術(shù)家可以在他們的項目中使用的框架。
最后,電商巨頭亞馬遜通過2019年的項目DeepComposer涉足人工智能音樂。這也是為開發(fā)人員制作的工具,帶有示例代碼和訓(xùn)練數(shù)據(jù)的鋼琴鍵盤可幫助人們探索生成音樂。這更像是一個針對機(jī)器學(xué)習(xí)學(xué)生的教育項目,而不是與亞馬遜音樂相關(guān)的任何業(yè)務(wù)。
圍繞人工智能音樂的討論
我們已經(jīng)討論了人工智能音樂的一些主要用戶場景,介紹了在該領(lǐng)域運營的主要初創(chuàng)公司;也探索了一些較大的科技公司正在做什么。我們接下來將通過圍繞人工智能音樂及其對人類音樂家和更廣泛的音樂產(chǎn)業(yè)的影響來結(jié)束這篇文章。
最棘手的爭論之一是關(guān)于人工智能是否可以合法地成為音樂作者。我們提到其中一家初創(chuàng)公司AIVA已被法國的作曲家協(xié)會Sacem接受為成員。但在其他地方,這是一個有爭議的問題。2022年2月,美國版權(quán)局駁回了發(fā)明家Steven Thaler針對他的 Creativity Machine AI無法對其作品(本案中為視覺藝術(shù))的決定提出的上訴。版權(quán)局的觀點是由機(jī)器或單純的機(jī)械過程制作的作品,因為沒有人類作者的任何創(chuàng)造性投入,所以不受到版權(quán)保護(hù)。在商業(yè)人工智能音樂的背景下,這意味著合法作者要么是人工智能系統(tǒng)的佼佼者,要么是使用人工智能創(chuàng)作音樂的人。
圍繞人工智能音樂的另一場爭議涉及侵權(quán)的定義。確切地說,在受版權(quán)保護(hù)的音樂數(shù)據(jù)上訓(xùn)練音樂人工智能是否涉及侵權(quán)?該過程通常涉及復(fù)制音樂數(shù)據(jù)庫,因此答案可能是涉及侵權(quán)。然而,正如律師事務(wù)所Reed Smith的合伙人Sophie Goossens在2019年接受采訪時向我們解釋的那樣,事情并非如此簡單。在美國,根據(jù)過去的多項法院判例,在受版權(quán)保護(hù)的音樂上訓(xùn)練人工智能被認(rèn)為是合理使用。日本、新加坡和中國等國家也是如此。這些國家都是人工智能技術(shù)的新興參與者。 然而,在歐洲,情況就不同了。最近的版權(quán)立法允許權(quán)利人保留對其內(nèi)容的文本和數(shù)據(jù)挖掘的權(quán)利——無論是音樂、文本、視頻或其他材料。這為版權(quán)所有方創(chuàng)造了一個將人工智能訓(xùn)練數(shù)據(jù)授權(quán)給歐洲的人工智能初創(chuàng)公司的商業(yè)機(jī)會。當(dāng)然,初創(chuàng)公司只需在世界其他地方注冊辦公室,就可以為此類數(shù)據(jù)訓(xùn)練尋找更有利的法律環(huán)境。
Trance音樂人Brian Transeau(人稱BT)在2021年接受《連線》雜志采訪時談到了這場持續(xù)的爭論。他質(zhì)疑人工智能公司“拿走他人的作品來訓(xùn)練模型”是否合理,并建議公司應(yīng)該“首先與藝術(shù)家本人溝通”。BT的觀點是,需要有“保護(hù)機(jī)制”來保護(hù)音樂家、視覺藝術(shù)家、程序員和任何其他可能用于訓(xùn)練人工智能的創(chuàng)造性工作者。這將是一種對人工智能公司商業(yè)模式的一記悶棒,但你也可以從樂觀的角度來看待。這將刺激初創(chuàng)公司將人類藝術(shù)家視為合作伙伴,共同創(chuàng)作,而不是簡單地為模型訓(xùn)練的數(shù)據(jù)提供方。當(dāng)這篇文章發(fā)表時(2022年7月),英國音樂產(chǎn)業(yè)機(jī)構(gòu)UK Music正在其代表唱片公司、出版商和音樂家等各個成員機(jī)構(gòu)的支持下抗議英國政府的計劃。該計劃會允許人工智能對音樂進(jìn)行數(shù)據(jù)挖掘,而公司無需獲得其創(chuàng)作者和版權(quán)所有者的許可。
前文討論了Endel和Aimi等初創(chuàng)公司如何與藝術(shù)家合作,以及Holly Herndon和Yacht等藝術(shù)家如何構(gòu)建自己的人工智能系統(tǒng)。這種人機(jī)協(xié)作是可行的,而且應(yīng)該得到鼓勵和支持。藝術(shù)家越多地接觸這項技術(shù),他們就越有能力塑造技術(shù)的發(fā)展方向以和商業(yè)模式。這點也適用于更廣泛的音樂產(chǎn)業(yè)。唱片公司和發(fā)行商在參與或投資人工智能音樂初創(chuàng)公司方面多少有些遮遮掩掩,至少在公開宣傳上是這樣。為什么呢?一個原因是擔(dān)心旗下的藝人對此類舉動的反感。然而,就像音樂家一樣,音樂版權(quán)所有方也可以通過與初創(chuàng)公司和開發(fā)人員共同建立人工智能系統(tǒng)來幫助塑造這項技術(shù)及其發(fā)展方式。
華納音樂集團(tuán)于2022年3月對LifeScore的投資在這方面是一個令人鼓舞的跡象。近年來,唱片公司已成為音樂科技初創(chuàng)公司的積極投資方,而人工智能音樂無疑是一個值得參與的領(lǐng)域。在2021年下半年和2022年年初,對人工智能音樂初創(chuàng)的投資規(guī)模正在大幅提高。Splash和Aimi均獲得了2000萬美元的融資,而LifeScore的融資額為1440萬美元。隨著這項技術(shù)從實驗性演示轉(zhuǎn)向?qū)嶋H業(yè)務(wù),我們預(yù)計在2022年和2023年會看到更多用于人工智能音樂的千萬級融資。
圍繞人工智能音樂的較大問題一直是關(guān)于它是否會搶走人類音樂家的工作,威脅作曲家的生計構(gòu)成生存。這個問題還沒有一個簡單的答案。毫無疑問,人工智能音樂將在某些領(lǐng)域與人類音樂競爭。制成音樂就是其中之一。Hans Zimmer不必?fù)?dān)心被人工智能競爭對手打敗而失去大片配樂的工作,但在為社交視頻或企業(yè)培訓(xùn)影片提供快速、廉價的配樂時……情況可能就不太一樣。情緒音樂是另一個受威脅的領(lǐng)域。如果有人正在尋找一個音樂電臺來工作、學(xué)習(xí)、放松或睡覺,生成音樂是可行的。盡管如此,像Endel和 Aimi這樣專注情緒音樂的初創(chuàng)公司似乎依然熱衷于與人類藝術(shù)家合作,而不是取代他們。
也許更具正面意義的問題是,創(chuàng)造性人工智能將如何幫助提升人類的創(chuàng)造力? 這些系統(tǒng)可以將音樂家跳出創(chuàng)作屏障,或者激發(fā)他們的音樂舒適區(qū)之外的想法。它們可能是鼓機(jī)和合成器等樂器的下一次迭代,而人類藝術(shù)家依靠創(chuàng)造力和音樂才能得以充分利用了這些工具。
考慮非專業(yè)音樂人也很重要,或者更準(zhǔn)確地說,那些潛在的音樂家。BandLab、Splash和Boomy都是利用創(chuàng)意人工智能怎樣向沒有受過音樂或樂器訓(xùn)練的人打開音樂創(chuàng)作大門的例子。他們可能會使用這些音樂在社交網(wǎng)絡(luò)上分享,也可能是更認(rèn)真地制作音樂的墊腳石,當(dāng)然最可能只是單純?yōu)榱撕猛妗A硗馊斯ぶ悄芤魳穵蕵窞樾睦斫】捣?wù)也一個有值得探索的方向。
所以,讀過這篇文章最重要的收獲可能是,無論人工智能音樂會成為什么樣,以及它可以幫助人類做什么,音樂行業(yè)需要通過不斷接觸這些前沿技術(shù)才能真正理解。嘗試這些人工智能,與這些初創(chuàng)公司交談,探究他們現(xiàn)在的技術(shù)水平,并幫助塑造他們未來的發(fā)展方向。