音樂AI服務爆炸?Stable Audio是一款文本轉(zhuǎn)音樂工具



圖像生成器 Stable Diffusion 背后的公司 Stability AI 宣布推出一款名為Stable Audio的服務,這是一款基于人工智能的、將文本生成為音樂音頻的服務。
這款新工具是 Stability AI 首次涉足音樂領域,可以生成長達 90 秒的高質(zhì)量音樂片段和音效。它還能對體裁、樂器、情緒、BPM 等細節(jié)方面進行設置。
Stable Audio 訓練數(shù)據(jù)集的來源,是 AudioSparx 音樂庫中 80 多萬個音頻文件。Stability AI 表示,這個新平臺 "非常適合音樂家創(chuàng)建音樂采樣"。
他們在 stability.ai 發(fā)布的一篇博文中舉例,說明了生成器的功能。它能夠按照任何給定的 BPM 生成音樂樣本,而 Meta 和谷歌等公司之前創(chuàng)建的人工智能音樂生成器迄今為止還無法做到這一點。
Stable Audio 的另一個優(yōu)勢是,除了流派和樂器等音樂屬性外,它還能考慮 "音頻文件的持續(xù)時間和開始時間",因此能創(chuàng)造出結(jié)構化的音樂創(chuàng)意。這就避免了許多人工智能生成器遇到的一個問題,即它們會隨機生成歌曲的一些片段,這些片段在一個樂句的中間開始或結(jié)束。
Stable Audio 可以免費生成長達 20 秒的音頻樣本,每月 11.99 美元的付費版本可以讓用戶每月生成多達 500 首曲目,每首曲目最長 90 秒。
"Stability AI 首席執(zhí)行官 Emad Mostaque 說:"作為唯一一家獨立、開放和多樣態(tài)的生成式人工智能公司,我們很高興能利用我們的專業(yè)知識開發(fā)一款支持音樂創(chuàng)作者的產(chǎn)品。"我們希望 Stable Audio 能夠讓音樂愛好者和專業(yè)創(chuàng)作人員借助人工智能生成新的內(nèi)容,我們期待著它將激發(fā)出無窮無盡的創(chuàng)新。"
