AI新應(yīng)用–文本轉(zhuǎn)音樂
隨之AI技術(shù)的快速發(fā)展,我在這里寫了很多關(guān)于文本轉(zhuǎn)圖像、視頻、全景、游戲等各個(gè)領(lǐng)域的應(yīng)用,今天介紹一個(gè)AI新應(yīng)用–文本轉(zhuǎn)音樂。
這里要用到的工具名稱為AudioCraft,audiocraft是由Meta AI開發(fā)的,在它之前已經(jīng)有MusicGen、AudioGen等工具的推出,在音樂愛好者群體獲得了一致好評(píng)和廣泛贊譽(yù)。

AudioCraft是一個(gè)PyTorch庫,用于音頻生成的深度學(xué)習(xí)研究。AudioCraft 包含推理和訓(xùn)練代碼 用于兩個(gè)最先進(jìn)的 AI 生成模型,產(chǎn)生高質(zhì)量的音頻:AudioGen 和 MusicGen。因?yàn)槭俏谋旧梢魳返年P(guān)系,我就不在這個(gè)網(wǎng)站上插入音樂了。下面列舉了模型訓(xùn)練和音頻生成過程:

這個(gè)網(wǎng)站為文本生成音樂的AudioCraft代碼地址:GitHub – facebookresearch/audiocraft: Audiocraft is a library for audio processing and generation with deep learning. It features the state-of-the-art EnCodec audio compressor / tokenizer, along with MusicGen, a simple and controllable music generation LM with textual and melodic conditioning.

詳細(xì)描述了本地部署步驟、模型、API文檔、代碼訓(xùn)練等內(nèi)容,感興趣的同學(xué)可以嘗試部署和測試。
當(dāng)然它有部署在huggingface上MusicGen的在線體驗(yàn)功能:MusicGen – a Hugging Face Space by facebook
打開后的具體界面如下:

不熟悉本地部署的同樣可以點(diǎn)擊鏈接嘗試在線生成音樂。