散文網(wǎng) » 生活 »日常 » AI新應(yīng)用–文本轉(zhuǎn)音樂

AI新應(yīng)用–文本轉(zhuǎn)音樂

2023-08-11 11:24 作者:新的褪色者 0人讀過 | 我要投稿

隨之AI技術(shù)的快速發(fā)展，我在這里寫了很多關(guān)于文本轉(zhuǎn)圖像、視頻、全景、游戲等各個(gè)領(lǐng)域的應(yīng)用，今天介紹一個(gè)AI新應(yīng)用–文本轉(zhuǎn)音樂。

這里要用到的工具名稱為AudioCraft，audiocraft是由Meta AI開發(fā)的，在它之前已經(jīng)有MusicGen、AudioGen等工具的推出，在音樂愛好者群體獲得了一致好評(píng)和廣泛贊譽(yù)。

AudioCraft是一個(gè)PyTorch庫，用于音頻生成的深度學(xué)習(xí)研究。AudioCraft 包含推理和訓(xùn)練代碼用于兩個(gè)最先進(jìn)的 AI 生成模型，產(chǎn)生高質(zhì)量的音頻：AudioGen 和 MusicGen。因?yàn)槭俏谋旧梢魳返年P(guān)系，我就不在這個(gè)網(wǎng)站上插入音樂了。下面列舉了模型訓(xùn)練和音頻生成過程：

這個(gè)網(wǎng)站為文本生成音樂的AudioCraft代碼地址：GitHub – facebookresearch/audiocraft: Audiocraft is a library for audio processing and generation with deep learning. It features the state-of-the-art EnCodec audio compressor / tokenizer, along with MusicGen, a simple and controllable music generation LM with textual and melodic conditioning.