Audiocraft音樂(lè)生成整合包使用教程
Audiocraft音樂(lè)生成整合包使用教程
MusicGen是一個(gè)簡(jiǎn)單可控的音樂(lè)生成模型,能夠根據(jù)文本描述或音頻提示生成高質(zhì)量的音樂(lè)樣本。
下載壓縮包,下載地址: https://xueshu.fun/2867/,解壓后,如下圖所示,雙擊bat文件運(yùn)行

打開(kāi)軟件如下圖所示

瀏覽器訪(fǎng)問(wèn)http://127.0.0.1:7860/,即可在瀏覽器里操作啦!

More details
模型將根據(jù)您提供的文本描述或音頻提示生成一個(gè)音樂(lè)片段。
選擇的生成的音樂(lè)時(shí)長(zhǎng)越長(zhǎng),則生成等待時(shí)間會(huì)越長(zhǎng)。2分鐘的音樂(lè)可能需要大約10分鐘來(lái)生成,這里為了體驗(yàn)感受,限制生成的音樂(lè)時(shí)長(zhǎng)最長(zhǎng)為30秒。
我們提供4個(gè)模型的效果體驗(yàn):
Melody: 一個(gè)能夠根據(jù)文本和音頻輸入生成音樂(lè)的模型。注意,您也可以只使用文本來(lái)生成音樂(lè)。
Small: 一個(gè)僅使用文本輸入的300M transformer decoder。
Medium: 一個(gè)僅使用文本輸入的1.5B transformer decoder。
Large: 一個(gè)僅使用文本輸入的3.3B transformer decoder(對(duì)最長(zhǎng)序列可能會(huì)OOM)。
標(biāo)簽: