照片也可以說話了(照片變視頻)
項(xiàng)目背景與目標(biāo):通過AI技術(shù)將照片和聲音合成為一個(gè)有聲視頻。
核心概念:利用AI圖像處理技術(shù)、語音合成技術(shù)和視頻合成技術(shù),照片與語音合成為一個(gè)有聲視頻。
實(shí)施步驟、流程、方法: a. 收集照片和聲音樣本; b. 使用AI圖像處理工具對照片進(jìn)行處理; c. 利用語音合成工具生成語音; d. 將處理后的照片和生成的語音進(jìn)行同步; e. 使用視頻合成工具將照片和語音合成為有聲視頻; f. 對生成的視頻進(jìn)行優(yōu)化和調(diào)整。
一、照片:
提供清晰照片(如果不清晰需用到老照片修復(fù))
二、音頻合成
客戶需要提供至少一分鐘的原聲視頻
百度飛漿:https://aistudio.baidu.com/
1、注冊用百度賬號登錄使用
2、搜索框搜索 : 有手就行
3、這就是語音合成:點(diǎn)進(jìn)去
4、點(diǎn)擊運(yùn)行
5、選擇32GB運(yùn)行
6、點(diǎn)擊運(yùn)行
運(yùn)行后自動(dòng)安裝稍微等候等待下方出現(xiàn)運(yùn)行時(shí)長,結(jié)束時(shí)間如圖:
7、找到左側(cè)任務(wù)欄最有一個(gè)選項(xiàng)雙擊
8、點(diǎn)擊在瀏覽器打開
三、進(jìn)入語音合成頁面運(yùn)行合成
1、注意事項(xiàng):
此音頻格式最好wav,mp3格式也可以,需要單獨(dú)下載音頻軟件進(jìn)行降噪處理(音頻處理軟件搜就可以)
2、音頻文件上傳
3、點(diǎn)擊檢驗(yàn)
4、訓(xùn)練模型導(dǎo)出模型(訓(xùn)練模型不是越多越好詳情https://www.bilibili.com/read/cv19722919?spm_id_from=333.999.0.0)
5、音頻合成
6、下載合成的語音
7、注意:合成完了如果不繼續(xù)合成一定要退出
四、DID
每個(gè)DID賬號只能生成5分鐘的視頻,后期需多注冊
注冊網(wǎng)站: https://studio.d-id.com/
1、創(chuàng)建視頻
2、上傳你需要做的的照片并點(diǎn)擊
3、把合成的語音上傳
4、生成視頻然后下載