體驗(yàn)人工智能驅(qū)動(dòng)的未來科技 – DeepMind機(jī)器人,AI視頻聊天,多國(guó)語(yǔ)言模

- 人工智能機(jī)器人DeepMind Robotics和OP 3機(jī)器人可以通過深度強(qiáng)化學(xué)習(xí)模擬足球技能,完成各種足球動(dòng)作,包括進(jìn)攻、防守和射門等。
https://sites.google.com/view/op3-soccer
- Tavern AI是一個(gè)聊天工具,可以與任意虛擬角色聊天,支持多種語(yǔ)言模型,包括中文。
https://github.com/TavernAI/TavernAI
- OpenGV Lab的Asked Anything是一個(gè)視頻聊天工具,可以識(shí)別視頻中的物體和動(dòng)作,并支持中文交互。
https://github.com/OpenGVLab/Ask-Anything
- ElevenLabs 的多語(yǔ)言模型 Eleven Multilingual V1支持七種語(yǔ)言,可以理解文本中的細(xì)微變化,并輸出帶有情感的語(yǔ)音播報(bào)。
- 可以使用自己的聲音生成多國(guó)語(yǔ)言,面向所有用戶開放試用
- 開通高級(jí)賬號(hào)后可以上傳自己的語(yǔ)言,通過聲音克隆的方法完成多語(yǔ)言播報(bào)
https://beta.elevenlabs.io/blog/eleven-multilingual-v1/
- AudioGPT是一個(gè)開源的音頻處理工具,可以完成復(fù)雜的音頻處理工作
- 可以完成圖像轉(zhuǎn)語(yǔ)音,文本轉(zhuǎn)歌曲,音頻轉(zhuǎn)圖像等處理
https://github.com/AIGC-Audio/AudioGPT
標(biāo)簽: