最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

【技術(shù)分享】AI數(shù)字人實(shí)時(shí)互動(dòng)直播技術(shù):數(shù)字人口型驅(qū)動(dòng)(算法篇)

2023-05-18 19:46 作者:Siyuejiang  | 我要投稿

數(shù)字人口型驅(qū)動(dòng)

FACS根據(jù)面部肌肉群對(duì)面部動(dòng)作編碼

51個(gè)通道


音頻特征:MFCC、基于深度學(xué)習(xí)的表征方法etc,選擇deepspeech,音頻-文本工具/音頻抽取特征,音頻轉(zhuǎn)成音頻圖


面部口型驅(qū)動(dòng):音頻特征提取——切分音頻特征(階梯過(guò)濾器)——縮放后到vit——加一層MLP——加一層position embedding

用到19個(gè)通道

階梯過(guò)濾器;attention機(jī)制(關(guān)注靠后音頻);loss function





【技術(shù)分享】AI數(shù)字人實(shí)時(shí)互動(dòng)直播技術(shù):數(shù)字人口型驅(qū)動(dòng)(算法篇)的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
顺义区| 织金县| 东乡| 凤翔县| 旅游| 类乌齐县| 云浮市| 双流县| 黑龙江省| 邮箱| 江西省| 乌鲁木齐县| 师宗县| 海安县| 玉屏| 潜山县| 文昌市| 阜康市| 柳林县| 湖南省| 望奎县| 平南县| 会东县| 昌邑市| 荔浦县| 绍兴市| 斗六市| 库伦旗| 虎林市| 沾化县| 温州市| 乌拉特后旗| 井冈山市| 广东省| 垦利县| 湖州市| 金华市| 河津市| 阿克苏市| 六安市| 达州市|