Talk預(yù)告 | UCSD在讀博士孔之豐: DiffWave基礎(chǔ), 生成模型介紹
本周為TechBeat人工智能社區(qū)第306期線上Talk。
北京時(shí)間5月19日(周三)晚8點(diǎn),加州大學(xué)圣地亞哥分校在讀博士—孔之豐的Talk將準(zhǔn)時(shí)在TechBeat人工智能社區(qū)開(kāi)播!
他與大家分享的主題是: “DiffWave基礎(chǔ)——生成模型介紹”,DiffWave是一類能實(shí)現(xiàn)多種語(yǔ)音任務(wù)的音頻生成模型,其結(jié)合了多種前沿生成模型,包括降噪擴(kuò)散概率模型(DDPM)以及WaveNet。
為了幫助大家更好地理解工作,本期Talk將介紹相關(guān)生成模型的基礎(chǔ),對(duì)生成模型進(jìn)行簡(jiǎn)短的綜述,并詳細(xì)介紹DDPM和WaveNet兩類模型,5月27日的Talk將詳細(xì)講解ICLR 2021 (Oral)?的相關(guān)paper。

Talk·信息
▼
主題:DiffWave基礎(chǔ)——生成模型介紹
嘉賓:加州大學(xué)圣地亞哥分校
在讀博士生 孔之豐
時(shí)間:北京時(shí)間?5月19日 (周三) 20:00
地點(diǎn):TechBeat人工智能社區(qū)
http://www.techbeat.net/
完整版怎么看?
掃描下方二維碼,或復(fù)制鏈接 https://datayi.cn/w/kojk3wQ9 至瀏覽器,一鍵完成預(yù)約!上線后會(huì)在第一時(shí)間收到通知哦~

Talk·提綱
▼
無(wú)監(jiān)督生成模型在圖像,語(yǔ)音,文本,3D以及細(xì)分專業(yè)領(lǐng)域的應(yīng)用十分廣泛?,F(xiàn)有的多種方法在復(fù)雜龐大的數(shù)據(jù)集,如高分辨率圖像或高質(zhì)量語(yǔ)音的生成效果還有進(jìn)一步提高的空間。除此之外,針對(duì)不同的數(shù)據(jù)類型需要設(shè)計(jì)特定的模型以及網(wǎng)絡(luò)結(jié)構(gòu)。
講者將會(huì)通過(guò)兩場(chǎng)Talk進(jìn)行詳細(xì)講解,第一場(chǎng)(5月19日)以背景介紹為重點(diǎn),第二場(chǎng)(5月27日)將以ICLR?2021的相關(guān)paper講解為重點(diǎn)。
本次分享的主要內(nèi)容如下:
1. 主流的生成模型簡(jiǎn)介
2. 降噪擴(kuò)散概率模型(詳細(xì)介紹,包括算法、實(shí)驗(yàn)、理論,以及與其它模型的關(guān)聯(lián))
3. 語(yǔ)音領(lǐng)域的生成模型——WaveNet簡(jiǎn)介
Talk·參考資料
▼
這是本次分享中將會(huì)提及的資料,建議提前預(yù)習(xí)哦!
[1] DDPM 1:?https://arxiv.org/pdf/1503.03585.pdf
[2]?DDPM2:?https://arxiv.org/pdf/2006.11239.pdf[
3]?WaveNet:?https://arxiv.org/pdf/1609.03499.pdf
[4]?DiffWave:? ?https://arxiv.org/pdf/2009.09761.pdf?
[5] Others (background):
How to Train Your Energy-Based Models
?? ? ?? https://arxiv.org/pdf/1906.02691.pdf;
Generating Diverse High-Fidelity Images with VQ-VAE-2
? ? ? ?https://arxiv.org/pdf/1906.00446.pdf;
PIXELCNN++: Improving?The?PlxelcnnI?With?Discretized?Logistic?Mixture?Likelihood And?Other?Modifications
? ? ? ?https://openreview.net/pdf?id=BJrFC6ceg;
U-Net: Convolutional Networks for Biomedical Image Segmentation
? ? ? ?https://arxiv.org/pdf/1505.04597.pdf;?
On Maximum Likelihood Training of Score-Based Generative Models
? ? ? ?https://arxiv.org/pdf/2101.09258.pdf;
Flow-based Deep Generative Models
? ? ? ??https://lilianweng.github.io/lil-log/2018/10/13/flow-based-deep-generative-models.html;
From Autoencoder to Beta-VAE
? ? ??? https://lilianweng.github.io/lil-log/2018/08/12/from-autoencoder-to-beta-vae.html;
WaveNet: A generative model for raw audio
? ? ? ?https://deepmind.com/blog/article/wavenet-generative-model-raw-audio
Talk·提問(wèn)交流
▼
通過(guò)以下兩種方式提問(wèn)都將獲得微信現(xiàn)金紅包獎(jiǎng)勵(lì)哦!
方式 ①
在Talk界面下的【交流區(qū)】參與互動(dòng)!留下你的打call??和問(wèn)題??,和更多小伙伴們共同討論,被講者直接翻牌解答!

你的每一次貢獻(xiàn),我們都會(huì)給予你相應(yīng)的i豆積分,還會(huì)有驚喜獎(jiǎng)勵(lì)哦!
方式 ②
在本文留言區(qū)直接提出你的問(wèn)題,或掃描下方二維碼提問(wèn)!

Talk·嘉賓介紹
▼

UCSD在讀博士
孔之豐,本科畢業(yè)于西安交通大學(xué)數(shù)學(xué)系,現(xiàn)在是加州大學(xué)圣地亞哥分校計(jì)算機(jī)科學(xué)的三年級(jí)博士生,導(dǎo)師是Kamalika Chaudhuri, 主要的研究方向?yàn)樯赡P偷睦碚?,理解與應(yīng)用。在ICLR, AISTATS, AAAI等會(huì)議發(fā)表論文,獲得百度美國(guó)研究院和英偉達(dá)深度學(xué)習(xí)研究院的研究實(shí)習(xí)。
關(guān)于TechBeat人工智能社區(qū)
▼
TechBeat(www.techbeat.net)是一個(gè)薈聚全球華人AI精英的成長(zhǎng)社區(qū)。我們希望為AI人才打造更專業(yè)的服務(wù)和體驗(yàn),加速并陪伴其學(xué)習(xí)成長(zhǎng)。期待這里可以成為你學(xué)習(xí)AI前沿知識(shí)的高地,分享自己最新工作的沃土,在AI進(jìn)階之路上的升級(jí)打怪的根據(jù)地!
更多詳細(xì)介紹>>https://mp.weixin.qq.com/s/pTbCK_MeTk05jK2yx1RTrQ