最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

67 自注意力【動手學(xué)深度學(xué)習(xí)v2】

2023-09-08 17:12 作者:月蕪SA  | 我要投稿

自注意力原理:

設(shè)輸入的數(shù)據(jù)為n個長為d的序列。自注意力池化層會把每個序列同時看作key、value、query。

實際上就是抽取輸入數(shù)據(jù)內(nèi)部關(guān)系特征

Self-attention與CNN、RNN對比

圖中d為數(shù)據(jù)序列長度,k為卷積核大小,n為序列數(shù)量。

可以看出self-attention對運算能力的要求特別高,這也是為何如今所有基于self-attention的模型都需要很多GPU才能進行運算。

self-attention里的位置信息處理




知識補充:

位置編碼里的位置在實際中指的是Xi的i。












67 自注意力【動手學(xué)深度學(xué)習(xí)v2】的評論 (共 條)

分享到微博請遵守國家法律
固原市| 微博| 萨嘎县| 安塞县| 家居| 万全县| 吴川市| 桐柏县| 怀安县| 会昌县| 大方县| 黔西县| 册亨县| 吴川市| 景东| 射阳县| 新泰市| 若尔盖县| 镇江市| 宣汉县| 南和县| 呼伦贝尔市| 金川县| 道孚县| 化州市| 眉山市| 巴东县| 息烽县| 正安县| 黎城县| 沙湾县| 仪陇县| 荣昌县| 焉耆| 涞水县| 肇东市| 罗定市| 伊吾县| 新沂市| 洪江市| 都兰县|