最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

貪心自然語言處理高級(jí)魔鬼訓(xùn)練營

2023-08-18 15:39 作者:每天2個(gè)拼課技巧  | 我要投稿

首先介紹CBOW模型,它是一個(gè)三層神經(jīng)網(wǎng)絡(luò),通過上下文預(yù)測(cè)中心詞。以某個(gè)訓(xùn)練數(shù)據(jù)"I drink apple juice"為例,可以把a(bǔ)pple作為標(biāo)簽值先剔除,將"I drink juice"作為輸入,apple作為待預(yù)測(cè)的中心詞。


輸入層: x_i 是上下文中第i個(gè)單詞的one-hot向量,長度為 V 。比如在訓(xùn)練數(shù)據(jù)I drink _ juice中,x_2就是詞"drink"的one-hot向量。V是詞庫中詞的總數(shù),C是上下文中詞的個(gè)數(shù),k是訓(xùn)練集的大小。


隱藏層:輸入層x_i乘上W_{V \times N}求和即得到隱藏層,公式為\sum_{i=1}^C x_i \times W_{V \times N}。其中,W_{V \times N}是一個(gè)二維矩陣,V是詞的總數(shù),N代表著詞的特征向量,長度可自定義。這個(gè)矩陣的每一行即可看作每個(gè)詞對(duì)應(yīng)的特征向量,而x_i \times W_{V \times N}就相當(dāng)于取第i個(gè)詞對(duì)應(yīng)的特征向量。隱藏層沒有激活函數(shù),最后輸出是一個(gè)1 \times N的向量。


輸出層:輸出層是中心詞的預(yù)測(cè)值,一個(gè)1 \times V的向量。它由隱藏層輸出乘上 W_{N \times V}' ,并通過softmax激活函數(shù)得到,向量中每個(gè)位置的值相當(dāng)于對(duì)應(yīng)詞的概率。中心詞預(yù)測(cè)值會(huì)與實(shí)際值比較,并通過損失函數(shù)計(jì)算出損失值,再求出梯度值反向傳播,最終更新 W_{V \times N} 和 W_{N \times V}' 的值。


貪心自然語言處理高級(jí)魔鬼訓(xùn)練營的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
吐鲁番市| 吉安县| 汽车| 福安市| 宁波市| 嫩江县| 富裕县| 临澧县| 湖南省| 平和县| 肃南| 重庆市| 北京市| 景泰县| 团风县| 厦门市| 尤溪县| 望江县| 长泰县| 双江| 手机| 四子王旗| 清水县| 荣成市| 新乐市| 博罗县| 遂平县| 蒙阴县| 台北市| 澜沧| 大埔区| 兴义市| 华安县| 越西县| 襄城县| 中宁县| 高淳县| 宁远县| 玉树县| 绥芬河市| 宁陵县|