最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

融合主題模型和動態(tài)路由的小樣本學(xué)習(xí)方法 [下]

2022-08-19 10:11 作者:執(zhí)念殘生輪回  | 我要投稿


??? ? ? 提取源集中單詞通用性特征有

????????R%5Cleft(x_%7Bi%7D%5E%7Bw%7D%5Cright)%3D%5Cfrac%7B%5Cmu%7D%7BP%5Cleft(x_%7Bi%7D%5E%7Bw%7D%5Cright)%2B%5Cmu%7D? ? ? (5)

式中:x_%7Bi%7D%5E%7Bw%7D表示第i個樣本中的第%5Cmu個詞;i為平滑系數(shù);P(%5Cbullet)表示詞頻。R%5Cleft(x_%7Bi%7D%5E%7Bw%7D%5Cright)降低源集高頻詞的權(quán)重,獲得x_%7Bi%7D%5E%7Bw%7D在通用類中的重要性。則%5Cboldsymbol%7BR%7D表示為

%5Cboldsymbol%7BR%7D%3D%5Cleft%5C%7B%5Cbegin%7Barray%7D%7Bc%7D%0A%5Cleft%5C%7BR%5Cleft(x_%7Bi%7D%5E%7B1%7D%5Cright)%5Cright%5C%7D%5E%7BC%7D%20%5C%5C%0A%5Cleft%5C%7BR%5Cleft(x_%7Bi%7D%5E%7B2%7D%5Cright)%5Cright%5C%7D%5E%7BC%7D%20%5C%5C%0A%5Cvdots%20%5C%5C%0A%5Cleft%5C%7BR%5Cleft(x_%7Bi%7D%5E%7Bl%7D%5Cright)%5Cright%5C%7D%5E%7BC%7D%0A%5Cend%7Barray%7D%5Cright%5C%7D%5E%7Bl%20%5Ctimes%20C%7D

1.3?DR?Proto網(wǎng)絡(luò)

????????基于SLDA的Encoder,提出動態(tài)路由原型網(wǎng)絡(luò)DR?Proto。利用支持集和查詢集的樣本語義交叉特征獲得原型,使分類邊界更清晰。DR?Proto網(wǎng)絡(luò)如圖5所示,

圖5 DR?Proto網(wǎng)絡(luò)架構(gòu)

即圖2所示DRP?SLDA模型框架中的DR?Proto?network。圖5中,DR?Proto網(wǎng)絡(luò)提取支持集和查詢集的樣本交叉特征?%5Cpsi_%7Bi%7D%5E%7Bj%7D,通過動態(tài)路由算法調(diào)整耦合系數(shù)m_%7Bg%7D%5E%7Bi%2C%20j%7D,更新樣本權(quán)重%5Ceta_%7Bg%7D%5E%7Bi%2C%20j%7D,多次迭代獲得動態(tài)原型?%5Cboldsymbol%7BC%7D%5E%7Bj%7D。通過特征共享變換將Encoder的x_%7Bi%7D%5E%7Bj%7Dx_%7Bq%7D映射到同一空間,有

%5Ctilde%7Bx%7D_%7Bi%7D%5E%7Bj%7D%3D%5Coperatorname%7BSquash%7D%5Cleft(%5Cboldsymbol%7BW%7D_%7B%5Cmathrm%7Bs%7D%7D%20%5Ccdot%20%5Cboldsymbol%7Bx%7D_%7Bi%7D%5E%7Bj%7D%2B%5Cboldsymbol%7Bb%7D_%7B%5Cmathrm%7Bs%7D%7D%5Cright)? ? ? (9)

%5Ctilde%7Bx%7D_%7Bq%7D%3D%5Coperatorname%7BSquash%7D%5Cleft(%5Cboldsymbol%7BW%7D_%7B%5Cmathrm%7Bs%7D%7D%20%5Ccdot%20%5Cboldsymbol%7Bx%7D_%7Bq%7D%2B%5Cboldsymbol%7Bb%7D_%7B%5Cmathrm%7Bs%7D%7D%5Cright)? ? ? (10)

式中:%5Cboldsymbol%7Bx%7D_%7Bi%7D%5E%7Bj%7D%20%5Cin%20%5Cmathbf%7BR%7D%5E%7Bl%20%5Ctimes%201%7D為支持集類j的第i個樣本;x_%7Bq%7D%20%5Cin%20%5Cmathbf%7BR%7D%5E%7Bl%20%5Ctimes%201%7D為查詢集第q個樣本;%5Cboldsymbol%7BW%7D_%7B%5Cmathrm%7Bs%7D%7D%20%5Cin%20%5Cmathrm%7BR%7D%5E%7Bl%20%5Ctimes%20l%7D%2C%20%5Cboldsymbol%7Bb%7D_%7B%5Cmathrm%7Bs%7D%7D%20%5Cin%20%5Cmathrm%7BR%7D%5E%7Bl%7D為共享參數(shù)。通過特征映射使?%5Ctilde%7B%5Cboldsymbol%7Bx%7D%7D_%7Bi%7D%5E%7Bj%7D%E3%80%81%5Ctilde%7B%5Cboldsymbol%7Bx%7D%7D_%7Bq%7D%20%5Cin%20%5Cmathbf%7BR%7D%5E%7Bl%20%5Ctimes%201%7D距 離 盡 可 能 近 ,i%20%5Cin%5B1%2C%20K%5D%2C%20j%20%5Cin%5B1%2C%20C%5D%2C%20q%20%5Cin%5B1%2C%20h%5D。%5Coperatorname%7BSquash%7D(%5Cbullet)使向量x方向不變且大小取值范圍[0,1),即

%5Coperatorname%7BSquash%7D(x)%3D%5Cfrac%7B%5C%7Cx%5C%7C%5E%7B2%7D%7D%7B1%2B%5C%7Cx%5C%7C%5E%7B2%7D%7D%20%5Cfrac%7Bx%7D%7B%5C%7Cx%5C%7C%7D? ? ? (11)

????????考慮支持集和查詢集滿足獨立同分布,通過提取交叉特征%5Cboldsymbol%5Cpsi_%7Bi%7D%5E%7Bj%7D以利用文本語義關(guān)系,有

%5Cboldsymbol%7B%5Cpsi%7D_%7Bi%7D%5E%7Bj%7D%3D%5Ctilde%7B%5Cboldsymbol%7Bx%7D%7D_%7Bi%7D%5E%7Bj%7D%20%5Codot%20%5Ctilde%7B%5Cboldsymbol%7Bx%7D%7D_%7Bq%7D%2B%5Cleft%7C%5Ctilde%7B%5Cboldsymbol%7Bx%7D%7D_%7Bi%7D%5E%7Bj%7D-%5Ctilde%7B%5Cboldsymbol%7Bx%7D%7D_%7Bq%7D%5Cright%7C? ? ??(12)

式中:%5Codot%20為元素積;%20%5Cmid%5Cbullet%5Cmid表示取絕對值。若%5Ctilde%7B%5Cboldsymbol%7Bx%7D%7D_%7Bi%7D%5E%7Bj%7D%5Ctilde%7B%5Cboldsymbol%7Bx%7D%7D_%7Bq%7D%20屬于同類,樣本間的距離近,則交叉特征多;否則,樣本間的距離遠(yuǎn),則交叉特征少。通過交叉特征%5Cboldsymbol%7B%5Cpsi%7D_%7Bi%7D%5E%7Bj%7D%20%5Cin%20%5Cmathbf%7BR%7D%5E%7Bl%20%5Ctimes%201%7D,使樣本特征相應(yīng)增強或弱化。

????????計算權(quán)重%5Cboldsymbol%7B%5Ceta%7D_%7Bg%7D%5E%7Bj%7D,獲得不同樣本對原型的重要性,即有

%5Cboldsymbol%7B%5Ceta%7D_%7Bg%7D%5E%7Bj%7D%3D%5Coperatorname%7Bsoftmax%7D%5Cleft(%5Cboldsymbol%7Bm%7D_%7Bg%7D%5E%7Bj%7D%5Cright)? ? ? (13)

式中耦合系數(shù)%5Cboldsymbol%7Bm%7D_%7Bg%7D%5E%7Bj%7D%20%5Cin%20%5Cmathbf%7BR%7D%5E%7B1%20%5Ctimes%20K%7D為先驗知識,g%3D1%2C%20%5Ccdots%2C%20G為動態(tài)路由迭代次數(shù)。每個樣本訓(xùn)練之前等概率影響原型,從而初始化%5Cboldsymbol%7Bm%7D_%7Bi%7D%5E%7Bg%7D%3D0使%5Cboldsymbol%7B%5Ceta%7D_%7Bg%7D%5E%7Bj%7D%20%5Cin%20%5Cmathbf%7BR%7D%5E%7B1%20%5Ctimes%20K%7D均勻分布。

????????根據(jù)權(quán)重計算每類的原型,有

%5Cboldsymbol%7BC%7D%5E%7Bj%7D%3D%5Coperatorname%7BSquash%7D%5Cleft(%5Csum_%7Bi%3D1%7D%5E%7BK%7D%5Cleft(%5Ceta_%7Bg%7D%5E%7Bi%2C%20j%7D%20%5Ccdot%20%5Cboldsymbol%7B%5Cpsi%7D_%7Bi%7D%5E%7Bj%7D%5Cright)%5Cright)? ? ? (14)

式中:%7B%5Ceta%7D_%7Bg%7D%5E%7Bj%7D為第g次迭代時類ji個樣本的權(quán)重;K為每個類別的樣本個數(shù)。%5Cboldsymbol%5Cpsi_%7Bi%7D%5E%7Bj%7D為交叉特征計算如式 (12),得到類j的原型?%5Cboldsymbol%7BC%7D%5E%7Bj%7D%20%5Cin%20%5Cmathbf%7BR%7D%5E%7Bl%5Ctimes1%7D。

????????為了增大同類樣本相關(guān)性而降低不同類相關(guān)性,自上而下調(diào)整耦合系數(shù),有

m_%7Bg%2B1%7D%5E%7Bj%2C%20i%7D%3Dm_%7Bg%7D%5E%7Bj%2C%20i%7D%2B%5Cleft(%5Ctilde%7B%5Cboldsymbol%7Bx%7D%7D_%7Bi%7D%5E%7Bj%7D%5Cright)%5E%7B%5Cmathrm%7BT%7D%7D%20%5Ccdot%20%5Cboldsymbol%7BC%7D%5E%7Bj%7D? ? ? (15)

式中:若?%5Ctilde%7Bx%7D_%7Bi%7D%5E%7Bj%7D屬于原型?%5Cboldsymbol%7BC%7D%5E%7Bj%7D%2C%5Cleft(%5Ctilde%7B%5Cboldsymbol%7Bx%7D%7D_%7Bi%7D%5E%7Bj%7D%5Cright)%5E%7B%5Cmathrm%7BT%7D%7D%20%5Ccdot%20%5Cboldsymbol%7BC%7D%5E%7Bj%7D則增大耦合系數(shù),增強該樣本對原型的影響;若?%5Ctilde%7Bx%7D_%7Bi%7D%5E%7Bj%7D不屬于原型??%5Cboldsymbol%7BC%7D%5E%7Bj%7D,?%5Cboldsymbol%7BC%7D%5E%7Bj%7D則減小耦合系數(shù),使該樣本的影響邊緣化。

????????由融合動態(tài)路由算法的式(12~?15)可知,利用語義關(guān)聯(lián)的支持集和查詢集提取交叉特征%5Cboldsymbol%5Cpsi_%7Bi%7D%5E%7Bj%7D,進(jìn)而采用權(quán)重機制獲得動態(tài)原型%5Cboldsymbol%7BC%7D%5E%7Bj%7D。DR?Proto網(wǎng)絡(luò)通過為樣本特征賦予權(quán)重獲得動態(tài)原型,從而改進(jìn)均值原型有效提取類別特征。

1. 4 分類預(yù)測?

????????樣本x_%7Bq%7D與第j類原型的相似度計算采用歐氏距離,有

d%5Cleft(%5Cboldsymbol%7Bx%7D_%7Bq%7D%2C%20%5Cboldsymbol%7BC%7D%5E%7Bj%7D%5Cright)%3D%5Csum_%7Bw%3D1%7D%5E%7Bl%7D%5Cleft(C_%7Bw%7D%5E%7Bj%7D-x_%7Bq%7D%5E%7Bw%7D%5Cright)%5E%7B2%7D? ? ? (16)

????? ?對樣本x_%7Bq%7D的類別預(yù)測,有

p%5Cleft(%5Chat%7By%7D_%7Bj%2C%20q%7D%20%5Cmid%20%5Cboldsymbol%7Bx%7D_%7Bq%7D%5Cright)%3D%5Cfrac%7B%5Cexp%20%5Cleft(-d%5Cleft(%5Cboldsymbol%7Bx%7D_%7Bq%7D%2C%20%5Cboldsymbol%7BC%7D%5E%7Bj%7D%5Cright)%5Cright)%7D%7B%5Csum_%7Bj%3D1%7D%5E%7BC%7D%20%5Cexp%20%5Cleft(-d%5Cleft(%5Cboldsymbol%7Bx%7D_%7Bq%7D%2C%20%5Cboldsymbol%7BC%7D%5E%7Bj%7D%5Cright)%5Cright)%7D? ? ? (17)

式中:d%5Cleft(x_%7Bq%7D%2C%20C%5E%7Bj%7D%5Cright)表示樣本x_%7Bq%7D與第j類原型的歐氏距離;%5Chat%7By%7D_%7Bj%2C%20q%7D%20表示x_%7Bq%7D預(yù)測為類別j的概率。w%20%5Cin%5B1%2C%20l%5D%2C%20j%20%5Cin%5B1%2C%20C%5D。

????????采用均方誤差損失(Mean squared error,MSE)優(yōu)化參數(shù),有

%5Coperatorname%7BMSE%7D(y%2C%20%5Chat%7By%7D)%3D%5Cfrac%7B1%7D%7Bh%7D%20%5Csum_%7Bj%3D1%7D%5E%7BC%7D%20%5Csum_%7Bq%3D1%7D%5E%7Bh%7D%5Cleft(y_%7Bq%7D-%5Chat%7By%7D_%7Bj%2C%20q%7D%5Cright)%5E%7B2%7D? ? ? (18)

式中:y_%7Bq%7D表示查詢集x_%7Bq%7D的真實標(biāo)簽one?hot編碼值;h表示查詢集樣本數(shù)。

2 實驗分析

2.?1?實驗數(shù)據(jù)集

????????為驗證模型有效性,利用20newsgroup英文數(shù)據(jù)集、FewRel關(guān)系數(shù)據(jù)集和Sogou中文數(shù)據(jù)集,采樣支持集和查詢集,構(gòu)建C?way?K?shot分類任務(wù)進(jìn)行對比實驗,數(shù)據(jù)集描述如表1所示。

2.2?實驗結(jié)果及分析

2.2.1 對比實驗結(jié)果及分析

????????對比模型有:(1)Finetune:有監(jiān)督的線性微調(diào)分類器。(2)1?nearest neighbor classifier:有監(jiān)督的最近鄰分類器。(3)Prototypical network:每類支持集樣本的均值特征向量作為類原型的原型網(wǎng)絡(luò)。(4)MAML(Model?agnostic meta?learning):通過梯度求和優(yōu)化不同子任務(wù)初始化參數(shù)的元學(xué)習(xí)模型。(5)RR?D2_LR?D2:采用嶺回歸和邏輯回歸的元學(xué)習(xí)模型。(6)Distributional signatures:將詞匯特征映射成注意力分?jǐn)?shù)衡量文本表示,并使用嶺回歸器分類預(yù)測的元學(xué)習(xí)模型。

????????DRP?SLDA模型與上述6種模型在FewRel和20newsgroup數(shù)據(jù)集上的分類結(jié)果比較如表2所示。

????????由表2可知,相比有監(jiān)督學(xué)習(xí)的 Finetune模型和1?nearest neighbor模型,元學(xué)習(xí)的模型整體效果表現(xiàn)良好。Prototypical networks模型使用歐式距離度量映射空間內(nèi)查詢集與原型之間的距離預(yù)測分類;MAML模型放棄距離度量方式,通過在多個子任務(wù)中使用梯度下降法訓(xùn)練初始參數(shù),微調(diào)參數(shù)以計算不同子任務(wù)的損失快速收斂模型,其在FewRel數(shù)據(jù)集上的準(zhǔn)確率分別是 48.2%、65.8% 。然而,MAML模型缺乏針對各任務(wù)的分析。為此,RR?D2_LR?D2模型對不同任務(wù)生成先驗知識,以可微分回歸作為基分類器。Distributional signatures模型在 RR?D2_LR?D2模型的基礎(chǔ)上,將詞分布特征轉(zhuǎn)成注 意力分?jǐn)?shù),用嶺回歸分類預(yù)測,在兩種數(shù)據(jù)集上,兩種小樣本分類任務(wù)的準(zhǔn)確率都得以提高,如20newsgroup數(shù)據(jù)集上分別提高7.3%、4.0%。

????????DRP?SLDA模型對比模型(1~ 5)在20newsgroup數(shù)據(jù)集上準(zhǔn)確率提升10%~30%,表 明DRP?SLDA 模型引入源集是有效的,能從不同角度提取詞匯特征。DRP?SLDA 模型相較于 Distribu?tional signatures模型在 20newsgroup數(shù)據(jù)集上準(zhǔn)確率分別提高8.6% 、16.6% 。原因在于Distributional signatures模型僅考慮詞匯特征沒有考慮樣本權(quán)重對分類的影響,而 DRP?SLDA 模型利用 SLDA 模型增強詞分布特征且DR?Proto網(wǎng)絡(luò)為樣本賦予權(quán)重獲得動態(tài)原型。

2.2.2?DRP?SLDA 模型消融分析

????????消融方法簡介:(1)DRP?SLDA:本文提出的小樣本分類模型。(2)DRP?SLDA_NR:消融DRP?SLDA模型中源集在數(shù)據(jù)擴充上的影響。(3)DRP?SLDA_NS:消融DRP?SLDA模型中SLDA主題模型對詞分布特征的影響。(4)DRP?SLDA_ND:消融DRP?SLDA模型中交叉特征%5Cpsi的影響。(5)DRP?SLDA_NDR:消融DRP?SLDA模型中源集數(shù)據(jù)擴充和交叉特征%5Cpsi的共同影響。(6)DRP?SLDA_NDS:消融DRP?SLDA模型中SLDA主題模型和交叉特征%5Cpsi的共同影響。

圖6 Sogou數(shù)據(jù)集在3?way 1?shot下消融方法分類結(jié)果
圖7 20newsgroup數(shù)據(jù)集在5?way 5?shot下消融方法分類結(jié)果

????????如圖6所示,在Sogou數(shù)據(jù)集上對于3?way1?shot分類任務(wù)各消融方法結(jié)果,可以看出:(1)DRP?SLDA對比DRP?SLDA_NR方法,各分類指標(biāo)提高0.39%、0.39%和0.40%,表明源集通用性特征表示的有效性,引入源集對模型有積極影響。(2)DRP?SLDA對比DRP?SLDA_NS方法,各分類指標(biāo)提升1.02%、0.57%和0.94%,表明利用SLDA模型能有效增強詞分布特征。(3)DRP?SLDA對比DRP?SLDA_ND方法,各分類指標(biāo)提升0.81%、0.95%和0.91%,表明利用支持集和查詢集樣本,能提取語義增強的交叉特征%5Cpsi。

????????如圖7所示,在20newsgroup數(shù)據(jù)集上對于5?way5?shot任務(wù)各消融方法結(jié)果,可以看出:對比DRP?SLDA_NDR方法,DRP?SLDA方法各分類指標(biāo)降低3.06%、4.56%和4.40%;對比DRP?SLDA_NDS方法,DRP?SLDA方法各分類指標(biāo)降低3.86%、4.82%和4.68%。表明在沒有獲取樣本交叉特征時,SLDA模型提取的特定類詞匯特征有助于提升DRP?SLDA模型泛化性能,而源集通過擴充數(shù)據(jù)樣本提取詞匯通用性特征對模型效果微效。

????????圖8是對20newsgroup數(shù)據(jù)集的樣本分布PCA降維,將樣本映射到二維空間,可視化各消融方法的影響。圖8(a)中3個聚類分簇顯著,分類邊界明顯優(yōu)于其他方法,說明DRP?SLDA模型生成具有類別區(qū)分性的樣本表示。

圖8 消融方法在20newsgroup數(shù)據(jù)集的PCA可視化比較

2.?2.?3?動態(tài)路由算法的有效性分析

????????為了驗證DR?Proto網(wǎng)絡(luò)中動態(tài)路由算法對DRP?SLDA模型分類效果的影響,在FewRel數(shù)據(jù)集上進(jìn)行5?way實驗,動態(tài)路由算法的隨不同迭代次數(shù)的可視化如圖9所示,展示在FewRel數(shù)據(jù)集上提取樣本交叉特征%5Cpsi可視化結(jié)果。由圖可知,隨著迭代次數(shù)的增加,模型的分類邊界清晰。表明DRP?SLDA模型通過動態(tài)路由算法的多次迭代,能夠有效提取樣本交叉特征,動態(tài)獲得使類別邊界更清晰的原型。綜上所述,所提出的DRP?SLDA模型能有效增強小樣本文本分類的特征表示,提升原型的類別辨識力。

圖9 不同動態(tài)路由迭代次數(shù)的樣本(特征)可視化結(jié)果

3 結(jié)束語

????????本文提出一種基于SLDA和動態(tài)路由的原型網(wǎng)絡(luò)模型DRP?SLDA,利用SLDA模型獲得詞匯?類別的語義映射增強詞的分布特征,結(jié)合動態(tài)路由算法更新樣本權(quán)重為不同樣本賦予權(quán)重獲得動態(tài)原型,從而有效提升模型的泛化性能。在多個數(shù)據(jù)集上的對比實驗表明了DRP?SLDA模型的有效性。下一步將對多標(biāo)簽小樣本元學(xué)習(xí)方法展開研究。

融合主題模型和動態(tài)路由的小樣本學(xué)習(xí)方法 [下]的評論 (共 條)

分享到微博請遵守國家法律
阳高县| 永泰县| 姚安县| 汉源县| 区。| 都江堰市| 彝良县| 平塘县| 南开区| 五家渠市| 巴里| 休宁县| 玉环县| 锡林浩特市| 舒城县| 北辰区| 萨嘎县| 衡阳县| 都匀市| 武城县| 武穴市| 贺州市| 丁青县| 日照市| 谷城县| 会理县| 乌拉特前旗| 西乡县| 桓台县| 呼图壁县| 惠安县| 青冈县| 望谟县| 柘荣县| 琼中| 青阳县| 五指山市| 海丰县| 岳西县| 和平县| 遂溪县|