小象學(xué)院金融反欺詐項(xiàng)目實(shí)戰(zhàn)課
2023-03-26 14:36 作者:貧道道號(hào)鴻鈞 | 我要投稿
卷積核中的因子(×1或×0)其實(shí)就是需要學(xué)習(xí)的參數(shù),也就是卷積核矩陣元素的值就是參數(shù)值。一個(gè)特征如果有9個(gè)值,1000個(gè)特征就有900個(gè)值,再加上多個(gè)層,需要學(xué)習(xí)的參數(shù)還是比較多的。
對(duì)卡在局部極小值的處理方法:
1. 調(diào)節(jié)步伐:調(diào)節(jié)學(xué)習(xí)速率,使每一次的更新“步伐”不同;
2. 優(yōu)化起點(diǎn):合理初始化權(quán)重(weights initialization)、預(yù)訓(xùn)練網(wǎng)絡(luò)(pre-train),使網(wǎng)絡(luò)獲得一個(gè)較好的“起始點(diǎn)”,如最右側(cè)的起始點(diǎn)就比最左側(cè)的起始點(diǎn)要好。常用方法有:高斯分布初始權(quán)重(Gaussian distribution)、均勻分布初始權(quán)重(Uniform distribution)、Glorot 初始權(quán)重、He初始權(quán)、稀疏矩陣初始權(quán)重(sparse matrix)。
標(biāo)簽: