一個簡單的RNN網(wǎng)絡(luò)實現(xiàn)(基于Pytorch)
"""
B站up劉二大人12課的RNN實現(xiàn)
創(chuàng)建一個模型,輸入abandon,輸出hedarko
編碼采用one-hot
模型采用雙向RNN
超參數(shù)設(shè)置:lr = 0.01, momentum = 0.5, 兩個RNN均為單層結(jié)構(gòu)
"""
后話:一開始使用單向RNN進(jìn)行訓(xùn)練,發(fā)現(xiàn)323輪后可以輸出正確答案,但是最后的輪次都是第一個字母預(yù)測不對,遂嘗試雙向RNN,在139輪即可輸出正確答案。我推測對于第一個字母的預(yù)測,單向的RNN缺乏先驗知識,因此預(yù)測比較困難。
標(biāo)簽: