【PPO × Family】第三課:表征多模態(tài)觀察空間

第三節(jié)課筆記
hh跟著這個系列課程學(xué)了一段時間,感覺挺實(shí)用的。看下來第三節(jié)課內(nèi)容以下這張截圖就可以說明了:

另外聽課過程中老師提到了很多鏈接,我也去扒了一下,大家有需要自取呀!
13:30 Scatter實(shí)現(xiàn) 以及完整示例:
?https://github.com/rusty1s/pytorch_scatter
https://opendilab.github.io/PPOxFamily/
15:52 PPO+軟體機(jī)器人的完整視頻樣例與相應(yīng)的訓(xùn)練日志:
https://github.com/opendilab/PPOxFamily/issues/8
19:01 關(guān)于 CAM 可視化工具相關(guān)的更多的材料,請參考:
https://github.com/frgfm/torch-cam
25:11 巧用 Env Wrapper 包裝你的環(huán)境
?https://opendilab.github.io/PPOxFamily/
30:46 DI-sheep 詳細(xì)的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計和代碼:
https://github.com/opendilab/DI-sheep
34:53 PPO+羊了個羊的演示細(xì)節(jié)和視頻demo請參考:
實(shí)驗(yàn)細(xì)節(jié):https://github.com/opendilab/PPOxFamily/issues/8
科普文章:https://mp.weixin.qq.com/s/4Z3WtkcWRp6x4x60RVELfQ
36:02 一些輔助方法的優(yōu)劣勢對比,可以參考:
SSL:https://openreview.net/forum?id=fVslVNBfjd8
觀察空間表征學(xué)習(xí)補(bǔ)充材料:https://github.com/opendilab/PPOxFamily/blob/main/chapter3_obs/chapter3_supp_representation.pdf
38:56 完整的 PPG 算法原理講解:
?https://arxiv.org/pdf/2009.04416.pdf
https://github.com/opendilab/PPOxFamily/blob/main/chapter3_obs/chapter3_supp_ppg.pdf
41:23 神經(jīng)網(wǎng)絡(luò)訓(xùn)練中一系列操作指引:
Autograd: https://pytorch.org/tutorials/beginner/introyt/autogradyt_tutorial.html
完整代碼示例:https://opendilab.github.io/PPOxFamily/