22 次代码提交 (5ba3031a-c0d8-4d94-b22a-447dd0a93a45)

作者 SHA1 备注 提交日期
yanchaosun c2d6f5c0 basic implementation 5 年前
yanchaosun ac4c80c2 integrate the implementation and hyperparameters 5 年前
yanchaosun 1e52ad3d ready for cloud training 5 年前
Andrew Cohen 6979a952 3dball transfers 5 年前
Andrew Cohen 83bc38fd try reuse encoder 5 年前
Andrew Cohen 89abe29d op buffer 5 年前
Andrew Cohen d94b81c0 sep value false 5 年前
yanchaosun 910707dd PPO 3dball config 5 年前
Andrew Cohen 2dc3c84c add forward layer 5 年前
Andrew Cohen 2dec257c no encoder for single task 5 年前
Andrew Cohen 0198e41a 0 fwl 5 年前
yanchaosun f937aa96 3dball ppo: without var predict 5 年前
Andrew Cohen 3513d5a6 load policy/vf 5 年前
yanchaosun 36f36750 target critic for ppo 5 年前
Andrew Cohen 78943972 add l2 penalty 3dball 5 年前
yanchaosun e8fcc4bb ppo new implementation 5 年前
Andrew Cohen ad9e2eea fewer features 5 年前
Andrew Cohen 2cd0de04 action enc 5 年前
Andrew Cohen eace3365 linear 3dball 5 年前
Andrew Cohen 12eda929 try reload all 5 年前
Andrew Cohen 70f05c39 reduce max step 5 年前
yanchaosun b5e02978 sac crawler config 5 年前