22 次代码提交 (bcdc0a11-20f0-4a0f-ac4f-b11e116ab1c7)

作者 SHA1 备注 提交日期
yanchaosun c2d6f5c0 basic implementation 5 年前
yanchaosun ac4c80c2 integrate the implementation and hyperparameters 5 年前
yanchaosun 1e52ad3d ready for cloud training 5 年前
Andrew Cohen 6979a952 3dball transfers 4 年前
Andrew Cohen 83bc38fd try reuse encoder 4 年前
Andrew Cohen 89abe29d op buffer 4 年前
Andrew Cohen d94b81c0 sep value false 4 年前
yanchaosun 910707dd PPO 3dball config 4 年前
Andrew Cohen 2dc3c84c add forward layer 4 年前
Andrew Cohen 2dec257c no encoder for single task 4 年前
Andrew Cohen 0198e41a 0 fwl 4 年前
yanchaosun f937aa96 3dball ppo: without var predict 4 年前
Andrew Cohen 3513d5a6 load policy/vf 4 年前
yanchaosun 36f36750 target critic for ppo 4 年前
Andrew Cohen 78943972 add l2 penalty 3dball 4 年前
yanchaosun e8fcc4bb ppo new implementation 4 年前
Andrew Cohen ad9e2eea fewer features 4 年前
Andrew Cohen 2cd0de04 action enc 4 年前
Andrew Cohen eace3365 linear 3dball 4 年前
Andrew Cohen 12eda929 try reload all 4 年前
Andrew Cohen 70f05c39 reduce max step 4 年前
yanchaosun b5e02978 sac crawler config 4 年前