18 次代码提交 (c5d9e376-3745-49ac-9771-04efd55bdc21)

作者 SHA1 备注 提交日期
yanchaosun 1b86b3ae initialize 5 年前
yanchaosun 3ef4196e Added the algorithm named ppo_transfer 5 年前
yanchaosun c2d6f5c0 basic implementation 4 年前
yanchaosun a9c788d7 new model 4 年前
yanchaosun ac4c80c2 integrate the implementation and hyperparameters 4 年前
yanchaosun 666c8ba9 new cloud training change 4 年前
yanchaosun 59e93b0b transfer config 4 年前
yanchaosun 3d0d359c bisimulation draft 4 年前
yanchaosun 5a778ca3 fix normalization 4 年前
yanchaosun a212fef9 new bisim implementation 4 年前
yanchaosun aca8cd58 update with new alternating 4 年前
yanchaosun 0e2f6e19 small fix 4 年前
Andrew Cohen d0133066 working 4 年前
yanchaosun 9bc90956 fix bug with bisimulation 4 年前
yanchaosun ce36349b some changes 4 年前
Andrew Cohen 1b17ae56 add tanh activ 4 年前
Andrew Cohen 5fa28f5f merge YC changes 4 年前
yanchaosun b5e02978 sac crawler config 4 年前