73 次代码提交 (46817bed-15ed-4af9-9272-fe50004a2679)

作者 SHA1 备注 提交日期
yanchaosun 46817bed fix bug 4 年前
yanchaosun 8f8ec11b crawler: add time reward 4 年前
yanchaosun dd0ac8a3 mass=2 4 年前
yanchaosun 86830ac9 3dball mass=5 transfer test 4 年前
yanchaosun 2e927257 separate policy net 4 年前
yanchaosun 0463bfe9 smaller state feature, large action feature 4 年前
yanchaosun 96b5478f smaller 4 年前
yanchaosun 4b081de4 smaller feature size 4 年前
yanchaosun c5d9e376 add bi-forward-loss back 4 年前
yanchaosun 3ed56471 remove bi-forward-loss 4 年前
yanchaosun 49d6b70c crawler: max episode length=1000; new config: 1 forward layer 4 年前
yanchaosun ee48cca4 linear v 4 年前
yanchaosun d6f8995a larger feature size 4 年前
yanchaosun 3762358d fix action stop gradient 4 年前
yanchaosun 5ed6bd3e sac crawler 4 年前
yanchaosun 685c4d67 ppo crawler transfer 4 年前
yanchaosun b5e02978 sac crawler config 4 年前
yanchaosun 15b2e80e action encoder 4 年前
yanchaosun fec40537 ppo crawler 4 年前
yanchaosun 09e1f0c4 another fix 4 年前
yanchaosun 990d25e3 fix path again 4 年前
yanchaosun 6b8a6e45 fix path 4 年前
yanchaosun 0646e095 crawler configs 4 年前
yanchaosun 4f64d0f5 new config 4 年前
yanchaosun d694bef9 merge 4 年前
GitHub 7795ce5f increase grav multiplier (#4283) 4 年前
yanchaosun de4870be new configs 4 年前
yanchaosun f1346bdf multiple seeds 4 年前
yanchaosun 6220f7c7 linear model 4 年前
yanchaosun 86da272d load pv 4 年前
yanchaosun 3ce88589 1 layer everything 4 年前
yanchaosun 2d1ffac5 ppo ball 4 年前
yanchaosun f78940c1 less features 4 年前
yanchaosun 120d1c3a cloud config: non-linear policy 4 年前
yanchaosun 66bbdae9 sac crawler configs 4 年前
yanchaosun b40bd941 new 3dball rewards 4 年前
yanchaosun e8fcc4bb ppo new implementation 4 年前
yanchaosun 42c9ba43 reuse encoder and linear 4 年前
yanchaosun 57d3ba64 change path 4 年前
yanchaosun 44312bdb linear policy and linear forward 4 年前
yanchaosun 8c03c82a use target 4 年前
yanchaosun c48b6429 numpy fix, config 3dball 4 年前
yanchaosun aa0e896f linear value, no target 4 年前
yanchaosun 6df774ed update: separate model train as an option 4 年前
yanchaosun 36f36750 target critic for ppo 4 年前
yanchaosun f937aa96 3dball ppo: without var predict 4 年前
yanchaosun d706f28c use off policy buffer to transfer 4 年前
yanchaosun f55fd920 remove transfer from yaml 4 年前
yanchaosun 910707dd PPO 3dball config 4 年前
yanchaosun d1f57dec separate value net config 4 年前