81 次代码提交 (1ce53c55-8316-4fb0-9f50-8bda0cb36f2b)

作者 SHA1 备注 提交日期
yanchaosun 1ce53c55 discrete action 4 年前
yanchaosun e9a3ea57 reacher self-transfer 4 年前
yanchaosun 4be4f1d1 new reacher env 4 年前
yanchaosun db30f918 push block 4 年前
yanchaosun 4a23dbb3 fix mass 3dball 4 年前
yanchaosun bcdc0a11 f512 4 年前
yanchaosun 82a4914e 1k time reward 0.001 4 年前
yanchaosun b0f6f307 transfer from mass 2 to mass 1 4 年前
yanchaosun 46817bed fix bug 4 年前
yanchaosun 8f8ec11b crawler: add time reward 4 年前
yanchaosun dd0ac8a3 mass=2 4 年前
yanchaosun 86830ac9 3dball mass=5 transfer test 4 年前
yanchaosun 2e927257 separate policy net 4 年前
yanchaosun 0463bfe9 smaller state feature, large action feature 4 年前
yanchaosun 96b5478f smaller 4 年前
yanchaosun 4b081de4 smaller feature size 4 年前
yanchaosun c5d9e376 add bi-forward-loss back 4 年前
yanchaosun 3ed56471 remove bi-forward-loss 4 年前
yanchaosun 49d6b70c crawler: max episode length=1000; new config: 1 forward layer 4 年前
yanchaosun ee48cca4 linear v 4 年前
yanchaosun d6f8995a larger feature size 5 年前
yanchaosun 3762358d fix action stop gradient 5 年前
yanchaosun 5ed6bd3e sac crawler 5 年前
yanchaosun 685c4d67 ppo crawler transfer 5 年前
yanchaosun b5e02978 sac crawler config 5 年前
yanchaosun 15b2e80e action encoder 5 年前
yanchaosun fec40537 ppo crawler 5 年前
yanchaosun 09e1f0c4 another fix 5 年前
yanchaosun 990d25e3 fix path again 5 年前
yanchaosun 6b8a6e45 fix path 5 年前
yanchaosun 0646e095 crawler configs 5 年前
yanchaosun 4f64d0f5 new config 5 年前
yanchaosun d694bef9 merge 5 年前
GitHub 7795ce5f increase grav multiplier (#4283) 5 年前
yanchaosun de4870be new configs 5 年前
yanchaosun f1346bdf multiple seeds 5 年前
yanchaosun 6220f7c7 linear model 5 年前
yanchaosun 86da272d load pv 5 年前
yanchaosun 3ce88589 1 layer everything 5 年前
yanchaosun 2d1ffac5 ppo ball 5 年前
yanchaosun f78940c1 less features 5 年前
yanchaosun 120d1c3a cloud config: non-linear policy 5 年前
yanchaosun 66bbdae9 sac crawler configs 5 年前
yanchaosun b40bd941 new 3dball rewards 5 年前
yanchaosun e8fcc4bb ppo new implementation 5 年前
yanchaosun 42c9ba43 reuse encoder and linear 5 年前
yanchaosun 57d3ba64 change path 5 年前
yanchaosun 44312bdb linear policy and linear forward 5 年前
yanchaosun 8c03c82a use target 5 年前
yanchaosun c48b6429 numpy fix, config 3dball 5 年前