110 次代码提交 (1a9aaaf6-d931-4f1c-b964-74f6c06b566e)

作者 SHA1 备注 提交日期
yanchaosun 1a9aaaf6 model weights and large transfer learning weight 4 年前
yanchaosun 693c0ca4 feature size 32 4 年前
yanchaosun b33fd569 cancel large model lr 4 年前
yanchaosun ecef019c fix 4 年前
yanchaosun 63cec035 fix config 4 年前
yanchaosun 68544337 lift pink balls to another level 4 年前
yanchaosun 716336bf larger feature size 4 年前
yanchaosun f15a4f2d 2 layers 4 年前
yanchaosun 92c3facf distance based penalty 4 年前
yanchaosun 85549b2b reacher: stack observation. with the original reward function 4 年前
yanchaosun 8e2945cf stack observations 4 年前
yanchaosun 1d475ec4 prefab 4 年前
yanchaosun 7bc457f8 change reward function: stress less on action 4 年前
yanchaosun 883361ee reacher new reward: action penalty and constant not-reaching-goal penalty 4 年前
yanchaosun 16e63cb8 config fix 4 年前
yanchaosun 27dffa4d new reacher reward 4 年前
yanchaosun b5a1b9b4 hard task name change 4 年前
yanchaosun 854e10e1 3dball hard scale 4 年前
yanchaosun a1859fb8 reacher multi seeds 4 年前
yanchaosun 51491a3e new dynamics change: scale 1 to 2 4 年前
yanchaosun 7dac3284 push block more steps 4 年前
yanchaosun e39986ed block larger feature size; reacher fix and new reward 4 年前
yanchaosun 4d5f5888 encoder layer 1 4 年前
yanchaosun 5c3306ef large buffer size 4 年前
yanchaosun 1ee62100 reacher 4 年前
yanchaosun 191a1133 block forward 2 layers 4 年前
yanchaosun 4133fb35 no action 4 年前
yanchaosun 5cab2114 push block without action encoder 4 年前
yanchaosun f1802c3a push block transfer setting 4 年前
yanchaosun 1ce53c55 discrete action 4 年前
yanchaosun e9a3ea57 reacher self-transfer 4 年前
yanchaosun 4be4f1d1 new reacher env 4 年前
yanchaosun db30f918 push block 4 年前
yanchaosun 4a23dbb3 fix mass 3dball 4 年前
yanchaosun bcdc0a11 f512 4 年前
yanchaosun 82a4914e 1k time reward 0.001 4 年前
yanchaosun b0f6f307 transfer from mass 2 to mass 1 4 年前
yanchaosun 46817bed fix bug 4 年前
yanchaosun 8f8ec11b crawler: add time reward 4 年前
yanchaosun dd0ac8a3 mass=2 4 年前
yanchaosun 86830ac9 3dball mass=5 transfer test 4 年前
yanchaosun 2e927257 separate policy net 4 年前
yanchaosun 0463bfe9 smaller state feature, large action feature 4 年前
yanchaosun 96b5478f smaller 4 年前
yanchaosun 4b081de4 smaller feature size 4 年前
yanchaosun c5d9e376 add bi-forward-loss back 4 年前
yanchaosun 3ed56471 remove bi-forward-loss 4 年前
yanchaosun 49d6b70c crawler: max episode length=1000; new config: 1 forward layer 4 年前
yanchaosun ee48cca4 linear v 4 年前
yanchaosun d6f8995a larger feature size 4 年前