114 次代码提交 (abbbd0ea-751c-4840-a754-c58d8a8fcbc7)

作者 SHA1 备注 提交日期
yanchaosun abbbd0ea dummy 2 bug fixed 5 年前
yanchaosun 8f67cd40 smaller learning rate 5 年前
yanchaosun 96ffdb03 new reachers 5 年前
yanchaosun 1ebe7054 new config 5 年前
yanchaosun 1a9aaaf6 model weights and large transfer learning weight 5 年前
yanchaosun 693c0ca4 feature size 32 5 年前
yanchaosun b33fd569 cancel large model lr 5 年前
yanchaosun ecef019c fix 5 年前
yanchaosun 63cec035 fix config 5 年前
yanchaosun 68544337 lift pink balls to another level 5 年前
yanchaosun 716336bf larger feature size 5 年前
yanchaosun f15a4f2d 2 layers 5 年前
yanchaosun 92c3facf distance based penalty 5 年前
yanchaosun 85549b2b reacher: stack observation. with the original reward function 5 年前
yanchaosun 8e2945cf stack observations 5 年前
yanchaosun 1d475ec4 prefab 5 年前
yanchaosun 7bc457f8 change reward function: stress less on action 5 年前
yanchaosun 883361ee reacher new reward: action penalty and constant not-reaching-goal penalty 5 年前
yanchaosun 16e63cb8 config fix 5 年前
yanchaosun 27dffa4d new reacher reward 5 年前
yanchaosun b5a1b9b4 hard task name change 5 年前
yanchaosun 854e10e1 3dball hard scale 5 年前
yanchaosun a1859fb8 reacher multi seeds 5 年前
yanchaosun 51491a3e new dynamics change: scale 1 to 2 5 年前
yanchaosun 7dac3284 push block more steps 5 年前
yanchaosun e39986ed block larger feature size; reacher fix and new reward 5 年前
yanchaosun 4d5f5888 encoder layer 1 5 年前
yanchaosun 5c3306ef large buffer size 5 年前
yanchaosun 1ee62100 reacher 5 年前
yanchaosun 191a1133 block forward 2 layers 5 年前
yanchaosun 4133fb35 no action 5 年前
yanchaosun 5cab2114 push block without action encoder 5 年前
yanchaosun f1802c3a push block transfer setting 5 年前
yanchaosun 1ce53c55 discrete action 5 年前
yanchaosun e9a3ea57 reacher self-transfer 5 年前
yanchaosun 4be4f1d1 new reacher env 5 年前
yanchaosun db30f918 push block 5 年前
yanchaosun 4a23dbb3 fix mass 3dball 5 年前
yanchaosun bcdc0a11 f512 5 年前
yanchaosun 82a4914e 1k time reward 0.001 5 年前
yanchaosun b0f6f307 transfer from mass 2 to mass 1 5 年前
yanchaosun 46817bed fix bug 5 年前
yanchaosun 8f8ec11b crawler: add time reward 5 年前
yanchaosun dd0ac8a3 mass=2 5 年前
yanchaosun 86830ac9 3dball mass=5 transfer test 5 年前
yanchaosun 2e927257 separate policy net 5 年前
yanchaosun 0463bfe9 smaller state feature, large action feature 5 年前
yanchaosun 96b5478f smaller 5 年前
yanchaosun 4b081de4 smaller feature size 5 年前
yanchaosun c5d9e376 add bi-forward-loss back 5 年前