95 次代码提交 (2b67d1a6-fb3f-44d6-85b2-7c43db4d6fa4)

作者 SHA1 备注 提交日期
yanchaosun 3ef4196e Added the algorithm named ppo_transfer 4 年前
yanchaosun c2d6f5c0 basic implementation 4 年前
yanchaosun ac4c80c2 integrate the implementation and hyperparameters 4 年前
yanchaosun 1e52ad3d ready for cloud training 4 年前
yanchaosun e338ab91 test cloud training 4 年前
yanchaosun f0881a94 fix commands for cloud training 4 年前
yanchaosun 05a96355 remove slim package 4 年前
yanchaosun 44fa16fa fix issues with cloud training 4 年前
yanchaosun ad95032b transfer path 4 年前
yanchaosun b10b0895 test crawler 4 年前
yanchaosun 428f013e add old crawler 4 年前
yanchaosun 59251abe change yamls 4 年前
yanchaosun cd1778ff added one yaml 4 年前
yanchaosun a80915a8 yaml update 4 年前
yanchaosun 666c8ba9 new cloud training change 4 年前
yanchaosun 59e93b0b transfer config 4 年前
yanchaosun d0714701 new setting for cloud 4 年前
yanchaosun d7402406 multiple sizes configs 4 年前
yanchaosun 5eccb4c9 new transfer test for cloud 4 年前
yanchaosun fe4e057f test more configs 4 年前
yanchaosun d8d418c4 walker configs 4 年前
GitHub 559549e4 Add dynamics change to crawler (#4218) 4 年前
yanchaosun 7e3216ae simple env test 4 年前
yanchaosun cdaaa318 bisim 4 年前
yanchaosun bc4b7f98 walker config 4 年前
yanchaosun 3d0d359c bisimulation draft 4 年前
yanchaosun 1fdbfe65 no normalization 4 年前
yanchaosun 5a778ca3 fix normalization 4 年前
yanchaosun 66c4e6ff new config 4 年前
yanchaosun a212fef9 new bisim implementation 4 年前
yanchaosun 5471699d crawler config 4 年前
yanchaosun 6daa2ed7 cloud config 4 年前
yanchaosun 9599a8ec new config 4 年前
Andrew Cohen 5fa28f5f merge YC changes 4 年前
Andrew Cohen dad084ee old crawler config 4 年前
Andrew Cohen b46d3214 crawler configs 4 年前
Andrew Cohen 29af84da action encoder configs 4 年前
yanchaosun 80bad241 init sac transfer, and added action encoder to bisim; configs for crawler 4 年前
Andrew Cohen 1e05e727 fix crawler yaml 4 年前
yanchaosun f81feec4 config fix; basic sac 4 年前
Andrew Cohen e6066ffd separate value train and model schedule to const 4 年前
yanchaosun a505cb16 new config 4 年前
Andrew Cohen 240919b1 2 layer policy 4 年前
yanchaosun 9a19f6e5 disable bisim 4 年前
Andrew Cohen 35e9df24 value layers 3 4 年前
yanchaosun c1bccaf5 diable bisim 4 年前
Andrew Cohen 36fa1614 model linear lr 4 年前
yanchaosun 62284176 change id 4 年前
Andrew Cohen 2213a071 policy linear lr 4 年前
Andrew Cohen 33a906ad add forward layer 4 年前
yanchaosun 6657129c config: not reuse encoder 4 年前
Andrew Cohen 0c7db26a target encoder 4 年前
Andrew Cohen 57f247d4 targ for both 4 年前
Andrew Cohen 5d8b5274 add load model false to config 4 年前
Andrew Cohen 5524d6f3 test reuse 4 年前
yanchaosun 7226256d config: no alter 4 年前
Andrew Cohen cb60aa53 no separate vf 4 年前
yanchaosun a9c6105d configs 4 年前
Andrew Cohen 288eb0ed reuse encoder false 4 年前
Andrew Cohen 6979a952 3dball transfers 4 年前
Andrew Cohen 83bc38fd try reuse encoder 4 年前
Andrew Cohen 89abe29d op buffer 4 年前
Andrew Cohen 9c012d6a no op buffer no acen 4 年前
Andrew Cohen d94b81c0 sep value false 4 年前
yanchaosun 910707dd PPO 3dball config 4 年前
Andrew Cohen 2dc3c84c add forward layer 4 年前
yanchaosun f55fd920 remove transfer from yaml 4 年前
Andrew Cohen 2dec257c no encoder for single task 4 年前
yanchaosun d706f28c use off policy buffer to transfer 4 年前
Andrew Cohen 0198e41a 0 fwl 4 年前
yanchaosun f937aa96 3dball ppo: without var predict 4 年前
Andrew Cohen 3513d5a6 load policy/vf 4 年前
yanchaosun 36f36750 target critic for ppo 4 年前
Andrew Cohen bfd6a029 load value 4 年前
Andrew Cohen e1ea3dca load pol 4 年前
Andrew Cohen 78943972 add l2 penalty 3dball 4 年前
Andrew Cohen efa9e471 inc 3dball steps 4 年前
Andrew Cohen a65bd13e no fw lay 4 年前
yanchaosun e8fcc4bb ppo new implementation 4 年前
Andrew Cohen bec3f28c no load policy 4 年前
Andrew Cohen 462b34fc fw lay 4 年前
Andrew Cohen ad9e2eea fewer features 4 年前
Andrew Cohen 2cd0de04 action enc 4 年前
yanchaosun 2d1ffac5 ppo ball 4 年前
Andrew Cohen 12f3786c Revert "action enc" 4 年前
Andrew Cohen 014fc5fc new crawler 4 年前
Andrew Cohen 69bf67f3 fix config 4 年前
Andrew Cohen 40f7b9e6 no val sep 4 年前
Andrew Cohen eace3365 linear 3dball 4 年前
Andrew Cohen 12eda929 try reload all 4 年前
Andrew Cohen 70f05c39 reduce max step 4 年前
yanchaosun fec40537 ppo crawler 4 年前
Andrew Cohen 764122ac crawler update 4 年前
yanchaosun b5e02978 sac crawler config 4 年前
yanchaosun 685c4d67 ppo crawler transfer 4 年前