84 次代码提交 (7b843666-3c75-4be9-b421-8a40a7d05e44)

作者 SHA1 备注 提交日期
Andrew Cohen 7b843666 l2 3dball 4 年前
Andrew Cohen 78943972 add l2 penalty 3dball 4 年前
Andrew Cohen e1ea3dca load pol 4 年前
Andrew Cohen bfd6a029 load value 4 年前
Andrew Cohen 3513d5a6 load policy/vf 4 年前
Andrew Cohen 0198e41a 0 fwl 4 年前
Andrew Cohen 2dec257c no encoder for single task 4 年前
Andrew Cohen 2dc3c84c add forward layer 4 年前
Andrew Cohen d94b81c0 sep value false 4 年前
Andrew Cohen 9c012d6a no op buffer no acen 4 年前
Andrew Cohen 9d7ed6cc op buffer 4 年前
Andrew Cohen 89abe29d op buffer 4 年前
Andrew Cohen 302e8e77 no action encoder 4 年前
Andrew Cohen 83bc38fd try reuse encoder 4 年前
Andrew Cohen 6979a952 3dball transfers 4 年前
Andrew Cohen 288eb0ed reuse encoder false 4 年前
Andrew Cohen cb60aa53 no separate vf 4 年前
Andrew Cohen 5524d6f3 test reuse 4 年前
Andrew Cohen 5d8b5274 add load model false to config 4 年前
Andrew Cohen 57f247d4 targ for both 4 年前
Andrew Cohen 0c7db26a target encoder 4 年前
Andrew Cohen 33a906ad add forward layer 4 年前
Andrew Cohen 2213a071 policy linear lr 4 年前
Andrew Cohen 36fa1614 model linear lr 4 年前
Andrew Cohen 35e9df24 value layers 3 4 年前
Andrew Cohen 240919b1 2 layer policy 4 年前
Andrew Cohen e6066ffd separate value train and model schedule to const 4 年前
Andrew Cohen 1e05e727 fix crawler yaml 4 年前
Andrew Cohen e10c9abd update crawler 4 年前
Andrew Cohen 29af84da action encoder configs 4 年前
GitHub 9f041970 Develop bisim action encoder, incorporate related hyperparameter settings (#4253) 4 年前
Andrew Cohen b46d3214 crawler configs 4 年前
Andrew Cohen dad084ee old crawler config 4 年前
Andrew Cohen 5fa28f5f merge YC changes 4 年前
yanchaosun caeffa3e add two envs 4 年前
Andrew Cohen 1b17ae56 add tanh activ 4 年前
Andrew Cohen 617aefc9 resolve conflict 4 年前
yanchaosun f8b91faa try to fix the bisim metric 4 年前
Andrew Cohen b6bf1860 fix bisim metric 4 年前
Andrew Cohen d0133066 working 4 年前
yanchaosun ec929746 minor update 4 年前
yanchaosun 0e2f6e19 small fix 4 年前
yanchaosun aca8cd58 update with new alternating 4 年前
yanchaosun 5471699d crawler config 4 年前
yanchaosun a212fef9 new bisim implementation 4 年前
yanchaosun 66c4e6ff new config 4 年前
yanchaosun 5a778ca3 fix normalization 4 年前
yanchaosun 3d0d359c bisimulation draft 4 年前
yanchaosun cdaaa318 bisim 4 年前
yanchaosun 7e3216ae simple env test 4 年前