yanchaosun
|
3ef4196e
|
Added the algorithm named ppo_transfer
|
5 年前 |
yanchaosun
|
c2d6f5c0
|
basic implementation
|
5 年前 |
yanchaosun
|
ac4c80c2
|
integrate the implementation and hyperparameters
|
4 年前 |
yanchaosun
|
1e52ad3d
|
ready for cloud training
|
4 年前 |
yanchaosun
|
e338ab91
|
test cloud training
|
4 年前 |
yanchaosun
|
f0881a94
|
fix commands for cloud training
|
4 年前 |
yanchaosun
|
05a96355
|
remove slim package
|
4 年前 |
yanchaosun
|
44fa16fa
|
fix issues with cloud training
|
4 年前 |
yanchaosun
|
ad95032b
|
transfer path
|
4 年前 |
yanchaosun
|
b10b0895
|
test crawler
|
4 年前 |
yanchaosun
|
428f013e
|
add old crawler
|
4 年前 |
yanchaosun
|
59251abe
|
change yamls
|
4 年前 |
yanchaosun
|
cd1778ff
|
added one yaml
|
4 年前 |
yanchaosun
|
a80915a8
|
yaml update
|
4 年前 |
yanchaosun
|
666c8ba9
|
new cloud training change
|
4 年前 |
yanchaosun
|
59e93b0b
|
transfer config
|
4 年前 |
yanchaosun
|
d0714701
|
new setting for cloud
|
4 年前 |
yanchaosun
|
d7402406
|
multiple sizes configs
|
4 年前 |
yanchaosun
|
5eccb4c9
|
new transfer test for cloud
|
4 年前 |
yanchaosun
|
fe4e057f
|
test more configs
|
4 年前 |
yanchaosun
|
d8d418c4
|
walker configs
|
4 年前 |
GitHub
|
559549e4
|
Add dynamics change to crawler (#4218)
* update walker
* add dynamics change crawler
|
4 年前 |
yanchaosun
|
7e3216ae
|
simple env test
|
4 年前 |
yanchaosun
|
cdaaa318
|
bisim
|
4 年前 |
yanchaosun
|
bc4b7f98
|
walker config
|
4 年前 |
yanchaosun
|
3d0d359c
|
bisimulation draft
|
4 年前 |
yanchaosun
|
1fdbfe65
|
no normalization
|
4 年前 |
yanchaosun
|
5a778ca3
|
fix normalization
|
4 年前 |
yanchaosun
|
66c4e6ff
|
new config
|
4 年前 |
yanchaosun
|
a212fef9
|
new bisim implementation
|
4 年前 |
yanchaosun
|
5471699d
|
crawler config
|
4 年前 |
yanchaosun
|
6daa2ed7
|
cloud config
|
4 年前 |
yanchaosun
|
9599a8ec
|
new config
|
4 年前 |
Andrew Cohen
|
5fa28f5f
|
merge YC changes
|
4 年前 |
Andrew Cohen
|
dad084ee
|
old crawler config
|
4 年前 |
Andrew Cohen
|
b46d3214
|
crawler configs
|
4 年前 |
Andrew Cohen
|
29af84da
|
action encoder configs
|
4 年前 |
yanchaosun
|
80bad241
|
init sac transfer, and added action encoder to bisim; configs for crawler
|
4 年前 |
Andrew Cohen
|
1e05e727
|
fix crawler yaml
|
4 年前 |
yanchaosun
|
f81feec4
|
config fix; basic sac
|
4 年前 |
Andrew Cohen
|
e6066ffd
|
separate value train and model schedule to const
|
4 年前 |
yanchaosun
|
a505cb16
|
new config
|
4 年前 |
Andrew Cohen
|
240919b1
|
2 layer policy
|
4 年前 |
yanchaosun
|
9a19f6e5
|
disable bisim
|
4 年前 |
Andrew Cohen
|
35e9df24
|
value layers 3
|
4 年前 |
yanchaosun
|
c1bccaf5
|
diable bisim
|
4 年前 |
Andrew Cohen
|
36fa1614
|
model linear lr
|
4 年前 |
yanchaosun
|
62284176
|
change id
|
4 年前 |
Andrew Cohen
|
2213a071
|
policy linear lr
|
4 年前 |
Andrew Cohen
|
33a906ad
|
add forward layer
|
4 年前 |
yanchaosun
|
6657129c
|
config: not reuse encoder
|
4 年前 |
Andrew Cohen
|
0c7db26a
|
target encoder
|
4 年前 |
Andrew Cohen
|
57f247d4
|
targ for both
|
4 年前 |
Andrew Cohen
|
5d8b5274
|
add load model false to config
|
4 年前 |
Andrew Cohen
|
5524d6f3
|
test reuse
|
4 年前 |
yanchaosun
|
7226256d
|
config: no alter
|
4 年前 |
Andrew Cohen
|
cb60aa53
|
no separate vf
|
4 年前 |
yanchaosun
|
a9c6105d
|
configs
|
4 年前 |
Andrew Cohen
|
288eb0ed
|
reuse encoder false
|
4 年前 |
Andrew Cohen
|
6979a952
|
3dball transfers
|
4 年前 |
Andrew Cohen
|
83bc38fd
|
try reuse encoder
|
4 年前 |
Andrew Cohen
|
89abe29d
|
op buffer
|
4 年前 |
Andrew Cohen
|
9c012d6a
|
no op buffer no acen
|
4 年前 |
Andrew Cohen
|
d94b81c0
|
sep value false
|
4 年前 |
yanchaosun
|
910707dd
|
PPO 3dball config
|
4 年前 |
Andrew Cohen
|
2dc3c84c
|
add forward layer
|
4 年前 |
yanchaosun
|
f55fd920
|
remove transfer from yaml
|
4 年前 |
Andrew Cohen
|
2dec257c
|
no encoder for single task
|
4 年前 |
yanchaosun
|
d706f28c
|
use off policy buffer to transfer
|
4 年前 |
Andrew Cohen
|
0198e41a
|
0 fwl
|
4 年前 |
yanchaosun
|
f937aa96
|
3dball ppo: without var predict
|
4 年前 |
Andrew Cohen
|
3513d5a6
|
load policy/vf
|
4 年前 |
yanchaosun
|
36f36750
|
target critic for ppo
|
4 年前 |
Andrew Cohen
|
bfd6a029
|
load value
|
4 年前 |
Andrew Cohen
|
e1ea3dca
|
load pol
|
4 年前 |
Andrew Cohen
|
78943972
|
add l2 penalty 3dball
|
4 年前 |
Andrew Cohen
|
efa9e471
|
inc 3dball steps
|
4 年前 |
Andrew Cohen
|
a65bd13e
|
no fw lay
|
4 年前 |
yanchaosun
|
e8fcc4bb
|
ppo new implementation
|
4 年前 |
Andrew Cohen
|
bec3f28c
|
no load policy
|
4 年前 |
Andrew Cohen
|
462b34fc
|
fw lay
|
4 年前 |
Andrew Cohen
|
ad9e2eea
|
fewer features
|
4 年前 |
Andrew Cohen
|
2cd0de04
|
action enc
|
4 年前 |
yanchaosun
|
2d1ffac5
|
ppo ball
|
4 年前 |
Andrew Cohen
|
12f3786c
|
Revert "action enc"
This reverts commit 9acb5f846a77a47d14694cb1271e2a370f395b6a.
|
4 年前 |
Andrew Cohen
|
014fc5fc
|
new crawler
|
4 年前 |
Andrew Cohen
|
69bf67f3
|
fix config
|
4 年前 |
Andrew Cohen
|
40f7b9e6
|
no val sep
|
4 年前 |
Andrew Cohen
|
eace3365
|
linear 3dball
|
4 年前 |
Andrew Cohen
|
12eda929
|
try reload all
|
4 年前 |
Andrew Cohen
|
70f05c39
|
reduce max step
|
4 年前 |
yanchaosun
|
fec40537
|
ppo crawler
|
4 年前 |
Andrew Cohen
|
764122ac
|
crawler update
|
4 年前 |
yanchaosun
|
b5e02978
|
sac crawler config
|
4 年前 |
yanchaosun
|
685c4d67
|
ppo crawler transfer
|
4 年前 |