ml-agents

2 提交

337 分支

128 Plastic标签

分支: release_9_branch

作者	SHA1	备注	提交日期
GitHub	b51347ac	New Variable Speed Walker Environments (#4301 ) * init * Add reward manager and hurryUpReward * fix hurry reward/ add awful first training * Turn off head height and hurry rew * changed max speed to 15. added small hh rew * add NaN check for reward manager. start vel penalty * add bpVel pen * add new BPVelPen nn file * remove outdated nn file * add randomize speed bool * try rewad product * change coeff to 1 * try avg vel of all bp for reward * move outside loop * try linear inverselerp for vel * add avg rew matchspeed15 nn file. looks much better * save scene * no hand penalty, random walk speed * fix inverse lerp * try new reward falloff * cleanup * added new nn file. don't allow hand contact * update obsv * remove hh rew. add trained no-hh model * add new nn file * new curve * add new models. try no reset * add hh rew * clamp hh * zero rewards if ground contact * switch to approved with movi...	4 年前

作者

SHA1

备注

提交日期

GitHub

b51347ac

New Variable Speed Walker Environments (#4301 )

* init

* Add reward manager and hurryUpReward

* fix hurry reward/ add awful first training

* Turn off head height and hurry rew

* changed max speed to 15. added small hh rew

* add NaN check for reward manager. start vel penalty

* add bpVel pen

* add new BPVelPen nn file

* remove outdated nn file

* add randomize speed bool

* try rewad product

* change coeff to 1

* try avg vel of all bp for reward

* move outside loop

* try linear inverselerp for vel

* add avg rew matchspeed15 nn file. looks much better

* save scene

* no hand penalty, random walk speed

* fix inverse lerp

* try new reward falloff

* cleanup

* added new nn file. don't allow hand contact

* update obsv

* remove hh rew. add trained no-hh model

* add new nn file

* new curve

* add new models. try no reset

* add hh rew

* clamp hh

* zero rewards if ground contact

* switch to approved with movi...

4 年前

1 次代码提交 (release_9_branch)