浏览代码

reduce epsilon tennis ppo

/asymm-envs
Andrew Cohen 4 年前
当前提交
81cc5f69
共有 1 个文件被更改,包括 2 次插入2 次删除
  1. 4
      config/ppo/Tennis.yaml

4
config/ppo/Tennis.yaml


batch_size: 2048
buffer_size: 20480
beta: 0.02
epsilon: 0.2
epsilon: 0.1
hidden_units: 512
lambd: 0.95
learning_rate: 0.0003

reward_signals:
extrinsic:
strength: 1.0
gamma: 0.99
gamma: 0.995
self_play:
window: 10
play_against_latest_model_ratio: 0.0

正在加载...
取消
保存