浏览代码

Fix entropy calculation

/develop/nopreviousactions
Ervin Teng 5 年前
当前提交
c9fbb111
共有 1 个文件被更改,包括 1 次插入1 次删除
  1. 2
      ml-agents/mlagents/trainers/common/nn_policy.py

2
ml-agents/mlagents/trainers/common/nn_policy.py


self.all_log_probs = tf.identity(all_probs, name="action_probs")
single_dim_entropy = 0.5 * tf.reduce_mean(
tf.log(2 * np.pi * np.e) + tf.square(log_sigma)
tf.log(2 * np.pi * np.e) + 2 * log_sigma
)
# Make entropy the right shape
self.entropy = tf.ones_like(tf.reshape(mu[:, 0], [-1])) * single_dim_entropy

正在加载...
取消
保存