浏览代码

Don't print

/develop-generalizationTraining-TrainerController
Arthur Juliani 7 年前
当前提交
e6696ed3
共有 1 个文件被更改,包括 0 次插入1 次删除
  1. 1
      python/ppo.py

1
python/ppo.py


sess.run(ppo_model.increment_step)
if len(trainer.stats['cumulative_reward']) > 0:
mean_reward = np.mean(trainer.stats['cumulative_reward'])
print(mean_reward)
sess.run(ppo_model.update_reward, feed_dict={ppo_model.new_reward: mean_reward})
last_reward = sess.run(ppo_model.last_reward)
# Final save Tensorflow model

正在加载...
取消
保存