Merge pull request #16 from ASPePeX/keep-checkpoints

--keep-checkpoints=<n> option for ppo.py
7 年前 · 64037ccb
--- a/python/ppo.py
+++ b/python/ppo.py
  --learning-rate=<rate>     Model learning rate [default: 3e-4].
  --hidden-units=<n>         Number of units in hidden layer [default: 64].
  --batch-size=<n>           How many experiences per gradient descent update step [default: 64].
+  --keep-checkpoints=<n>     How many model checkpoints to keep [default: 5].
 '''

 options = docopt(_USAGE)
 summary_freq = int(options['--summary-freq'])
 save_freq = int(options['--save-freq'])
 env_name = options['<env>']
+keep_checkpoints = int(options['--keep-checkpoints'])

 # Algorithm-specific parameters for tuning
 gamma = float(options['--gamma'])
    os.makedirs(summary_path)

 init = tf.global_variables_initializer()
-saver = tf.train.Saver()
+saver = tf.train.Saver(max_to_keep=keep_checkpoints)

 with tf.Session() as sess:
    # Instantiate model parameters