-

4 年前 · 49e08218
--- a/config/imitation/Pyramids.yaml
+++ b/config/imitation/Pyramids.yaml
  Pyramids:
    trainer_type: ppo
    time_horizon: 128
-    max_steps: 1.0e7
+    max_steps: 1.0e5
    hyperparameters:
      batch_size: 128
      beta: 0.01