try new cluster

5 年前 · b3bf1418
--- a/config/ppo/WalkerDynamic.yaml
+++ b/config/ppo/WalkerDynamic.yaml
    trainer: ppo
    batch_size: 2048
    beta: 0.005
-    buffer_size: 20480
+    buffer_size: 163840 #20480
    epsilon: 0.2
    hidden_units: 512
    lambd: 0.95