separate value train and model schedule to const

5 年前 · e6066ffd
--- a/config/ppo_transfer/CrawlerStatic.yaml
+++ b/config/ppo_transfer/CrawlerStatic.yaml
      lambd: 0.95
      num_epoch: 3
      learning_rate_schedule: constant
+      model_schedule: constant
      encoder_layers: 2
      action_layers: 2
      policy_layers: 1
      predict_return: true
      use_bisim: false
      separate_value_train: true
+      separate_value_net: true
      in_batch_alter: true
    network_settings:
      normalize: true
--- a/config/ppo_transfer/OldCrawlerStatic.yaml
+++ b/config/ppo_transfer/OldCrawlerStatic.yaml
      lambd: 0.95
      num_epoch: 3
      learning_rate_schedule: constant
+      model_schedule: constant
      encoder_layers: 2
      action_layers: 2
      policy_layers: 1
      predict_return: true
      use_bisim: false
      separate_value_train: true
+      separate_value_net: true
      train_model: false
      load_model: true
      train_action: false