fix commands for cloud training

4 年前 · f0881a94
--- a/config/ppo_transfer/CrawlerStatic.yaml
+++ b/config/ppo_transfer/CrawlerStatic.yaml
      lambd: 0.95
      num_epoch: 3
      learning_rate_schedule: linear
+      encoder_layers: 2
+      policy_layers: 1
    network_settings:
      normalize: true
      hidden_units: 512
--- a/ml-agents/mlagents/trainers/learn.py
+++ b/ml-agents/mlagents/trainers/learn.py
        run_seed = np.random.randint(0, 10000)
    run_training(run_seed, options)
    if options.behaviors.transfer:
-        os.system('mlagents-learn config/ppo_transfer/3DBallHard.yaml --env=/unity-volume/3dballhard --num-envs=4 --force')
+        os.system('mlagents-learn config/ppo_transfer/3DBallHard.yaml --run-id=hardball-transfer --env=/unity-volume/3dballhard --num-envs=4 --force')


 def main():
--- a/ml-agents/mlagents/trainers/policy/transfer_policy.py
+++ b/ml-agents/mlagents/trainers/policy/transfer_policy.py
                    else:
                        predict_distribution = GaussianEncoderDistribution(
                                hidden_stream,
-                                feature_sizex
+                                feature_size
                            )

                    predict = predict_distribution.sample()