Small performance improvement during inference

5 年前 · 039f545a
--- a/ml-agents/mlagents/trainers/policy/torch_policy.py
+++ b/ml-agents/mlagents/trainers/policy/torch_policy.py
        )

        run_out = {}
-        action, log_probs, entropy, value_heads, memories = self.sample_actions(
-            vec_obs, vis_obs, masks=masks, memories=memories
-        )
+        with torch.no_grad():
+            action, log_probs, entropy, value_heads, memories = self.sample_actions(
+                vec_obs, vis_obs, masks=masks, memories=memories
+            )
        run_out["action"] = action.detach().numpy()
        run_out["pre_action"] = action.detach().numpy()
        # Todo - make pre_action difference