Remove outdated comment

5 年前 · 23088088
--- a/ml-agents/mlagents/trainers/sac/optimizer.py
+++ b/ml-agents/mlagents/trainers/sac/optimizer.py
        else:
            self.output_pre = self.policy_network.output_pre

-        # Don't use value estimate during inference. TODO: Check why PPO uses value_estimate in inference.
+        # Don't use value estimate during inference.
        self.value = tf.identity(
            self.policy_network.value, name="value_estimate_unused"
        )