add weight decay to trainers

4 年前 · 1bc2ff96
--- a/ml-agents/mlagents/trainers/ppo/optimizer_torch.py
+++ b/ml-agents/mlagents/trainers/ppo/optimizer_torch.py
        )

        self.optimizer = torch.optim.Adam(
-            params, lr=self.trainer_settings.hyperparameters.learning_rate
+            params,
+            lr=self.trainer_settings.hyperparameters.learning_rate,
+            weight_decay=self.trainer_settings.hyperparameters.weight_decay,
        )
        self.stats_name_to_update_name = {
            "Losses/Value Loss": "value_loss",
--- a/ml-agents/mlagents/trainers/sac/optimizer_torch.py
+++ b/ml-agents/mlagents/trainers/sac/optimizer_torch.py
            self.trainer_settings.max_steps,
        )
        self.policy_optimizer = torch.optim.Adam(
-            policy_params, lr=hyperparameters.learning_rate
+            policy_params,
+            lr=hyperparameters.learning_rate,
+            weight_decay=hyperparameters.weight_decay,
-            value_params, lr=hyperparameters.learning_rate
+            value_params,
+            lr=hyperparameters.learning_rate,
+            weight_decay=hyperparameters.weight_decay,
        )
        self.entropy_optimizer = torch.optim.Adam(
            self._log_ent_coef.parameters(), lr=hyperparameters.learning_rate
--- a/ml-agents/mlagents/trainers/settings.py
+++ b/ml-agents/mlagents/trainers/settings.py
    buffer_size: int = 10240
    learning_rate: float = 3.0e-4
    learning_rate_schedule: ScheduleType = ScheduleType.CONSTANT
+    weight_decay: float = 0.0


@attr.s(auto_attribs=True)