ingore attribute-defined-outside-init in multi_gpu_policy (#2876)

5 年前 · bf68edcf
--- a/.pre-commit-config.yaml
+++ b/.pre-commit-config.yaml
                .*_pb2_grpc.py|
                .*/tests/.*
            )$
-        require_serial: true
+        args: [--score=n]

 # "Local" hooks, see https://pre-commit.com/#repository-local-hooks
 -   repo: local
--- a/ml-agents/mlagents/trainers/ppo/multi_gpu_policy.py
+++ b/ml-agents/mlagents/trainers/ppo/multi_gpu_policy.py
 import logging
+from typing import Any, Dict, List, Optional
+from mlagents.envs.brain import BrainParameters
+from mlagents.trainers.components.reward_signals import RewardSignal
 from mlagents.trainers.components.reward_signals.reward_signal_factory import (
    create_reward_signal,
 )


 class MultiGpuPPOPolicy(PPOPolicy):
+    def __init__(
+        self,
+        seed: int,
+        brain: BrainParameters,
+        trainer_params: Dict[str, Any],
+        is_training: bool,
+        load: bool,
+    ):
+        self.towers: List[PPOModel] = []
+        self.devices: List[str] = []
+        self.model: Optional[PPOModel] = None
+        self.total_policy_loss: Optional[tf.Tensor] = None
+        self.reward_signal_towers: List[Dict[str, RewardSignal]] = []
+        self.reward_signals: Dict[str, RewardSignal] = {}
+
+        super().__init__(seed, brain, trainer_params, is_training, load)
+
    def create_model(
        self, brain, trainer_params, reward_signal_configs, is_training, load, seed
    ):
        :param seed: Random seed.
        """
        self.devices = get_devices()
-        self.towers = []
+
        with self.graph.as_default():
            with tf.variable_scope("", reuse=tf.AUTO_REUSE):
                for device in self.devices:
        Create reward signals
        :param reward_signal_configs: Reward signal config.
        """
-        self.reward_signal_towers = []
        with self.graph.as_default():
            with tf.variable_scope(TOWER_SCOPE_NAME, reuse=tf.AUTO_REUSE):
                for device_id, device in enumerate(self.devices):
        return average_grads


-def get_devices():
+def get_devices() -> List[str]:
    """
    Get all available GPU devices
    """