Use linear gain for KaimingHe

4 年前 · c3cec801
--- a/ml-agents/mlagents/trainers/torch/layers.py
+++ b/ml-agents/mlagents/trainers/torch/layers.py
    :param bias_init: The Initialization to use for the weights of the bias layer
    """
    layer = torch.nn.Linear(input_size, output_size)
-    _init_methods[kernel_init](layer.weight.data)
+    if (
+        kernel_init == Initialization.KaimingHeNormal
+        or kernel_init == Initialization.KaimingHeUniform
+    ):
+        _init_methods[kernel_init](layer.weight.data, nonlinearity="linear")
+    else:
+        _init_methods[kernel_init](layer.weight.data)
    layer.weight.data *= kernel_gain
    _init_methods[bias_init](layer.bias.data)
    return layer
                input_size,
                hidden_size,
                kernel_init=Initialization.KaimingHeNormal,
-                kernel_gain=0.707,  # Equivalent to TF gain = 1
+                kernel_gain=1,
            )
        ]
        self.layers.append(Swish())
                    hidden_size,
                    hidden_size,
                    kernel_init=Initialization.KaimingHeNormal,
-                    kernel_gain=0.707,
+                    kernel_gain=1,
                )
            )
            self.layers.append(Swish())