reset ppo learn.py to master

5 年前 · af4792a6
--- a/Project/Assets/ML-Agents/Examples/Walker/Demos/ExpertWalkerDy.demo.meta
+++ b/Project/Assets/ML-Agents/Examples/Walker/Demos/ExpertWalkerDy.demo.meta
 guid: d0bff0b25f0d247f8a3951edb90cc71a
 ScriptedImporter:
  fileIDToRecycleName:
-    11400000: Assets/Demonstrations/ExpertWalkerDy.demo
+    11400002: Assets/ML-Agents/Examples/Walker/Demos/ExpertWalkerDy.demo
  externalObjects: {}
  userData: ' (Unity.MLAgents.Demonstrations.DemonstrationSummary)'
  assetBundleName: 
--- a/Project/Assets/ML-Agents/Examples/Walker/Demos/ExpertWalkerDyVS.demo.meta
+++ b/Project/Assets/ML-Agents/Examples/Walker/Demos/ExpertWalkerDyVS.demo.meta
 guid: 023d43e719a4140a2a683974ce7bb955
 ScriptedImporter:
  fileIDToRecycleName:
-    11400000: Assets/Demonstrations/ExpertWalkerDyVS.demo
+    11400002: Assets/ML-Agents/Examples/Walker/Demos/ExpertWalkerDyVS.demo
  externalObjects: {}
  userData: ' (Unity.MLAgents.Demonstrations.DemonstrationSummary)'
  assetBundleName: 
--- a/Project/Assets/ML-Agents/Examples/Walker/Demos/ExpertWalkerSt.demo.meta
+++ b/Project/Assets/ML-Agents/Examples/Walker/Demos/ExpertWalkerSt.demo.meta
 guid: 6568f9aea39f34581b4df153e4a8bdd3
 ScriptedImporter:
  fileIDToRecycleName:
-    11400000: Assets/Demonstrations/ExpertWalkerSt.demo
+    11400002: Assets/ML-Agents/Examples/Walker/Demos/ExpertWalkerSt.demo
  externalObjects: {}
  userData: ' (Unity.MLAgents.Demonstrations.DemonstrationSummary)'
  assetBundleName: 
--- a/Project/Assets/ML-Agents/Examples/Walker/Demos/ExpertWalkerStVS.demo.meta
+++ b/Project/Assets/ML-Agents/Examples/Walker/Demos/ExpertWalkerStVS.demo.meta
 guid: 06aba1fa7650441b1bc832f52f9801ee
 ScriptedImporter:
  fileIDToRecycleName:
-    11400000: Assets/Demonstrations/ExpertWalkerStVS.demo
+    11400002: Assets/ML-Agents/Examples/Walker/Demos/ExpertWalkerStVS.demo
  externalObjects: {}
  userData: ' (Unity.MLAgents.Demonstrations.DemonstrationSummary)'
  assetBundleName: 
--- a/ml-agents/mlagents/trainers/learn.py
+++ b/ml-agents/mlagents/trainers/learn.py
 from mlagents.trainers.trainer_util import TrainerFactory, handle_existing_directories
 from mlagents.trainers.stats import (
    TensorboardWriter,
-    CSVWriter,
    StatsReporter,
    GaugeWriter,
    ConsoleWriter,
                os.path.join(run_logs_dir, "training_status.json")
            )

-        # Configure CSV, Tensorboard Writers and StatsReporter
-        # We assume reward and episode length are needed in the CSV.
-        csv_writer = CSVWriter(
-            write_path,
-            required_fields=[
-                "Environment/Cumulative Reward",
-                "Environment/Episode Length",
-            ],
-        )
+        # Configure Tensorboard Writers and StatsReporter
        tb_writer = TensorboardWriter(
            write_path, clear_past_data=not checkpoint_settings.resume
        )
-        StatsReporter.add_writer(csv_writer)
        StatsReporter.add_writer(gauge_write)
        StatsReporter.add_writer(console_writer)



 def create_environment_factory(
-    env_path: Optional[str],
-    no_graphics: bool,
-    seed: int,
-    start_port: Optional[int],
-    env_args: Optional[List[str]],
-    log_folder: str,
+        env_path: Optional[str],
+        no_graphics: bool,
+        seed: int,
+        start_port: Optional[int],
+        env_args: Optional[List[str]],
+        log_folder: str,
-        worker_id: int, side_channels: List[SideChannel]
+            worker_id: int, side_channels: List[SideChannel]
    ) -> UnityEnvironment:
        # Make sure that each environment gets a different seed
        env_seed = seed + worker_id