ml-agents

Unity 机器学习代理工具包 (ML-Agents) 是一个开源项目，它使游戏和模拟能够作为训练智能代理的环境。

unity3d unity unity-tech reinforcement-le deep-learning deep-reinforcement-learning neural-networks

文件历史

GitHub c145e75b Split Policy and Optimizer, common Policy for PPO and SAC (#3345 )		5 年前
..
common	Split Policy and Optimizer, common Policy for PPO and SAC (#3345)	5 年前
components	Split Policy and Optimizer, common Policy for PPO and SAC (#3345)	5 年前
ghost	Split Policy and Optimizer, common Policy for PPO and SAC (#3345)	5 年前
ppo	Split Policy and Optimizer, common Policy for PPO and SAC (#3345)	5 年前
sac	Split Policy and Optimizer, common Policy for PPO and SAC (#3345)	5 年前
tests	Split Policy and Optimizer, common Policy for PPO and SAC (#3345)	5 年前
__init__.py	set package and API to 0.15.0-dev0 (#3369)	5 年前
action_info.py	Move advance() logic for environment manager out of trainer_controller (#3234)	5 年前
agent_processor.py	Move learning rate reporting	5 年前
barracuda.py	fix errors from new flake8-comprehensions (#2917)	5 年前
behavior_id_utils.py	Self-play for symmetric games (#3194)	5 年前
brain.py	Replace BrainInfos with BatchedStepResult (#3207)	5 年前
brain_conversion_utils.py	Move advance() logic for environment manager out of trainer_controller (#3234)	5 年前
buffer.py	Fix clear update buffer when trainer stops training, add test (#3422)	5 年前
curriculum.py	Allow curricula to be created without files (#3145)	5 年前
demo_loader.py	[bug-fix] Use correct agent_ids for demo loader (#3464)	5 年前
env_manager.py	Move processing of steps after reset to advance() (#3271)	5 年前
exception.py	Combined model and policy for PPO	5 年前
learn.py	Split Policy and Optimizer, common Policy for PPO and SAC (#3345)	5 年前
meta_curriculum.py	Add 'run-experiment' script, simpler curriculum config (#3186)	5 年前
models.py	Split Policy and Optimizer, common Policy for PPO and SAC (#3345)	5 年前
policy.py	Replace BrainInfos with BatchedStepResult (#3207)	5 年前
rl_trainer.py	Merge branch 'master' into develop-splitpolicyoptimizer	5 年前
run_experiment.py	Add 'run-experiment' script, simpler curriculum config (#3186)	5 年前
sampler_class.py	Moving Env Manager to Trainers (#3062) The Env Manager is only used by the trainer codebase. The entry point to interact with an environment is UnityEnvironment.	5 年前
simple_env_manager.py	Move advance() logic for environment manager out of trainer_controller (#3234)	5 年前
stats.py	Make the timer output format consistent (#3472)	5 年前
subprocess_env_manager.py	Move advance() logic for environment manager out of trainer_controller (#3234)	5 年前
tensorflow_to_barracuda.py	backport tf2bc changes from barracuda-release (#3341)	5 年前
tf_policy.py	Split Policy and Optimizer, common Policy for PPO and SAC (#3345)	5 年前
trainer.py	Merge branch 'master' into develop-splitpolicyoptimizer	5 年前
trainer_controller.py	Make the timer output format consistent (#3472)	5 年前
trainer_util.py	Temporarily remove multi-GPU	5 年前
trajectory.py	Replace BrainInfos with BatchedStepResult (#3207)	5 年前