14 次代码提交 (bd341f7f-01b0-405c-bfbf-ee5c1640ca95)

作者 SHA1 备注 提交日期
Andrew Cohen bd341f7f no target, increase lambda 4 年前
Andrew Cohen d1285626 add target net 4 年前
Andrew Cohen 2792cc87 update coma config 4 年前
Andrew Cohen a4c336c2 value estimator 4 年前
Andrew Cohen a92baab6 add target network back 4 年前
Andrew Cohen 79c658d2 remove normalize advantages 4 年前
Andrew Cohen 5741f8f6 no target net 4 年前
Andrew Cohen feb38012 add lambda return and target network 4 年前
Andrew Cohen 3a4aa513 COMAA runs 4 年前
Andrew Cohen e1fad8a4 buffer error 4 年前
Andrew Cohen 1511588d forcing this to work 4 年前
Andrew Cohen 6e1826f8 might be right 4 年前
Andrew Cohen 07e92563 Merge branch 'develop-centralizedcritic-counterfact' into develop-coma2 4 年前
Andrew Cohen 44088167 separate forward into q_net and baseline 4 年前