Closed TomorrowIsAnOtherDay closed 1 year ago
定义方法和调用方法的名称还是没匹配 定义了def run_train_episode(env, agent): 调用的时候写了obs_list, action_list, reward_list = run_episode(env, agent)
def run_train_episode(env, agent):
obs_list, action_list, reward_list = run_episode(env, agent)
https://github.com/PaddlePaddle/PARL/pull/996/files 可以看下这里,这个PR得等明天同事上班给我review/merge了才会生效的。
建议star下PARL关注下后续发版哈:)
加星了加星了,我的意思是这里行业的小bug
好的,也已经修复了:)
好的谢谢早点休息
995
定义方法和调用方法的名称还是没匹配 定义了
def run_train_episode(env, agent):
调用的时候写了obs_list, action_list, reward_list = run_episode(env, agent)