COMA出现nan - Githubissues

hijkzzz / pymarl2

Fine-tuned MARL algorithms on SMAC (100% win rates on most scenarios)

Apache License 2.0

633 stars 124 forks source link

与issue30中相同情况但按照您的回复加大entropy loss无法解决事实上这一步的错误在第一次训练计算entropy loss之前就会出现，修改entropy loss无效具体出现错误的位置coma_learner的80行 dist_entropy = Categorical(pi).entropy().view(-1)

和pymarl进行对比，pymarl的coma算法的config中mask_before_softmax是FALSE，本仓库中是TRUE, 推测是这导致的问题然后尝试将basic_controller.py中疑似导致nan的41行agent_outs[reshaped_avail_actions == 0] = -1e10修改后，不再出现nan

nan的问题应该就是这里导致的了

hijkzzz / pymarl2

COMA出现nan #33