Closed Duke-Allen closed 2 years ago
作者您好,我看到在coma.py的learn函数中用了torch.nn.utils.clip_grad_norm,但为什么在reinforce.py中没有用这个,而是在reinforce+g2anet的情况下才用?
coma.py
learn
torch.nn.utils.clip_grad_norm
reinforce.py
就是调个参,不同的算法在不同的参数下表现不同,你自己可以试一试
好的谢谢,顺便问一下,如果想要在PG的方法中加一下baseline应该怎么做?还有baseline应该怎么算您知道吗
这个就不太清楚了,我挺久没写相关的代码了
作者您好,我看到在
coma.py
的learn
函数中用了torch.nn.utils.clip_grad_norm
,但为什么在reinforce.py
中没有用这个,而是在reinforce+g2anet的情况下才用?