Not about this work - Githubissues

您好，不好意思在这里问个题外话，请问您是不是也读过“A Deep-Reinforcement Learning Approach for Software-Defined Networking Routing Optimization”这篇文章吗？成果复现了吗？我训练的时候发现无论训练多少轮reward基本都不变，好像完全没训练一样，测试的时候结果也是。不知道是不是我出了什么问题，拜托指教！谢谢！