Open etleader opened 5 years ago
您好, 不好意思在这里问个题外话,请问您是不是也读过“A Deep-Reinforcement Learning Approach for Software-Defined Networking Routing Optimization”这篇文章吗?成果复现了吗?我训练的时候发现无论训练多少轮reward基本都不变,好像完全没训练一样,测试的时候结果也是。不知道是不是我出了什么问题,拜托指教!谢谢!
您好, 不好意思在这里问个题外话,请问您是不是也读过“A Deep-Reinforcement Learning Approach for Software-Defined Networking Routing Optimization”这篇文章吗?成果复现了吗?我训练的时候发现无论训练多少轮reward基本都不变,好像完全没训练一样,测试的时候结果也是。不知道是不是我出了什么问题,拜托指教!谢谢!