Open Scorpio-y opened 5 years ago
作者您好,我有个问题想请教一下。强化学习中,下一时刻的state一般都是由当前时刻的state和action决定的,如果对于下一时刻状态与当前时刻的state和action无关时,强化学习方法还适用吗?比如在无线通信中,信道的变化只与时间有关,即每个时刻的信道状态都不相同,也与当前的信道状态和action(比如分配的功率)无关,请问这种情况下,强化学习方法还适用吗?
这个问题,我研究所最后阶段研究过。我得出的结论就是,机器学习不适合做通信资源分配这块的东西,等你迭代出来结果,信道状态早已经变了很多次了。 详细的内容,可以加我的微信xulein
作者您好,我有个问题想请教一下。强化学习中,下一时刻的state一般都是由当前时刻的state和action决定的,如果对于下一时刻状态与当前时刻的state和action无关时,强化学习方法还适用吗?比如在无线通信中,信道的变化只与时间有关,即每个时刻的信道状态都不相同,也与当前的信道状态和action(比如分配的功率)无关,请问这种情况下,强化学习方法还适用吗?