xushushu231 / The-JUAD-resource-allocation-for-D2D-in-a-FDD-cellular-network

WCSP:(1)Joint Uplink and Downlink Resource Allocation for D2D Communications Underlying Cellular Networks
47 stars 13 forks source link

请教问题 #3

Open Scorpio-y opened 5 years ago

Scorpio-y commented 5 years ago

作者您好,我有个问题想请教一下。强化学习中,下一时刻的state一般都是由当前时刻的state和action决定的,如果对于下一时刻状态与当前时刻的state和action无关时,强化学习方法还适用吗?比如在无线通信中,信道的变化只与时间有关,即每个时刻的信道状态都不相同,也与当前的信道状态和action(比如分配的功率)无关,请问这种情况下,强化学习方法还适用吗?

xushushu231 commented 5 years ago

这个问题,我研究所最后阶段研究过。我得出的结论就是,机器学习不适合做通信资源分配这块的东西,等你迭代出来结果,信道状态早已经变了很多次了。 详细的内容,可以加我的微信xulein