datawhalechina / easy-rl

强化学习中文教程(蘑菇书🍄),在线阅读地址:https://datawhalechina.github.io/easy-rl/
Other
9.04k stars 1.81k forks source link

关于条件全期望公式的推导的问题 #152

Closed SacuraA closed 5 months ago

SacuraA commented 5 months ago

书的39的推到中 $/sum_y E(x|y)p(y|z)$ 为什么等于$/sum_y /sum_x xp(x|y,z)p(y|z)$ ,这个地方将E(X|Y)看作y的函数展开不应该是xp(x|y)吗为什么是p(x|y,z)

qiwang067 commented 5 months ago

推荐您看这个:https://github.com/datawhalechina/easy-rl/issues/36#issuecomment-1155146514