Open jiegenghua opened 5 years ago
强化学习应用于搜索排序,推荐系统。非常易于理解。看Andrew NG的博士thesis的时候,对reward shaping不是很理解,但是这篇文章里也有涉及到这个。结合实际应用,强化学习中一些概念好理解多了。
强化学习应用于搜索排序,推荐系统。非常易于理解。看Andrew NG的博士thesis的时候,对reward shaping不是很理解,但是这篇文章里也有涉及到这个。结合实际应用,强化学习中一些概念好理解多了。