princewen / tensorflow_practice

tensorflow实战练习,包括强化学习、推荐系统、nlp等
6.72k stars 3.28k forks source link

AC算法的critic网络不对吧?应该用v计算td_error,r + gamma * q是啥? #71

Open qingminliu opened 2 years ago