issues
search
princewen
/
tensorflow_practice
tensorflow实战练习,包括强化学习、推荐系统、nlp等
6.72k
stars
3.28k
forks
source link
AC算法的critic网络不对吧?应该用v计算td_error,r + gamma * q是啥?
#71
Open
qingminliu
opened
2 years ago