Open renfujiwara opened 3 years ago
https://scholar.google.com/scholar?hl=ja&as_sdt=0%2C5&q=Deterministic+Policy+Gradient+Algorithms&btnG=
任意の強化学習におけるDeterministic Policy Gradientの存在を証明するとともに、 stochastic policy gradientよりも性能が良くなることを示した。
https://scholar.google.com/scholar?hl=ja&as_sdt=0%2C5&q=Deterministic+Policy+Gradient+Algorithms&btnG=