icoxfog417 / baby-steps-of-rl-ja

Pythonで学ぶ強化学習 -入門から実践まで- サンプルコード
Apache License 2.0
431 stars 262 forks source link

day4 数式について #30

Closed sirogamichandayo closed 5 years ago

sirogamichandayo commented 5 years ago

指摘事項

誤植を発見したので、報告します。また、当方は初学者なため誤植でないときは理由を教えていただけば幸いです。

4.4の最後、Policy Gradientに使用する「価値」についてActor Criticを取り上げていますが、そこで以下のような数式が取り上げられています。

image

このnablaのあとにあるthetaは間違いではないでしょうか。

指摘箇所

ページ番号: p

実行環境

エラー内容

(例外のメッセージ、ログ、画面ショットなどを添付)

sirogamichandayo commented 5 years ago

自分がnablaの使い方がわかってないだけでした。失礼しました。