icoxfog417 / baby-steps-of-rl-ja

Pythonで学ぶ強化学習 -入門から実践まで- サンプルコード
Apache License 2.0
431 stars 262 forks source link

train_loopのobserve_intervalを0以外にすると、エラーが発生する #25

Closed icoxfog417 closed 5 years ago

icoxfog417 commented 5 years ago

指摘事項

train_loopのobserve_intervalを0以外にし、python FN/value_function_agent.pyを実行すると以下のようなエラーとなる。

last_frames = [f[:, :, -1] for f in frames]
IndexError: too many indices for array

指摘箇所

ページ番号: p

実行環境

エラー内容

(例外のメッセージ、ログ、画面ショットなどを添付)

icoxfog417 commented 5 years ago

こちらは仕様になります。value_function_agent.pyで使う環境はそもそも画面フレームがないため、画面フレームを記録するためのobserve_intervalがうまく働きません。 (もちろん、観測が画面でないケースの場合それに応じた対応をした方が良いですが・・・)