強化学習の仕組みの改良・結果の出力機能の追加 - Githubissues

toppers / hakoniwa-base

5 stars 1 forks source link

強化学習の仕組みの改良・結果の出力機能の追加 #13

Closed sha264 closed 1 year ago

sha264 commented 1 year ago

εの値を報酬に応じて段階的に調整
収束ラインを「直近5回の報酬の平均が420000より大きい」として、収束までのエピソード数を測定しepisode.csvに書き込む
学習率を変更

takasehideki commented 1 year ago

@sha264 ありがとうございました！！:heart: