issues
search
toppers
/
hakoniwa-base
5
stars
1
forks
source link
強化学習の仕組みの改良・結果の出力機能の追加
#13
Closed
sha264
closed
1 year ago
sha264
commented
1 year ago
εの値を報酬に応じて段階的に調整
収束ラインを「直近5回の報酬の平均が420000より大きい」として、収束までのエピソード数を測定しepisode.csvに書き込む
学習率を変更
takasehideki
commented
1 year ago
@sha264 ありがとうございました!!:heart: