tictaqqn / brutus-reignforcement

ボードゲームBrutusのGUI実装と強化学習
1 stars 1 forks source link

2手で負けるような手の克服 #20

Open tictaqqn opened 4 years ago

tictaqqn commented 4 years ago

自分が対策を取らなければ負けてしまうような状態(将棋で言う「詰めろ」)で対策ができないという問題がある. そこで,初期状態を終盤にして,お互いにdfpnアルゴリズムで必勝の手をとるようにしながら学習させる.