2手で負けるような手の克服

tictaqqn / brutus-reignforcement

ボードゲームBrutusのGUI実装と強化学習

1 stars 1 forks source link

Open tictaqqn opened 4 years ago

tictaqqn commented 4 years ago

自分が対策を取らなければ負けてしまうような状態(将棋で言う「詰めろ」)で対策ができないという問題がある．そこで，初期状態を終盤にして，お互いにdfpnアルゴリズムで必勝の手をとるようにしながら学習させる．