Open tictaqqn opened 4 years ago
自分が対策を取らなければ負けてしまうような状態(将棋で言う「詰めろ」)で対策ができないという問題がある. そこで,初期状態を終盤にして,お互いにdfpnアルゴリズムで必勝の手をとるようにしながら学習させる.
自分が対策を取らなければ負けてしまうような状態(将棋で言う「詰めろ」)で対策ができないという問題がある. そこで,初期状態を終盤にして,お互いにdfpnアルゴリズムで必勝の手をとるようにしながら学習させる.