Open primenumber opened 1 year ago
アイデア
学習に使う棋譜には最善進行とそれに近いものがいっぱい含まれているとそういう局面の精度向上になりそう
探索中には悪い手を悪いと評価できる必要があるので、わざと悪くしたような局面も学習データに入れた方がよいかも? もっとも、とにかく最善を最善と評価できることが最も重要であることには変わりがない
1手4秒で240万局生成した。これで頑張ってみる。
アイデア