kobanium / aobazero

Aoba Zero
Other
54 stars 8 forks source link

AobaZeroのweightの更新を10000棋譜から34285棋譜ごとに #51

Open yssaya opened 3 years ago

yssaya commented 3 years ago

重みの更新を10000棋譜から34285棋譜に変更しました。 これはAlphaZeroが2400万棋譜、70万回学習、mini-batch=4096、1000回学習ごとに重み更新、なので 3.4285万棋譜(=2400/(700000/1000))に合わせたためです。

今までは1万棋譜ごとで直近の50万棋譜からサンプリング、なので50世代、 3.4285万棋譜だと15世代が含まれます。

mini-batch=128 だと32000回学習((4096/128)*1000)ごとに重み更新、なので 3.4285万棋譜で32000回学習になるように 1棋譜あたり1.07142回学習されるように 棋譜追加時の学習回数も調整しています。 今までは1棋譜あたり1回の学習でした。 1回で128局面を学習するので現在の平均手数85手だと1局面あたり1.41回ほど学習することになります。