kobanium / aobazero

Aoba Zero
Other
54 stars 8 forks source link

プロセス間バッチの実装を進めています #24

Open yssaya opened 4 years ago

yssaya commented 4 years ago

autousiが同時に21個程度のプロセス(aobaz)を起動して、 aobazが計算するニューラルネットを同時にミニバッチ、7個程度、まとめて 計算するテストをしています。 この効果で1日7000棋譜程度だったのが50000棋譜程度と7倍ほど高速になっています。 これはバッチを組む高速化とともに、開発側でGPUを10枚ほど一時的に増やしたことにもよります。 計算はOpenCLですが、今までのLeelaZeroのOpenCLの流用をやめて 将棋盤の9x9で高速に動くように最適化しなおしたものを使っています。 バッチを組むことで4倍程度、OpenCLの改良で1.7倍程度高速化されてます。 Windows版の対応を含めての公開はもう少し先になると思います。

floodgateではweightを5つごとに試していましたが、今のペースだと 1日で5つ出来てしまい、50局程度しか試せないので AobaZero_w938_n_p800 からweightを10ごとにする予定です(次はw948)。