yaneurao / YaneuraOu

YaneuraOu is the World's Strongest Shogi engine(AI player) , WCSC29 1st winner , educational and USI compliant engine.
GNU General Public License v3.0
525 stars 140 forks source link

- TensorRT: cudaSetDevice() #157

Closed mizar closed 3 years ago

mizar commented 3 years ago

複数GPU環境、TensorRT版ふかうら王において、1番目のGPUしか使われていなかった件の修正案です。

dlshogiの場合、 UctSearch.cpp 内で cudaSetDevice() が呼び出されていましたが、ふかうら王ではこの cudaSetDevice() を呼び出している箇所が無さそうでした。 https://github.com/TadaoYamaoka/DeepLearningShogi/blob/master/usi/UctSearch.cpp#L302-L339

手元の環境で UCT_Threads1 3 , UCT_Threads2 3 , DNN_Batch_Size1 256 として複数GPUを使う設定を行うと、序盤の局面では複数GPUを使って dlshogi とほぼ同等の 100kNPS 程度の探索が出来そうです。

(ponder無しでのテスト対局) image

yaneurao commented 3 years ago

dlshogiから移植してくるときに、要らんのかと勘違いしてました😂 ありがとうございます。