kobanium / aobazero

Aoba Zero
Other
54 stars 8 forks source link

GPU使用率について #21

Open lonemonkeywithwhiteshell opened 4 years ago

lonemonkeywithwhiteshell commented 4 years ago

こんにちは。rtx2080tiで動作させたところ、GPU使用率が58%止まりになります。使用率を上げることはできますか?また、Averageが1650msくらいです。この速度は正常でしょうか?

yssaya commented 4 years ago

GPUの使用率は私の2080Tiで65%程度です。 使用率を上げるには autousi.cfg を編集して Device -1 # use a default device を Device 0 0 としていただくと、同一マシンで2つのaobazを使って棋譜を生成しようとして 2080Tiですと1.4倍ほど生成速度が上がります。 平均速度は1つのaobazで私の2080Tiだと平均1420ms程度ですので若干遅いかもしれません。

開発中のものでは棋譜の生成には使えませんが $ git clone -b develop https://github.com/kobanium/aoba-zero.git aoba_develop として取得してmakeし、 下のようなオプションで動かすとGPUをほぼ使いきり探索速度も3倍程度速くなります。 $ ./aobaz -p 30000 -i -t 10 -b 5 -u 0 -q -w ./weight/w765.txt -t 10 はスレッド数が10で、-b 5 は内部でミニバッチサイズを5で計算する、という意味になります。 ただ同じplayout数ではシングルスレッドで計算した場合より+40Elo程度弱くなります。

lonemonkeywithwhiteshell commented 4 years ago

Device 0 0 1 1 2 2 3 3 と設定して動かしてみました。2080tix4枚です。 GPU使用率は71%止まりでした。CPU使用率は81%、GPUクロックが1985MHzくらいです。。 やはりちょっと低いですがどこか工夫できますでしょうか? +------+-----+--------+---< Aobaz Status >------------------------+ | PID | Dev | Average| Moves | +------+-----+--------+-------------------------------------------+ | 12004| 0 | 3233ms| 1: | | 10708| 0 | 3277ms|108:##################### | | 4064| 1 | 3531ms| 41:######## | | 6440| 1 | 3196ms| 17:### | | 3648| 2 | 3209ms| 0: | | 8584| 2 | 3127ms| 26:##### | | 3652| 3 | 3622ms| 74:############## | | 4616| 3 | 3637ms|150:############################## | +------+-----+--------+-------------------------------------------+

yssaya commented 4 years ago

2080Ti x6 ではaobazを2つずつ割り当てて動かしていますが nvidia-smi で見る限りでは 個々のGPUの使用率は70%~92%ぐらいです。クロック数は不明です。 1枚に3つ割り当てればもう少し使用率は上がるかもしれませんが全体として速度が向上するかは 怪しいです。 Windowsで動かされている場合は、aobazeroの bin/ の下の OpenCL.dll を OpenCL_org.dll などと 名前を変更してGPUのドライバをインストール時に配布されるOpenCL.dllを使うように すると速くなるかもしれません。 同じくOpenCLを使うLeelaZeroをLizzieで動かしているとタスクマネージャのGPU使用率は24%なのですが nvidia-smi.exe で見ると97%ぐらいになるので、nvidia-smi.exe で使用率を見る方がいいかもしれません。

lonemonkeywithwhiteshell commented 4 years ago

いろいろ有難うございます。やはり変化しないので、いったん諦めます。開発中のものに期待いたします。