linyiLYi / snake-ai

An AI agent that beats the classic game "Snake".
Apache License 2.0
1.59k stars 352 forks source link

分享训练时候的 memory, cpu, gpu 信息 #4

Open Dreamgoing opened 1 year ago

Dreamgoing commented 1 year ago

非常赞的project!我可以在本地test,但是train的时候,memory和cpu oom了。作者可否分享一下cpu和memory的信息

lang07123 commented 1 year ago

图片

瞎点..不知道对不对..你可以参考一下...

Dreamgoing commented 1 year ago

谢谢

lang07123 commented 1 year ago

CPU: I5-10400 内存: 32G内存 显卡: RTX2060 6G sata SSD

图片 跑了15个小时跟作者5个小时差不多......

pangyouzhen commented 1 year ago

@lang07123 我用linux 服务器训练的,设置SDL_VIDEODRIVER='dummy',16C128G,GPU利用率周期性0-28%,env=64,batch_size=1024, 到50M时候也15个小时。。。

pangyouzhen commented 1 year ago

找到一个文档多进程训练,https://colab.research.google.com/github/Stable-Baselines-Team/rl-colab-notebooks/blob/sb3/multiprocessing_rl.ipynb#scrollTo=xDHLMA6NFk95 多进程训练

lang07123 commented 1 year ago

@lang07123 我用linux 服务器训练的,设置SDL_VIDEODRIVER='dummy',16C128G,GPU利用率周期性0-28%,env=64,batch_size=1024, 到50M时候也15个小时。。。

我刚才用M2 的 macbook pro 测试了一下.... 大概是RTX 2060 的两倍...但是热的烫手..舍不得了....

lang07123 commented 1 year ago

@lang07123 我用linux 服务器训练的,设置SDL_VIDEODRIVER='dummy',16C128G,GPU利用率周期性0-28%,env=64,batch_size=1024, 到50M时候也15个小时。。。

那你的估计还可以加操作... 我的2060 基本上100%了..也就是这个速度了...

pangyouzhen commented 1 year ago

@lang07123 发现linux服务器不行,提高env和batch_size效果也一般,如果看进程的话,CPU应该只占用了1核,GPU周期性波动,linux服务器根本发挥不出优势,也不知道咋改了

sjgfa commented 1 year ago

CPU: I5-10400 内存: 32G内存 显卡: RTX2060 6G sata SSD

图片 跑了15个小时跟作者5个小时差不多......

作者用的是4090,我用4090和作者的速率差不多