为啥MADDPG这个example在我的电脑用GPU反而比不用GPU还慢？

PaddlePaddle / PARL

A high-performance distributed training framework for Reinforcement Learning

https://parl.readthedocs.io/

Apache License 2.0

3.22k stars 817 forks source link

为啥MADDPG这个example在我的电脑用GPU反而比不用GPU还慢？ #1010

Closed amocken closed 1 year ago

amocken commented 1 year ago

我在程序的开头加上paddle.device.set_device ('cpu')之后，运行速度瞬间达到了原来的2.6倍。原来用时约26分钟，修改之后用时约10分钟。而且内存占用从一千多兆降到了一百多兆😓 我运行的是最新版的example，parl版本是2.1，paddlepaddle版本是2.3.2，win 11 22h2，GPU 是英伟达的MX450，CPU是i7 1165g7，cudatoolkit版本是11.6，cuda版本是12.0 GPU Compute Capability: 7.5, Driver API Version: 12.0, Runtime API Version: 11.6

TomorrowIsAnOtherDay commented 1 year ago

感谢反馈。下周上班了，我找飞桨框架的开发同学一起看下。

amocken commented 1 year ago

感谢反馈。下周上班了，我找飞桨框架的开发同学一起看下。

请问你们那边能复现出这个问题吗？

TomorrowIsAnOtherDay commented 1 year ago

抱歉上周漏了这个信息，我们正在借windows机器测试哈，会尽快反馈的。

TomorrowIsAnOtherDay commented 1 year ago

hello，我们测试了下相关的代码。目前的结论和你是相符的。我们猜测是网络太简单了，GPU相比CPU的计算优势几乎为0，同时，因为GPU还需要把数据从内存加载到显存，这需要额外的时间，导致GPU的耗时更长了。如果想体现GPU的优势，建议你把网络搞得更深层（大）一点。

amocken commented 1 year ago

hello，我们测试了下相关的代码。目前的结论和你是相符的。我们猜测是网络太简单了，GPU相比CPU的计算优势几乎为0，同时，因为GPU还需要把数据从内存加载到显存，这需要额外的时间，导致GPU的耗时更长了。如果想体现GPU的优势，建议你把网络搞得更深层（大）一点。

好的，谢谢