PPO-mujoco 使用python3.6在GPU上训练报错 - Githubissues

PaddlePaddle / PARL

A high-performance distributed training framework for Reinforcement Learning

https://parl.readthedocs.io/

Apache License 2.0

3.25k stars 820 forks source link

PPO-mujoco 使用python3.6在GPU上训练报错 #974

Open USTCKAY opened 1 year ago

USTCKAY commented 1 year ago

python版本：3.6.13 环境：paddlepaddle-gpu 0.0.0.post102 parl 2.0.5 /paddle/PARL gym 0.18.0 mujoco-py 2.1.2.14 numpy 1.19.2 PyYAML 6.0 mujoco版本：210 报错如下： a9f35c3fb59ccecf5386391a29e734ac 似乎是因为缺少numpy.typing，这个模块是在numpy1.20才引入，但numpy1.20开始不支持python3.6了。

TomorrowIsAnOtherDay commented 1 year ago

hello,请问你有尝试py3.7吗？

USTCKAY commented 1 year ago

hello,请问你有尝试py3.7吗？

有尝试，但是精度似乎有点问题，在这个issue里有提到。模型的同学建议我用python3.6或3.8试一试，我试了3.6无法运行。

TomorrowIsAnOtherDay commented 1 year ago

也就是说3.7版本下GPU版本跑多趟的效果，都不如CPU吗？

USTCKAY commented 1 year ago

也就是说3.7版本下GPU版本跑多趟的效果，都不如CPU吗？

是的，我用GPU跑了2次，rewards最后都在1600左右

TomorrowIsAnOtherDay commented 1 year ago

example下提供的实验曲线都是在GPU上收集的，我怀疑是你的paddle-gpu版本安装有问题。你有尝试过在paddle-gpu版本下运行过其他算法的训练吗？（比如CV、NLP）他们的运行结果正常吗？

USTCKAY commented 1 year ago

example下提供的实验曲线都是在GPU上收集的，我怀疑是你的paddle-gpu版本安装有问题。你有尝试过在paddle-gpu版本下运行过其他算法的训练吗？（比如CV、NLP）他们的运行结果正常吗？

跑过PaddleClas的VGG11，精度正常。

TomorrowIsAnOtherDay commented 1 year ago

了解，那我们这边重新测试下代码（GPU+py3.7）。

TomorrowIsAnOtherDay commented 1 year ago

刚问了下团队的同学，目前我们正在升级mujoco环境（统一用deepmind收购后的版本），预计两周内发布新版本的代码。建议先使用CPU版本运行，GPU版本的我们后续也会同步测试效果并发布。

USTCKAY commented 1 year ago

刚问了下团队的同学，目前我们正在升级mujoco环境（统一用deepmind收购后的版本），预计两周内发布新版本的代码。建议先使用CPU版本运行，GPU版本的我们后续也会同步测试效果并发布。

ok，静候佳音