PaddlePaddle / PARL

A high-performance distributed training framework for Reinforcement Learning
https://parl.readthedocs.io/
Apache License 2.0
3.25k stars 820 forks source link

PPO-mujoco 使用python3.6在GPU上训练报错 #974

Open USTCKAY opened 1 year ago

USTCKAY commented 1 year ago

python版本:3.6.13 环境:paddlepaddle-gpu 0.0.0.post102 parl 2.0.5 /paddle/PARL gym 0.18.0 mujoco-py 2.1.2.14 numpy 1.19.2 PyYAML 6.0 mujoco版本:210 报错如下: a9f35c3fb59ccecf5386391a29e734ac 似乎是因为缺少numpy.typing,这个模块是在numpy1.20才引入,但numpy1.20开始不支持python3.6了。

TomorrowIsAnOtherDay commented 1 year ago

hello,请问你有尝试py3.7吗?

USTCKAY commented 1 year ago

hello,请问你有尝试py3.7吗?

有尝试,但是精度似乎有点问题,在这个issue里有提到。模型的同学建议我用python3.6或3.8试一试,我试了3.6无法运行。

TomorrowIsAnOtherDay commented 1 year ago

也就是说3.7版本下GPU版本跑多趟的效果,都不如CPU吗?

USTCKAY commented 1 year ago

也就是说3.7版本下GPU版本跑多趟的效果,都不如CPU吗?

是的,我用GPU跑了2次,rewards最后都在1600左右

TomorrowIsAnOtherDay commented 1 year ago

example下提供的实验曲线都是在GPU上收集的,我怀疑是你的paddle-gpu版本安装有问题。 你有尝试过在paddle-gpu版本下运行过其他算法的训练吗?(比如CV、NLP)他们的运行结果正常吗?

USTCKAY commented 1 year ago

example下提供的实验曲线都是在GPU上收集的,我怀疑是你的paddle-gpu版本安装有问题。 你有尝试过在paddle-gpu版本下运行过其他算法的训练吗?(比如CV、NLP)他们的运行结果正常吗?

跑过PaddleClas的VGG11,精度正常。

TomorrowIsAnOtherDay commented 1 year ago

了解,那我们这边重新测试下代码(GPU+py3.7)。

TomorrowIsAnOtherDay commented 1 year ago

刚问了下团队的同学,目前我们正在升级mujoco环境(统一用deepmind收购后的版本),预计两周内发布新版本的代码。建议先使用CPU版本运行,GPU版本的我们后续也会同步测试效果并发布。

USTCKAY commented 1 year ago

刚问了下团队的同学,目前我们正在升级mujoco环境(统一用deepmind收购后的版本),预计两周内发布新版本的代码。建议先使用CPU版本运行,GPU版本的我们后续也会同步测试效果并发布。

ok,静候佳音