PaddlePaddle / PARL

A high-performance distributed training framework for Reinforcement Learning
https://parl.readthedocs.io/
Apache License 2.0
3.22k stars 816 forks source link

LESSON5中的DDPG,将PyCharm中提示未实现抽象函数的类都实现后,reward一直处于10左右 #1123

Open YYYMarshal opened 10 months ago

YYYMarshal commented 10 months ago

您好,我在学习 examples/tutorials/lesson5/ddpg 这一章节时,用PyCharm打开源码,会提示让 agent.py - Agent,algorithm.py - DDPG,model.py - Model ActorModel CriticModel,这五个类实现其基类的全部抽象函数,然后我分别将相应的函数实现后(函数体都是pass),运行 train.py,最后得到的 test reward 都是10 左右,即使将 TRAIN_EPISODE 调大之后得分也是 10 左右,但是不实现这五个类的全部抽象函数的话,得分是正常的,请问这是为什么呢?