PaddlePaddle PARL issues

PaddlePaddle / PARL

A high-performance distributed training framework for Reinforcement Learning

https://parl.readthedocs.io/

Apache License 2.0

3.22k stars 816 forks source link

issues

Newest

Newest Most commented Recently updated Oldest Least commented Least recently updated

关于DQN的几个疑问

#957 aaaaalun opened 1 year ago
2
请问sarsa在更新Q值的时候，环境还在St，能计算出Q(St+1,at+1)吗？

#956 leshui1991 opened 1 year ago
0
parl14个月没有一丝一毫更新

#955 yuwoyizhan closed 1 year ago
1
AI Studio 运行 DQN例程报错

#954 ilovegaoyuan closed 1 year ago
0
AI Studio 运行 DQN例程报错

#953 ilovegaoyuan opened 1 year ago
4
Sarsa env的函数不全

#952 cunjing56 opened 1 year ago
1
from parl.utils import logger,replay_memory出现错误

#951 wuyukun-tong opened 1 year ago
1
update readme

#950 ShuaibinLi closed 1 year ago
0
xparl unit test fails

#949 ShuaibinLi closed 1 year ago
0
Update the Mujoco version from v1 to v2

#948 ljy2222 closed 1 year ago
0
关于的PPO Mujoco 环境代码的奖励计算疑问？

#947 A5230171 closed 1 year ago
5
fix bug of train.py of torch_td3

#946 ShuaibinLi closed 1 year ago
0
并行接口不支持gbk

#945 Wu-Jiayang closed 1 year ago
8
关于PARL分布式

#944 supersglzc opened 1 year ago
1
PPO输出动作归一化

#943 yufeng-Lu520 opened 1 year ago
2
MADDPG-paddle sample/predict action

#942 ShuaibinLi closed 1 year ago
0
tipc for npu

#941 Aganlengzi closed 1 year ago
0
MADDPG-torch sample/predict action

#940 ShuaibinLi closed 1 year ago
0
Paddle based ppo

#939 ShuaibinLi closed 1 year ago
0
模块集成还不是很完整

#938 johnjim0816 opened 1 year ago
7
Torch ppo

#937 ShuaibinLi closed 1 year ago
0
MetaGym 能支持不

#936 monkeycc closed 1 year ago
1
为什么用GPU版本的paddle跑科科老师的DQN和DDPG案例时，test reward一直处于比较低的值？

#935 OutSpace00 closed 2 years ago
1
为什么我用cpu版本paddle运行科科老师的案例没问题，但是用gpu版本的话，奖励值一直处于比较低的值，这是为什么

#934 OutSpace00 closed 1 year ago
13
请问这个错误该如何处理（新手，求详细）

#933 QIU1015 closed 2 years ago
1
我用算法训练时出现Unhandled exception in thread started by Error in sys.excepthook:

#932 djjstyle closed 1 year ago
6
Update paddle version

#931 ShuaibinLi closed 2 years ago
0
Mujoco version

#930 ShuaibinLi closed 1 year ago
2
Cannot use GPU because you have installed CPU version PaddlePaddle.

#929 shangguanwaner-hub opened 2 years ago
3
PPO 通过修改配置降低显存占用

#928 Aganlengzi closed 2 years ago
3
add agent.train()/eval()

#927 ShuaibinLi closed 2 years ago
0
add impala algorithm in paddle

#926 zenghsh3 closed 1 year ago
2
在dqn中terminal==True的时候感觉应该不需要再跑一次网络的，会造成没用的运算

#925 tangmingkai closed 1 year ago
7
update doc

#924 rical730 closed 1 year ago
0
强化学习营第3节DQN训练报错要求安装paddlepaddle 1.6.3

#923 libxing closed 2 years ago
2
release v2.0.5

#922 zenghsh3 closed 2 years ago
0
release v2.0.5

#921 zenghsh3 closed 2 years ago
1
MADDPG集中式训练，分布式执行

#920 MrAlaskan closed 2 years ago
4
请问在实现 Actor-Critic算法的时候，有过将网络层共享的案例嘛

#919 A5230171 opened 2 years ago
2
请问单序列问题能用强化学习解决吗？

#918 styledyy closed 2 years ago
2
aistudio安装parl，然后导入失败

#917 w5688414 closed 2 years ago
1
如果强化学习中的每轮只有一个状态输入，即初始状态，算法是否能根据不同的状态得到不同状态下最优的动作？

#916 styledyy closed 2 years ago
1
在训练和验证时如何如何设置model.train()和model.eval()

#915 tangmingkai closed 2 years ago
2
DDPG算法是否有静态图推理的过程

#914 w5688414 closed 2 years ago
3
请问强化学习算法的初始状态都是固定的吗？

#913 styledyy closed 2 years ago
4
关于paddle奖励设置问题

#912 young-shy closed 2 years ago
3
建议再提供一个动态调整温度系数的SAC版本

#911 amocken closed 2 years ago
2
paddle，parl的版本问题？

#910 LHTLiu closed 2 years ago
9
关于DDPG价值网络与策略网络更新顺序问题

#909 young-shy closed 2 years ago
4
这里第2个log_prob似乎跟第1个log_prob毫无关系

#908 amocken closed 2 years ago
2

Previous Next