proximal-policy-optimization Search Results

161 results
for proximal-policy-optimization

Best match

Best match Most commented Newest Recently updated Least commented Oldest Least recently updated

ikostrikov/pytorch-a2c-ppo-acktr-gail #160

max_grad_norm and use_clipped_value_loss

Hello! I was documenting your PPO code `algo/ppo.py` to improve my understanding of the algorithm, and I got confused on `max_grad_norm` and `_use_clipped_value_loss`. If I am understanding this co…

seungjaeryanlee updated 5 years ago
2
tensorforce/tensorforce #533

Terminal state update error

Hi I have declared an agent like this ``` python agent = PPOAgent( states=dict(type='float', shape=(37,)), actions=dict(type='int', num_actions=3), network=[ …

mansilla updated 5 years ago
7
MorvanZhou/Reinforcement-learning-with-tensorflow #61

传统policy gradient是否存在数据关联性问题？

Deep Q-learning方法中，说sample数据之间不是相互独立的，不符合监督学习假设，所以训练时引入经验回放等减弱数据之间关联；那么基础policy gradient方法中，训练actor的数据是不是也存在数据不相互独立的问题？觉得在网上似乎没什么人在pg中讨论这个问题，不知道你怎么看？如果存在，那么PPO的提出（除了可以控制两次更新差别不那么大，网络不崩），其off-pol…

Junshuai-Song updated 5 years ago
10
shareeff/PPO #1

What is the advantage function that you have used ?

shamanez updated 6 years ago
3
apache/mxnet #10563

Suboptimal performance implementing PPO with Adam Optimizer

## Description We noticed our gluon/MXNet [Proximal Policy Optimization](https://arxiv.org/abs/1707.06347) (PPO) implementation is under-performing compared to the OpenAI Baselines version in TensorF…

FoConrad updated 5 years ago
6
tensorforce/tensorforce #398

TRPO failing after a few iterations of training

`I have the following code import gym import numpy as np from tensorforce.agents import PPOAgent from tensorforce.agents import TRPOAgent #from tensorforce import Configuration NUM_GAMES_T…

FitMachineLearning updated 5 years ago
6
MorvanZhou/Reinforcement-learning-with-tensorflow #45

DeepMind涉嫌抄袭你? :)

Distributed Proximal Policy Optimization (DPPO) (Tensorflow)中提到的不让worker计算和更新梯度，而只是传数据（obversaion），让PPO飞起来。你的这个想法也许超前于DeepMind的IMPALA的并行智能体结构(http://i.dataguru.cn/mportal.php?aid=13103&mod=view)。从…

freelogic updated 6 years ago
1
deepchem/deepchem #684

Proximal Policy Optimization

https://blog.openai.com/openai-baselines-ppo/ OpenAI says PPO has become their default RL algorithm. Should we get a PPO implementation going in TensorGraph? CC @peastman

rbharath updated 7 years ago
1
deepchem/deepchem #685

Proximal Policy Optimization

https://blog.openai.com/openai-baselines-ppo/ OpenAI says PPO has become their default RL algorithm. Should we get a PPO implementation going in TensorGraph? CC @peastman

rbharath updated 7 years ago
1
pytorch/pytorch #2598

Upgrading from 0.1.9 to 0.2.0 silently breaks policy gradien…

I was implementing Proximal Policy Optimization when I noticed that my Pytorch version was outdated, so I updated. To my surprise, the code I was running which worked fine in 0.1.9 was completely brok…

hyparxis updated 6 years ago
2

上一页 1...11 12 13 14 15 16 17...17 下一页

161 results for proximal-policy-optimization

161 results
for proximal-policy-optimization