-
Hi, I've been trying to replicate some of your results and compare against Reptile, for the reinforcement learning case. Specifically, I'm trying to run the point mass experiments.
After installing…
-
```
В файле задание на второй релиз.
Пожалуйста, задавайте вопросы, если что
непонятно или с Вашей точки зрения может
иметь различное толкование.
И.Г.
```
Original issue reported on code.google.co…
-
I want to use raw image observations, so I am trying to call the _read_pixels_as_in_window(self) in mjviewer.py. However, getting this error:
```
LD_PRELOAD=/usr/lib/x86_64-linux-gnu/libGLEW.so:/u…
-
See https://github.com/pytorch/pytorch/issues/975 for more info
PyTorch TRPO appears 50% slower than TF. Not sure about PPO, but I expect the wall-clock time gap will be the same.
To fix this is…
-
```
В файле задание на второй релиз.
Пожалуйста, задавайте вопросы, если что
непонятно или с Вашей точки зрения может
иметь различное толкование.
И.Г.
```
Original issue reported on code.google.co…
-
```
В файле задание на второй релиз.
Пожалуйста, задавайте вопросы, если что
непонятно или с Вашей точки зрения может
иметь различное толкование.
И.Г.
```
Original issue reported on code.google.co…
-
Hi, I try to run the code. Last day, I success. But today I meet a strange problem.
I don't modify any code, just use setup_mujoco.sh script from [](https://github.com/rll/rllab/blob/master/scripts/s…
-
Thank you for the wonderful tool.
(1) I was able to complete training using Cartpole expert data and GAIL.
(2) Next, I added a wrapper to Cartpole to discretize observations and was able to comple…
-
## 一言でいうと
On-Policyの実装で論文に書かれていない実装やパラメーターの影響を調べた研究。組み合わせの数は膨大なので候補は絞り込んでいる。損失関数はPPO、最終レイヤは重みを1/100にしてsoftplusの後マイナス方向スライドしたほうがいい、など細かすぎるテクニックが紹介されている
### 論文リンク
https://arxiv.org/abs/2006.059…
-