issues
search
nissymori
/
JAX-CORL
Clean single-file implementation of offline RL algorithms in JAX
MIT License
97
stars
2
forks
source link
[TD7] fix initializer
#80
Closed
nissymori
closed
4 months ago
nissymori
commented
4 months ago
77
nissymori
commented
4 months ago
He initialization:
https://wandb.ai/nissymori/td7-report?nw=nwusernissymori
あんまり良くない
jax-baselineのTD7の実装:
https://github.com/tinker495/jax-baseline/blob/6979775ab96abd88d03f89d176923779e6fb9e84/model_builder/flax/dpg/td7_builder.py#L63
最終層だけuniform謎いが試している
nissymori
commented
4 months ago
全然オリジナルでレポートされている水準には届いていない...
77