issues
search
yoon-gu
/
ezlab-rl
1
stars
2
forks
source link
SEIAR : reward design
#17
Closed
boyeon-kim
closed
8 months ago
boyeon-kim
commented
9 months ago
learning rate 조절로 수렴 확인
이미 알고 있는 solution과 맞추기 위해 reward design
I와 nu의 weight조절
No reward penalty