SEIAR : reward design - Githubissues

yoon-gu / ezlab-rl

1 stars 2 forks source link

SEIAR : reward design #17

Closed boyeon-kim closed 8 months ago

boyeon-kim commented 9 months ago

learning rate 조절로 수렴 확인
이미 알고 있는 solution과 맞추기 위해 reward design
I와 nu의 weight조절
No reward penalty