yoon-gu / ezlab-rl

1 stars 2 forks source link

SLIAR : penalty #19

Closed boyeon-kim closed 8 months ago

boyeon-kim commented 8 months ago
  1. Reward design
    • - I - nu ?
    • - I ?
    • nu의 power 정도에 대해 확인
  2. Penalty design
    • cost function + |nu(t) - total| --> 시간에 따라 penalty 정도를 강력하게!
boyeon-kim commented 8 months ago

reward design1 (check)

reward design2 (차이에 따라 차등 penalty)