Open dy0802 opened 3 years ago
우선, 강화학습을 공부하는 학생 입장으로서, 이 책으로 실습할 수 있는 기회를 주셔서 정말 감사드립니다.
중간중간에 많은 매수와 매도는 거래세와 수수료 등의 이유로 좋지 못하다고 되어있는데,
여기에서 거래세와 수수료 계산이 어느정도 Reward Function에 부정적인 영향을 미치긴 하겠지만 여기서 그치지 않고,
예를 들어, [매수횟수 + 매도횟수] (-1) + 관망횟수 1 등을 Reward Function에 추가하면 성능에 개선이 있을까요?
@dy0802 네 적당히 window를 정해서 그 안에서의 매수/매도/관망 수를 반영해 보면 의미있을 것 같습니다.
우선, 강화학습을 공부하는 학생 입장으로서, 이 책으로 실습할 수 있는 기회를 주셔서 정말 감사드립니다.
중간중간에 많은 매수와 매도는 거래세와 수수료 등의 이유로 좋지 못하다고 되어있는데,
여기에서 거래세와 수수료 계산이 어느정도 Reward Function에 부정적인 영향을 미치긴 하겠지만 여기서 그치지 않고,
예를 들어, [매수횟수 + 매도횟수] (-1) + 관망횟수 1 등을 Reward Function에 추가하면 성능에 개선이 있을까요?