Open grooviiee opened 1 year ago
논문에 맞는 reward를 구현했는데, divided by zero가 자꾸 튀어나온다.
distance값이 0이라서 그럴까?
R_T_back 부분 계산 중
논문에 맞는 reward를 구현했는데, divided by zero가 자꾸 튀어나온다.
distance값이 0이라서 그럴까?