refactor attention ppo - Githubissues

reinforcement-learning-kr / Unity_ML_Agents_2.0

Repository for implementing Unity ML-Agents 2.0

75 stars 31 forks source link

refactor attention ppo #53

Closed hyunho1027 closed 1 year ago

hyunho1027 commented 1 year ago

attention ppo 코드 수정하였습니다.

OBS 상수 추가; obs 인덱스별 정보를 명시적으로 알려주기 위함
n_step 수정 5120은 큰 것 같아서 1024로 줄였습니다. 학습 성능에 영향을 주지 않는다면 더 낮출 예정입니다.
네트워크 이름 수정; 네트워크 클래스 이름에 에이전트가 들어가있어 수정하였습니다.
주석 수정
qkv 전처리 함수 사용; 코드 최소화를 위해 전처리 람다함수를 만들었습니다.
clip grad norm제거; 기존 ppo코드와 맞추기 위함