issues
search
reinforcement-learning-kr
/
Unity_ML_Agents_2.0
Repository for implementing Unity ML-Agents 2.0
75
stars
31
forks
source link
refactor attention ppo
#53
Closed
hyunho1027
closed
1 year ago
hyunho1027
commented
1 year ago
attention ppo 코드 수정하였습니다.
OBS 상수 추가; obs 인덱스별 정보를 명시적으로 알려주기 위함
n_step 수정 5120은 큰 것 같아서 1024로 줄였습니다. 학습 성능에 영향을 주지 않는다면 더 낮출 예정입니다.
네트워크 이름 수정; 네트워크 클래스 이름에 에이전트가 들어가있어 수정하였습니다.
주석 수정
qkv 전처리 함수 사용; 코드 최소화를 위해 전처리 람다함수를 만들었습니다.
clip grad norm제거; 기존 ppo코드와 맞추기 위함
attention ppo 코드 수정하였습니다.