안녕하세요 강화학습을 공부하고 있는 학생입니다!
먼저 SMAC 환경을 윈도우에서도 문제없이 사용하게 정리해주셔서 감사합니다.
다름이 아니고 기존 MAVEN의 parallel_runner에는 noise_distrib이라는 변수로 latent variable을 관리한 것 같은데, 이 환경의 parallel_runner에는 noise_distrib 이라는 변수가 삭제되고 reinforce_hierarchical의 EZ_agent 클래스도 사용하지 않습니다.
제가 알기로는 MAVEN에서는 이 EZ_agent를 noise_distrib이라는 변수로 받아서 latent variable을 관리하는 것으로 알고 있는데, 혹시 이 환경에서는 다른 방식으로 관리를 하는지 궁금해서 여쭤봅니다.
안녕하세요 강화학습을 공부하고 있는 학생입니다! 먼저 SMAC 환경을 윈도우에서도 문제없이 사용하게 정리해주셔서 감사합니다.
다름이 아니고 기존 MAVEN의 parallel_runner에는 noise_distrib이라는 변수로 latent variable을 관리한 것 같은데, 이 환경의 parallel_runner에는 noise_distrib 이라는 변수가 삭제되고 reinforce_hierarchical의 EZ_agent 클래스도 사용하지 않습니다. 제가 알기로는 MAVEN에서는 이 EZ_agent를 noise_distrib이라는 변수로 받아서 latent variable을 관리하는 것으로 알고 있는데, 혹시 이 환경에서는 다른 방식으로 관리를 하는지 궁금해서 여쭤봅니다.