fxnnxc / MessageEfficientMARL

0 stars 0 forks source link

MessageEfficientMARL

실험 개요

본 실험에서는 두 가지 에이전트(MAAF와 MEMAAF)를 대상으로 다양한 환경에서 학습 성능을 비교했습니다. MEMAAF 방식은 MAAF 방식에 Vector Quantization Representation을 추가하여 개선된 구조를 적용하였으며, 이를 통해 학습 성능을 평가하고자 했습니다. 실험의 주요 목표는 두 방식의 성능 차이를 분석하는 것이었으며, 특히 학습 지속 시 성능 저하 양상과 학습을 중단해야 하는 시점에 대한 분석이 포함됩니다.

실험 세팅

실험 결과

Spread V3 Tag V3 Tag V4
img img img

1. 학습 성능 비교

2. 학습 지속 시 성능 저하

3. Optimal State에서 학습 중단의 필요성

결론

이번 실험을 통해 MEMAAF 방식이 MAAF 방식과 비슷한 성능을 보였으며, 학습을 지속할 경우 두 방식 모두 성능이 저하될 수 있음을 확인했습니다. 특히, 학습 성능을 유지하기 위해서는 Optimal state에서 학습을 중단하는 것이 중요한 전략으로 고려되어야 합니다. MEMAAF 방식의 Vector Quantization Representation 적용이 큰 성능 향상을 제공하지 않았다는 점 또한 이번 실험에서 주목할 만한 결과였습니다.