Closed mashimashica closed 2 years ago
参考までに 見つけるのが遅くなって申し訳ないのですが,Learning to Ground Multi-Agent Communication with Autoencodersという論文がGridゲーム環境を用いたマルチエージェントの実験を行っており,実装がしかも公開されていました. GitHub : https://github.com/ToruOwO/marl-ae-comm ここ にfind-goal(Grid上のゴールを見つけるゲーム)による実験が実装されています. 以下のライブラリが使用されているようです
上記、ありがとうございます。 Language World Modelsは、やはり、Multi-AgentとAutoencoderとで、画像データをやり取りするイメージでおります。 以前、深層強化学習の最終課題に、対話の強化学習を選んだのですが、この時よりも、画像データのやり取りにおけるlanguageということで、かんねんしたという感じです。 昨年の人工知能学会の世界モデルで、自然言語処よりの論文で、数理論理学のような概念的なアプローチとも違うので、上記のURLで慣れてゆきたいと思います。
こちら早めに完了させたいです
現状の認識では、MarlGridで対応できると考えている。 OpenAIGym>MarlGrid https://github.com/kandouss/marlgrid/blob/master/marlgrid/envs/cluttered.py
Have done. 既存のゲーム環境を調査 Pre-built environment https://github.com/kandouss/marlgrid/blob/master/marlgrid/envs/cluttered.py →OpenAI GymとUnityにおけるゲーム環境の位置づけを概観
Next Action. 要件定義: -色を付ける: 緑と青 -値の受け渡し -Unityでやるか、見た目
以上
こちら,無事マージされたようなのでクローズします
要件定義 ・グリッドのマップを行列データで返す ・エージェントの近傍1セルの情報を1次元配列で返す ・旗が緑 ・エージェントが青